Connect with us

Kunstig intelligens

Llama 3.1: Metas mest avanserte åpne kildekode AI-modell – Alt du trenger å vite

mm

Meta har lansert Llama 3.1, sin nyeste og mest avanserte store språkmodell, og markerer et betydelig sprang i AI-egenskaper og tilgjengelighet. Denne nye utgaven er i tråd med Metas forpliktelse til å gjøre AI åpent tilgjengelig, som er understreket av Mark Zuckerberg, som mener at åpen kildekode AI er fordelerikt for utviklere, Meta og samfunnet som helhet.

For å introdusere Llama 3.1, skrev Mark Zuckerberg en detaljert blogginnlegg med tittelen “Open Source AI Is the Path Forward“, hvor han presenterer sin visjon for fremtiden til AI. Han trekker en parallell mellom utviklingen av Unix til Linux og den nåværende utviklingen av AI, og understreker at åpen kildekode AI til slutt vil lede industrien. Zuckerberg fremhever fordelenene med åpen kildekode AI, inkludert tilpasning, kostnadseffektivitet, datasikkerhet og unngåelse av leverandør-lås.

Han mener at åpen kildekode-utvikling fremmer innovasjon, skaper en robust økosystem og sikrer like tilgang til AI-teknologi. Zuckerberg tar også opp bekymringer om sikkerhet og fremhever at åpen kildekode AI, gjennom åpenhet og samfunnsundersøkelse, kan være tryggere enn lukkede modeller som OpenAI’s GPT-modeller.

Metas forpliktelse til åpen kildekode AI har som mål å bygge de beste erfaringene og tjenestene, fritt fra begrensningene i lukkede økosystemer. Han avslutter med å invitere utviklere og organisasjoner til å delta i å bygge en fremtid hvor AI fordeler alle, og fremmer samarbeid og kontinuerlig fremgang.

Nøkkel punkter

  • Åpen tilgjengelighet: Meta fortsetter sin forpliktelse til åpen kildekode AI, med mål om å demokratisere tilgang og innovasjon.
  • Forbedrede egenskaper: Llama 3.1 har en kontekstlengde på 128K, støtter åtte språk og introduserer Llama 3.1 405B, den første åpne kildekode AI-modellen på frontlinjen.
  • Ubetinget fleksibilitet og kontroll: Llama 3.1 405B tilbyr toppmoderne egenskaper som er sammenlignbare med ledende lukkede kildekode-modeller, og muliggjør nye arbeidsflyter som syntetisk data-generering og modell-destillasjon.
  • Komprehensivt økosystem-støtte: Med over 25 partnere, inkludert store teknologiselskaper som AWS, NVIDIA og Google Cloud, er Llama 3.1 klar for umiddelbar bruk på ulike plattformer.

Llama 3.1 Oversikt

Toppmoderne egenskaper

Llama 3.1 405B er designet for å konkurrere med de beste AI-modellene som er tilgjengelige i dag. Den excellerer i generell kunnskap, styrbare, matematikk, verktøybruk og flerspråklig oversettelse. Denne modellen forventes å drive innovasjon i felt som syntetisk data-generering og modell-destillasjon, og tilbyr utenforliggende muligheter for vekst og utforsking.

Oppgraderte modeller

Utgviren inkluderer forbedrede versjoner av 8B- og 70B-modellene, som nå støtter flere språk og har forlengede kontekstlengder på opptil 128K. Disse forbedringene muliggjør avanserte applikasjoner som langform tekst-sammendrag, flerspråklige samtale-agenter og kodehjelpere.

Åpen kildekode tilgjengelighet

I tråd med sin åpne kildekode-filosofi, gjør Meta disse modellene tilgjengelige for nedlasting på Meta og Hugging Face. Utviklere kan bruke disse modellene til en rekke applikasjoner, inkludert forbedring av andre modeller, og kan kjøre dem i diverse miljøer, fra på stedet til sky og lokale utviklinger.

Modell-evalueringer og arkitektur

Omfattende evalueringer

Llama 3.1 ble grundig testet på over 150 benchmark-datasett i flere språk og sammenlignet med ledende modeller som GPT-4 og Claude 3.5 Sonnet. Resultatene viser at Llama 3.1 er konkurrerende på en rekke oppgaver, og befester sin plass blant toppmoderne AI-modeller.

Avanserte treningsteknikker

Treningen av 405B-modellen involverte prosessering av over 15 billioner token med mer enn 16 000 H100-GPUer. Meta adopterte en standard dekoder-bare transformer-modell med iterative post-trening-prosedyrer, inkludert overvåket finjustering og direkte preferanse-optimisering, for å oppnå høykvalitets syntetisk data og overlegen ytelse.

Effektiv inferens

For å støtte stor-skala produksjons-inferens, ble Llama 3.1-modellene kvantisert fra 16-bit til 8-bit numerikk, og reduserte dermed beregningskravene og muliggjorde at modellen kunne kjøres effektivt på en enkelt server-node.

Instruksjon og chat-finjustering

Meta fokuserte på å forbedre modellens evne til å følge detaljerte instruksjoner og opprettholde høye sikkerhetsnivåer. Dette involverte flere runder med justering på toppen av den forhånds-trente modellen, med bruk av syntetisk data-generering og strenge data-prosesserings-teknikker for å sikre høykvalitets-utdata over alle evner.

Llama-systemet

Llama 3.1 er en del av et større system designet for å fungere med ulike komponenter, inkludert eksterne verktøy. Meta har som mål å gi utviklere muligheten til å skape tilpassede applikasjoner og atferd. Utgivelsen inkluderer Llama Guard 3 og Prompt Guard for forbedret sikkerhet og trygghet.

Llama Stack API

Meta er i ferd med å utgi en kommentar til Llama Stack API, et standard-grensesnitt for å lette bruken av Llama-modeller av tredjeparts-prosjekter. Denne initiativet har som mål å strømlinje-interoperabilitet og redusere barrierer for utviklere og plattform-tilbydere.

Bygging med Llama 3.1 405B

Llama 3.1 405B tilbyr omfattende muligheter for utviklere, inkludert sanntids- og batch-inferens, overvåket finjustering, modell-evaluering, kontinuerlig for-trening, retrieval-augmented generering (RAG), funksjonskall og syntetisk data-generering. På dag én kan utviklere begynne å bygge med disse avanserte funksjonene, støttet av partnere som AWS, NVIDIA og Databricks.

Prøv Llama 3.1 i dag

Llama 3.1-modellene er tilgjengelige for nedlasting og umiddelbar utvikling. Meta oppmuntrer samfunnet til å utforske mulighetene i disse modellene og bidra til det voksende økosystemet. Med robuste sikkerhetsforanstaltninger og åpen kildekode-tilgang, er Llama 3.1 klar til å drive den neste bølgen av AI-innovasjon.

Konklusjon

Llama 3.1 representerer et betydelig milepæl i utviklingen av åpen kildekode AI, og tilbyr ubetinget egenskaper og fleksibilitet. Metas forpliktelse til åpen tilgjengelighet sikrer at flere mennesker kan dra nytte av AI-fremgang, og fremmer innovasjon og likeverdig teknologi-utbredelse. Med Llama 3.1 er mulighetene for nye applikasjoner og forskning enorme, og Meta ser frem til de banebrytende utviklingene som samfunnet vil oppnå med dette kraftfulle verktøyet.

Lesere som ønsker å lære mer, bør lese Mark Zuckerbergs detaljerte blogginnlegg.

Antoine er en visjonær leder og grunnleggende partner i Unite.AI, drevet av en urokkelig lidenskap for å forme og fremme fremtiden for AI og robotikk. En seriegründer, han tror at AI vil være like disruptiv for samfunnet som elektrisitet, og blir ofte tatt i å tale om potensialet for disruptiv teknologi og AGI.
Som en futurist, er han dedikert til å utforske hvordan disse innovasjonene vil forme vår verden. I tillegg er han grunnleggeren av Securities.io, en plattform som fokuserer på å investere i banebrytende teknologier som omdefinerer fremtiden og omformer hele sektorer.