Connect with us

Llama 3.1: Metas mest avancerede open-source AI-model – Alt, du behøver at vide

Kunstig intelligens

Llama 3.1: Metas mest avancerede open-source AI-model – Alt, du behøver at vide

mm

Meta har præsenteret Llama 3.1, deres seneste og mest avancerede store sprogmodel, som markerer et betydeligt spring i AI-kapaciteter og tilgængelighed. Denne nye udgave er i tråd med Metas engagement i at gøre AI åbent tilgængelig, som understreges af Mark Zuckerberg, der mener, at open-source AI er fordelagtigt for udviklere, Meta og samfundet som helhed.

Til at introducere Llama 3.1 skrev Mark Zuckerberg en detaljeret blogindlæg med titlen “Open Source AI Is the Path Forward“, hvor han fremstiller sin vision for AI’s fremtid. Han tegner en parallel mellem udviklingen fra Unix til Linux og den nuværende udvikling i AI, og understreger, at open-source AI ultimativt vil føre branchen. Zuckerberg fremhæver fordelene ved open-source AI, herunder tilpasning, omkostningseffektivitet, datasikkerhed og undgåelse af vendor-lås.

Han mener, at open-source-udvikling fremmer innovation, skaber en robust økosystem og sikrer retfærdig adgang til AI-teknologi. Zuckerberg behandler også bekymringer om sikkerhed og fremhæver, at open-source AI gennem transparens og fællesskabsundersøgelser kan være sikrere end lukkede modeller som OpenAI’s GPT-modeller.

Metas engagement i open-source AI har til formål at opbygge de bedste oplevelser og tjenester, fri for begrænsninger i lukkede økosystemer. Han afslutter med at invitere udviklere og organisationer til at deltage i opbygningen af en fremtid, hvor AI kan gavne alle, og fremmer samarbejde og kontinuerlig fremgang.

Nøglepunkter

  • Åben tilgængelighedsengagement: Meta fortsætter sit engagement i open-source AI med det formål at demokratisere adgang og innovation.
  • Forbedrede kapaciteter: Llama 3.1 kan præstere en kontekstlængde på 128K, understøtter otte sprog og introducerer Llama 3.1 405B, den første frontmodell for open-source AI.
  • Ubegrænset fleksibilitet og kontrol: Llama 3.1 405B tilbyder state-of-the-art-kapaciteter, der er sammenlignelige med førende lukkede modeller, og muliggør nye arbejdsprocesser som syntetisk data-generering og model-destillation.
  • Komplet økosystem-understøttelse: Med over 25 partnere, herunder store teknologivirksomheder som AWS, NVIDIA og Google Cloud, er Llama 3.1 klar til umiddelbar brug på tværs af forskellige platforme.

Llama 3.1 Oversigt

State-of-the-art-kapaciteter

Llama 3.1 405B er designet til at kunne konkurrere med de bedste AI-modeller, der i dag er tilgængelige. Den excellerer i generel viden, styrebarhed, matematik, værktøjsbrug og flersproget oversættelse. Denne model forventes at drive innovation i områder som syntetisk data-generering og model-destillation, og tilbyder hidtil usete muligheder for vækst og udforskning.

Opgraderede modeller

Udgivelsen inkluderer forbedrede versioner af 8B- og 70B-modellerne, der nu understøtter multiple sprog og har forlængede kontekstlængder på op til 128K. Disse forbedringer muliggør avancerede anvendelser som langformstekst-sammenfatning, flersprogede samtale-agenter og kode-assistenter.

Open-source-tilgængelighed

I overensstemmelse med sin open-source-filosofi gjort Meta disse modeller tilgængelige for download på Meta og Hugging Face. Udviklere kan anvende disse modeller til en række formål, herunder forbedring af andre modeller, og kan køre dem i forskellige miljøer, fra lokale installationer til sky og lokale installationer.

Model-evalueringer og arkitektur

Omfattende evalueringer

Llama 3.1 blev omfattende testet på over 150 benchmark-datasets i multiple sprog og sammenlignet med førende modeller som GPT-4 og Claude 3.5 Sonnet. Resultaterne viser, at Llama 3.1 er konkurrencedygtig på tværs af en bred vifte af opgaver, og cementerer dens plads blandt topmodellerne.

Avancerede træningsmetoder

Træning af 405B-modellen involverede behandling af over 15 billioner tokens ved hjælp af mere end 16.000 H100-GPU’er. Meta anvendte en standard decoder-kun transformer-model med iterative post-træningsprocedurer, herunder overvåget finjustering og direkte præference-optimering, for at opnå højkvalitets syntetisk data og overlegen præstation.

Effektiv inferens

For at understøtte storstilets produktionsinferens blev Llama 3.1-modellerne kvantificeret fra 16-bit til 8-bit-numre, hvilket reducerer beregningskravene og tillader, at modellen kan køre effektivt på en enkelt servernode.

Instruktions- og chat-finjustering

Meta fokuserede på at forbedre modellens evne til at følge detaljerede instruktioner og opretholde høje niveauer af sikkerhed. Dette involverede flere runder af justering på toppen af den fortrænede model, ved hjælp af syntetisk data-generering og omfattende data-behandlingsteknikker for at sikre højkvalitets-udgangspunkter på tværs af alle kapaciteter.

Llama-systemet

Llama 3.1 er en del af et bredere system, der er designet til at arbejde med forskellige komponenter, herunder eksterne værktøjer. Meta har til formål at give udviklere fleksibiliteten til at opbygge brugerdefinerede anvendelser og adfærd. Udgivelsen inkluderer Llama Guard 3 og Prompt Guard for forbedret sikkerhed og sikkerhed.

Llama Stack API

Meta udgiver en anmodning om kommentar til Llama Stack API, en standardgrænseflade til at lette brugen af Llama-modeller af tredjepartsprojekter. Denne initiativ har til formål at strømline samarbejdets og reducere barrierer for udviklere og platform-udbydere.

Opbygning med Llama 3.1 405B

Llama 3.1 405B tilbyder omfattende kapaciteter for udviklere, herunder realtids- og batch-inferens, overvåget finjustering, model-evaluering, kontinuerlig pre-træning, retrieval-augmented generation (RAG), funktionsanrop og syntetisk data-generering. Allerede på første dag kan udviklere begynde at bygge med disse avancerede funktioner, understøttet af partnere som AWS, NVIDIA og Databricks.

Prøv Llama 3.1 i dag

Llama 3.1-modeller er tilgængelige for download og umiddelbar udvikling. Meta opfordrer fællesskabet til at udforske potentialet i disse modeller og bidrage til den voksende økosystem. Med robuste sikkerhedsforanstaltninger og open-source-adgang er Llama 3.1 klar til at drive den næste bølge af AI-innovation.

Konklusion

Llama 3.1 repræsenterer et betydeligt milepæl i udviklingen af open-source AI, og tilbyder ubegrænsede kapaciteter og fleksibilitet. Metas engagement i åben tilgængelighed sikrer, at flere mennesker kan drage fordel af AI-fremgang, og fremmer innovation og retfærdig teknologi-udvikling. Med Llama 3.1 er mulighederne for nye anvendelser og forskning enorme, og Meta ser frem til de banebrydende udviklinger, som fællesskabet vil opnå med dette kraftfulde værktøj.

Læsere, der ønsker at lære mere, kan læse Mark Zuckerbergs detaljerede blogindlæg.

Antoine er en visionær leder og medstifter af Unite.AI, drevet af en urokkelig passion for at forme og fremme fremtiden for AI og robotteknologi. En serieiværksætter, han tror, at AI vil være lige så omvæltende for samfundet som elektricitet, og bliver ofte fanget i at tale begejstret om potentialet for omvæltende teknologier og AGI.

Som en futurist, er han dedikeret til at udforske, hvordan disse innovationer vil forme vores verden. Derudover er han grundlægger af Securities.io, en platform, der fokuserer på at investere i skærende teknologier, der gendefinerer fremtiden og omformer hele sektorer.