Kunstmatige intelligentie

Alles wat je moet weten over Llama 3 | Meest krachtige open-source model tot nu toe | Concepten tot gebruik

Gepubliceerd op 24 april 2024

Bijgewerkt op 21 mei 2026

Door

Aayush Mittal Mittal

Meta Llama 3 open source LLM OUTPERFORM GPT 4

Meta heeft onlangs Llama 3 uitgebracht, de volgende generatie van zijn state-of-the-art open source large language model (LLM). Gebouwd op de fundamenten die zijn voorganger heeft gelegd, heeft Llama 3 als doel om de mogelijkheden te verbeteren die Llama 2 hebben gepositioneerd als een significante open-source concurrent van ChatGPT, zoals uitgelegd in de uitgebreide review in het artikel Llama 2: Een diepe duik in de open-source uitdager van ChatGPT.

In dit artikel zullen we de kernconcepten achter Llama 3 bespreken, de innovatieve architectuur en trainingsproces verkennen en praktische richtlijnen bieden over hoe toegang te krijgen, te gebruiken en verantwoordelijk Llama 3 in te zetten. Of je nu een onderzoeker bent die de grenzen van natuurlijke taalverwerking verlegt, een ontwikkelaar die de volgende generatie intelligente toepassingen bouwt, of een AI-enthusiast die geïnteresseerd is in de laatste ontwikkelingen, deze post zal je voorzien van de kennis en middelen die je nodig hebt om de kracht van Llama 3 te benutten voor je projecten en toepassingen.

De evolutie van Llama: van Llama 2 tot Llama 3

Meta’s CEO, Mark Zuckerberg, heeft aangekondigd de lancering van Llama 3, het laatste AI-model ontwikkeld door Meta AI. Dit state-of-the-art model, nu open-source, is bedoeld om Meta’s verschillende producten te verbeteren, waaronder Messenger en Instagram. Zuckerberg benadrukte dat Llama 3 Meta AI positioneert als de meest geavanceerde vrij beschikbare AI-assistent.

Voordat we ingaan op de specificaties van Llama 3, laten we eerst even terugkijken naar zijn voorganger, Llama 2. In 2022 geïntroduceerd, was Llama 2 een belangrijke mijlpaal in het open-source LLM-landschap, met een krachtig en efficiënt model dat kon worden uitgevoerd op consumentenhardware.

Toch had Llama 2 zijn beperkingen. Gebruikers meldden problemen met valse weigeringen (het model weigerde om onschuldige prompts te beantwoorden), beperkte bruikbaarheid en ruimte voor verbetering op gebieden zoals redeneren en codegeneratie.

Enter Llama 3: Meta’s reactie op deze uitdagingen en de feedback van de gemeenschap. Met Llama 3 heeft Meta als doel om de beste open-source modellen te bouwen die gelijkwaardig zijn aan de top propriëtaire modellen die vandaag beschikbaar zijn, terwijl ook verantwoorde ontwikkelings- en implementatiepraktijken prioriteit krijgen.

Llama 3: Architectuur en training

Een van de sleutelinnovaties in Llama 3 is zijn tokenizer, die een aanzienlijk uitgebreide vocabulaire van 128.256 tokens (van 32.000 in Llama 2) heeft. Deze grotere vocabulaire maakt een efficiëntere codering van tekst mogelijk, zowel voor invoer als uitvoer, wat potentieel kan leiden tot een sterkere multilingualisme en algehele prestatieverbetering.

Llama 3 maakt ook gebruik van Grouped-Query Attention (GQA), een efficiënte representatietechniek die schaalbaarheid verbetert en het model helpt om langer contexten effectiever te verwerken. De 8B-versie van Llama 3 maakt gebruik van GQA, terwijl zowel de 8B– als 70B-modellen sequenties tot 8.192 tokens kunnen verwerken.

Trainingsgegevens en schaalbaarheid

De trainingsgegevens die voor Llama 3 worden gebruikt, zijn een cruciaal aspect van zijn verbeterde prestaties. Meta heeft een enorme dataset van meer dan 15 biljoen tokens uit openbaar beschikbare online bronnen gecureerd, zeven keer groter dan de dataset die voor Llama 2 werd gebruikt. Deze dataset bevat ook een aanzienlijk deel (meer dan 5%) van hoge kwaliteit niet-Engelse gegevens, die meer dan 30 talen bestrijken, in voorbereiding op toekomstige multilinguale toepassingen.

Om de gegevenskwaliteit te garanderen, heeft Meta geavanceerde filtertechnieken toegepast, waaronder heuristische filters, NSFW-filters, semantische deduplicatie en tekstclassificatoren getraind op Llama 2 om gegevenskwaliteit te voorspellen. Het team heeft ook uitgebreide experimenten uitgevoerd om de optimale mix van gegevensbronnen voor pretraining te bepalen, waardoor Llama 3 goed presteert op een breed scala aan use cases, waaronder trivia, STEM, coding en historische kennis.

Het opschalen van pretraining was een ander kritisch aspect van de ontwikkeling van Llama 3. Meta heeft schaalwetten ontwikkeld die het mogelijk maken om de prestaties van zijn grootste modellen op sleuteltaak te voorspellen, voordat ze daadwerkelijk getraind werden. Dit heeft de beslissingen over gegevensmix en compute-toewijzing geïnformeerd, wat uiteindelijk heeft geleid tot een meer efficiënte en effectieve training.

De grootste modellen van Llama 3 werden getraind op twee aangepaste 24.000 GPU-clusters, met een combinatie van data parallelisatie, model parallelisatie en pipeline parallelisatie technieken. Meta’s geavanceerde trainingsstack automatiseerde foutdetectie, afhandeling en onderhoud, waardoor de GPU-uptime werd gemaximaliseerd en de trainings-efficiëntie ongeveer drie keer werd verhoogd in vergelijking met Llama 2.

Instructie-fine-tuning en prestaties

Om het volledige potentieel van Llama 3 voor chat- en dialoogtoepassingen te ontsluiten, heeft Meta zijn aanpak voor instructie-fine-tuning geïnnoveerd. De methode combineert supervised fine-tuning (SFT), rejection sampling, proximal policy optimization (PPO) en direct preference optimization (DPO).

De kwaliteit van de prompts die in SFT en de voorkeursrangschikkingen die in PPO en DPO worden gebruikt, speelde een cruciale rol in de prestaties van de uitgelijnde modellen. Meta’s team heeft deze gegevens zorgvuldig gecureerd en meerdere ronden van kwaliteitscontrole uitgevoerd op annotaties die door menselijke annotators werden verstrekt.

Training op voorkeursrangschikkingen via PPO en DPO heeft de prestaties van Llama 3 op redenering- en codetaak aanzienlijk verbeterd. Meta vond dat zelfs wanneer een model moeite heeft om een redeneringsvraag direct te beantwoorden, het nog steeds de juiste redenering kan produceren. Training op voorkeursrangschikkingen stelde het model in staat om te leren hoe het de juiste antwoord kan selecteren uit deze sporen.

De resultaten spreken voor zich: Llama 3 overtreft veel beschikbare open-source chatmodellen op gemeenschappelijke industriebenchmarks, waardoor het een nieuw state-of-the-art prestatieniveau voor LLM’s op de 8B en 70B parameterschaal vestigt.

Verantwoorde ontwikkeling en veiligheidsaspecten

Terwijl Meta de grenzen van de prestaties van Llama 3 verlegt, heeft het bedrijf ook prioriteit gegeven aan verantwoorde ontwikkelings- en implementatiepraktijken. Het bedrijf heeft een systeemniveau-aanpak geadopteerd, waarbij Llama 3-modellen worden beschouwd als onderdeel van een bredere ecosystemen die ontwikkelaars in de bestuurdersstoel plaatsen, waardoor ze de modellen kunnen ontwerpen en aanpassen voor hun specifieke use cases en veiligheidsvereisten.

Meta heeft uitgebreide red team-oefeningen uitgevoerd, adversarial evaluaties uitgevoerd en veiligheidsmitigatietechnieken geïmplementeerd om resterende risico’s in zijn instructie-getunede modellen te verlagen. Het bedrijf erkent echter dat resterende risico’s waarschijnlijk zullen blijven en beveelt ontwikkelaars aan om deze risico’s te beoordelen in de context van hun specifieke use cases.

Om verantwoorde implementatie te ondersteunen, heeft Meta zijn Responsible Use Guide bijgewerkt, waardoor ontwikkelaars een uitgebreide bron hebben om model- en systeemniveau-veiligheidsbest practices voor hun toepassingen te implementeren. De gids behandelt onderwerpen zoals contentmoderatie, risicobeoordeling en het gebruik van veiligheidstools zoals Llama Guard 2 en Code Shield.

Llama Guard 2, gebouwd op de MLCommons-taxonomie, is ontworpen om LLM-invoer (prompts) en antwoorden te classificeren, waardoor content kan worden gedetecteerd die als onveilig of schadelijk kan worden beschouwd. CyberSecEval 2 breidt zijn voorganger uit door maatregelen toe te voegen om misbruik van het modelcode-interpreter, offensieve cybersecurity-mogelijkheden en gevoeligheid voor prompt-injectieaanvallen te voorkomen.

Code Shield, een nieuwe introductie met Llama 3, voegt inference-time filtering van onveilige code die door LLM’s wordt gegenereerd toe, waardoor risico’s die verband houden met onveilige code-suggesties, code-interpreter-misbruik en beveiligde opdrachtuitvoering worden geminimaliseerd.

Toegang tot en gebruik van Llama 3

Na de lancering van Meta AI’s Llama 3 zijn verschillende open-source tools beschikbaar gesteld voor lokale implementatie op verschillende besturingssystemen, waaronder Mac, Windows en Linux. Deze sectie behandelt drie opvallende tools: Ollama, Open WebUI en LM Studio, elk met unieke functies voor het benutten van de mogelijkheden van Llama 3 op persoonlijke apparaten.

Ollama: Beschikbaar voor Mac, Linux en Windows, Ollama vereenvoudigt de werking van Llama 3 en andere grote taalmodellen op persoonlijke computers, zelfs op apparaten met minder krachtige hardware. Het bevat een pakketbeheerder voor eenvoudig modelbeheer en ondersteunt opdrachten over platforms voor het downloaden en uitvoeren van modellen.

Open WebUI met Docker: Deze tool biedt een gebruikersvriendelijke, Docker-gebaseerde interface die compatibel is met Mac, Linux en Windows. Het integreert naadloos met modellen uit het Ollama-register, waardoor gebruikers Llama 3 en andere modellen kunnen implementeren en ermee kunnen communiceren via een lokale webinterface.

LM Studio: Gericht op gebruikers op Mac, Linux en Windows, LM Studio ondersteunt een reeks modellen en is gebouwd op het llama.cpp-project. Het biedt een chatinterface en faciliteert directe interactie met verschillende modellen, waaronder het Llama 3 8B Instruct-model.

Deze tools garanderen dat gebruikers Llama 3 efficiënt kunnen gebruiken op hun persoonlijke apparaten, rekening houdend met een breed scala aan technische vaardigheden en vereisten. Elk platform biedt stap-voor-stap-processen voor installatie en modelinteractie, waardoor geavanceerde AI meer toegankelijk wordt voor ontwikkelaars en enthousiastelingen.

Implementatie van Llama 3 op grote schaal

Naast het direct beschikbaar stellen van de modelgewichten, heeft Meta partnerships gesloten met verschillende cloudproviders, model-API-diensten en hardwareplatforms om een naadloze implementatie van Llama 3 op grote schaal mogelijk te maken.

Een van de belangrijkste voordelen van Llama 3 is zijn verbeterde token-efficiëntie, dankzij de nieuwe tokenizer. Benchmarks laten zien dat Llama 3 tot 15% minder tokens nodig heeft in vergelijking met Llama 2, wat resulteert in snellere en meer kostenefficiënte inferentie.

De integratie van Grouped Query Attention (GQA) in de 8B-versie van Llama 3 draagt bij aan het behoud van inferentie-efficiëntie op hetzelfde niveau als de 7B-versie van Llama 2, ondanks de toename van het aantal parameters.

Om het implementatieproces te vereenvoudigen, heeft Meta de Llama Recipes-repository beschikbaar gesteld, die open-source code en voorbeelden bevat voor fine-tuning, implementatie, modelbeoordeling en meer. Deze repository fungeert als een waardevolle bron voor ontwikkelaars die de mogelijkheden van Llama 3 in hun toepassingen willen benutten.

Voor diegenen die geïnteresseerd zijn in het onderzoeken van de prestaties van Llama 3, heeft Meta zijn laatste modellen geïntegreerd in Meta AI, een toonaangevende AI-assistent gebouwd met Llama 3-technologie. Gebruikers kunnen interactie hebben met Meta AI via verschillende Meta-apps, zoals Facebook, Instagram, WhatsApp, Messenger en het web, om dingen te doen, te leren, te creëren en te verbinden met de dingen die voor hen belangrijk zijn.

Wat is de toekomst van Llama 3?

Terwijl de 8B- en 70B-modellen het begin van de Llama 3-release markeren, heeft Meta ambitieuze plannen voor de toekomst van deze baanbrekende LLM.

In de komende maanden kunnen we nieuwe mogelijkheden verwachten, waaronder multimodaliteit (de mogelijkheid om verschillende gegevensmodaliteiten te verwerken en te genereren, zoals afbeeldingen en video’s), multilingualisme (ondersteuning voor meerdere talen) en veel langere contextvensters voor verbeterde prestaties op taken die uitgebreide context vereisen.

Bovendien plant Meta om grotere modelgroottes vrij te geven, waaronder modellen met meer dan 400 miljard parameters, die momenteel in training zijn en veelbelovende trends in prestaties en mogelijkheden laten zien.

Om de vooruitgang van het veld verder te stimuleren, zal Meta ook een gedetailleerd onderzoeksrapport over Llama 3 publiceren, waarin de bevindingen en inzichten met de bredere AI-gemeenschap worden gedeeld.

Als een voorproefje van wat er gaat komen, heeft Meta enkele vroege snapshots van de prestaties van zijn grootste LLM-model op verschillende benchmarks gedeeld. Hoewel deze resultaten zijn gebaseerd op een vroeg checkpoint en onderhevig zijn aan verandering, bieden ze een spannend kijkje in de toekomstige mogelijkheden van Llama 3.

Conclusie

Llama 3 vertegenwoordigt een belangrijke mijlpaal in de evolutie van open-source grote taalmodellen, waarbij de grenzen van prestaties, mogelijkheden en verantwoorde ontwikkelingspraktijken worden verlegd. Met zijn innovatieve architectuur, enorme trainingsdataset en state-of-the-art fine-tuningtechnieken vestigt Llama 3 nieuwe state-of-the-art prestatieniveaus voor LLM’s op de 8B en 70B parameterschaal.

Toch is Llama 3 meer dan alleen een krachtig taalmodel; het is een getuigenis van Meta’s toewijding aan het bevorderen van een open en verantwoorde AI-ecosystemen. Door uitgebreide bronnen, veiligheidstools en best practices te bieden, stelt Meta ontwikkelaars in staat om het volledige potentieel van Llama 3 te benutten, terwijl ze ook verantwoorde implementatie garanderen, aangepast aan hun specifieke use cases en doelgroepen.

Terwijl de reis van Llama 3 voortduurt, met nieuwe mogelijkheden, modelgroottes en onderzoeksbevindingen in het verschiet, wacht de AI-gemeenschap met spanning de innovatieve toepassingen en doorbraken die ongetwijfeld zullen ontstaan uit deze baanbrekende LLM.

Of je nu een onderzoeker bent die de grenzen van natuurlijke taalverwerking verlegt, een ontwikkelaar die de volgende generatie intelligente toepassingen bouwt, of een AI-enthusiast die geïnteresseerd is in de laatste ontwikkelingen, Llama 3 belooft een krachtig instrument in je arsenaal te zijn, waardoor nieuwe deuren worden geopend en een wereld van mogelijkheden wordt ontsloten.

Aayush Mittal, Mittal

Ik heb de afgelopen vijf jaar doorgebracht met het onderdompelen van mezelf in de fascinerende wereld van Machine Learning en Deep Learning. Mijn passie en expertise hebben me geleid om bij te dragen aan meer dan 50 diverse software-engineeringprojecten, met een bijzondere focus op AI/ML. Mijn voortdurende nieuwsgierigheid heeft me ook aangetrokken tot Natural Language Processing, een vakgebied dat ik graag verder wil verkennen.

Unite.AI