Kunstmatige intelligentie
Alles wat je moet weten over Llama 3 | Meest krachtige open-source model tot nu toe | Concepten tot gebruik
Meta heeft onlangs Llama 3 uitgebracht, de volgende generatie van zijn state-of-the-art open source large language model (LLM). Gebouwd op de fundamenten die zijn voorganger heeft gelegd, heeft Llama 3 als doel om de mogelijkheden te verbeteren die Llama 2 hebben gepositioneerd als een significante open-source concurrent van ChatGPT, zoals uitgelegd in de uitgebreide review in het artikel Llama 2: Een diepe duik in de open-source uitdager van ChatGPT.
In dit artikel zullen we de kernconcepten achter Llama 3 bespreken, de innovatieve architectuur en trainingsproces verkennen en praktische richtlijnen bieden over hoe toegang te krijgen, te gebruiken en verantwoordelijk Llama 3 in te zetten. Of je nu een onderzoeker bent die de grenzen van natuurlijke taalverwerking verlegt, een ontwikkelaar die de volgende generatie intelligente toepassingen bouwt, of een AI-enthusiast die geïnteresseerd is in de laatste ontwikkelingen, deze post zal je voorzien van de kennis en middelen die je nodig hebt om de kracht van Llama 3 te benutten voor je projecten en toepassingen.
De evolutie van Llama: van Llama 2 tot Llama 3
Meta’s CEO, Mark Zuckerberg, heeft aangekondigd de lancering van Llama 3, het laatste AI-model ontwikkeld door Meta AI. Dit state-of-the-art model, nu open-source, is bedoeld om Meta’s verschillende producten te verbeteren, waaronder Messenger en Instagram. Zuckerberg benadrukte dat Llama 3 Meta AI positioneert als de meest geavanceerde vrij beschikbare AI-assistent.
Voordat we ingaan op de specificaties van Llama 3, laten we eerst even terugkijken naar zijn voorganger, Llama 2. In 2022 geïntroduceerd, was Llama 2 een belangrijke mijlpaal in het open-source LLM-landschap, met een krachtig en efficiënt model dat kon worden uitgevoerd op consumentenhardware.
Toch had Llama 2 zijn beperkingen. Gebruikers meldden problemen met valse weigeringen (het model weigerde om onschuldige prompts te beantwoorden), beperkte bruikbaarheid en ruimte voor verbetering op gebieden zoals redeneren en codegeneratie.
Enter Llama 3: Meta’s reactie op deze uitdagingen en de feedback van de gemeenschap. Met Llama 3 heeft Meta als doel om de beste open-source modellen te bouwen die gelijkwaardig zijn aan de top propriëtaire modellen die vandaag beschikbaar zijn, terwijl ook verantwoorde ontwikkelings- en implementatiepraktijken prioriteit krijgen.
Llama 3: Architectuur en training
Een van de sleutelinnovaties in Llama 3 is zijn tokenizer, die een aanzienlijk uitgebreide vocabulaire van 128.256 tokens (van 32.000 in Llama 2) heeft. Deze grotere vocabulaire maakt een efficiëntere codering van tekst mogelijk, zowel voor invoer als uitvoer, wat potentieel kan leiden tot een sterkere multilingualisme en algehele prestatieverbetering.
Llama 3 maakt ook gebruik van Grouped-Query Attention (GQA), een efficiënte representatietechniek die schaalbaarheid verbetert en het model helpt om langer contexten effectiever te verwerken. De 8B-versie van Llama 3 maakt gebruik van GQA, terwijl zowel de 8B– als 70B-modellen sequenties tot 8.192 tokens kunnen verwerken.
Trainingsgegevens en schaalbaarheid
De trainingsgegevens die voor Llama 3 worden gebruikt, zijn een cruciaal aspect van zijn verbeterde prestaties. Meta heeft een enorme dataset van meer dan 15 biljoen tokens uit openbaar beschikbare online bronnen gecureerd, zeven keer groter dan de dataset die voor Llama 2 werd gebruikt. Deze dataset bevat ook een aanzienlijk deel (meer dan 5%) van hoge kwaliteit niet-Engelse gegevens, die meer dan 30 talen bestrijken, in voorbereiding op toekomstige multilinguale toepassingen.
Om de gegevenskwaliteit te garanderen, heeft Meta geavanceerde filtertechnieken toegepast, waaronder heuristische filters, NSFW-filters, semantische deduplicatie en tekstclassificatoren getraind op Llama 2 om gegevenskwaliteit te voorspellen. Het team heeft ook uitgebreide experimenten uitgevoerd om de optimale mix van gegevensbronnen voor pretraining te bepalen, waardoor Llama 3 goed presteert op een breed scala aan use cases, waaronder trivia, STEM, coding en historische kennis.
Het opschalen van pretraining was een ander kritisch aspect van de ontwikkeling van Llama 3. Meta heeft schaalwetten ontwikkeld die het mogelijk maken om de prestaties van zijn grootste modellen op sleuteltaak te voorspellen, voordat ze daadwerkelijk getraind werden. Dit heeft de beslissingen over gegevensmix en compute-toewijzing geïnformeerd, wat uiteindelijk heeft geleid tot een meer efficiënte en effectieve training.
De grootste modellen van Llama 3 werden getraind op twee aangepaste 24.000 GPU-clusters, met een combinatie van data parallelisatie, model parallelisatie en pipeline parallelisatie technieken. Meta’s geavanceerde trainingsstack automatiseerde foutdetectie, afhandeling en onderhoud, waardoor de GPU-uptime werd gemaximaliseerd en de trainings-efficiëntie ongeveer drie keer werd verhoogd in vergelijking met Llama 2.
Instructie-fine-tuning en prestaties
Om het volledige potentieel van Llama 3 voor chat- en dialoogtoepassingen te ontsluiten, heeft Meta zijn aanpak voor instructie-fine-tuning geïnnoveerd. De methode combineert supervised fine-tuning (SFT), rejection sampling, proximal policy optimization (PPO) en direct preference optimization (DPO).
De kwaliteit van de prompts die in SFT en de voorkeursrangschikkingen die in PPO en DPO worden gebruikt, speelde een cruciale rol in de prestaties van de uitgelijnde modellen. Meta’s team heeft deze gegevens zorgvuldig gecureerd en meerdere ronden van kwaliteitscontrole uitgevoerd op annotaties die door menselijke annotators werden verstrekt.
Training op voorkeursrangschikkingen via PPO en DPO heeft de prestaties van Llama 3 op redenering- en codetaak aanzienlijk verbeterd. Meta vond dat zelfs wanneer een model moeite heeft om een redeneringsvraag direct te beantwoorden, het nog steeds de juiste redenering kan produceren. Training op voorkeursrangschikkingen stelde het model in staat om te leren hoe het de juiste antwoord kan selecteren uit deze sporen.
De resultaten spreken voor zich: Llama 3 overtreft veel beschikbare open-source chatmodellen op gemeenschappelijke industriebenchmarks, waardoor het een nieuw state-of-the-art prestatieniveau voor LLM’s op de 8B en 70B parameterschaal vestigt.
Verantwoorde ontwikkeling en veiligheidsaspecten
Terwijl Meta de grenzen van de prestaties van Llama 3 verlegt, heeft het bedrijf ook prioriteit gegeven aan verantwoorde ontwikkelings- en implementatiepraktijken. Het bedrijf heeft een systeemniveau-aanpak geadopteerd, waarbij Llama 3-modellen worden beschouwd als onderdeel van een bredere ecosystemen die ontwikkelaars in de bestuurdersstoel plaatsen, waardoor ze de modellen kunnen ontwerpen en aanpassen voor hun specifieke use cases en veiligheidsvereisten.
Meta heeft uitgebreide red team-oefeningen uitgevoerd, adversarial evaluaties uitgevoerd en veiligheidsmitigatietechnieken geïmplementeerd om resterende risico’s in zijn instructie-getunede modellen te verlagen. Het bedrijf erkent echter dat resterende risico’s waarschijnlijk zullen blijven en beveelt ontwikkelaars aan om deze risico’s te beoordelen in de context van hun specifieke use cases.
Om verantwoorde implementatie te ondersteunen, heeft Meta zijn Responsible Use Guide bijgewerkt, waardoor ontwikkelaars een uitgebreide bron hebben om model- en systeemniveau-veiligheidsbest practices voor hun toepassingen te implementeren. De gids behandelt onderwerpen zoals contentmoderatie, risicobeoordeling en het gebruik van veiligheidstools zoals Llama Guard 2 en Code Shield.
Llama Guard 2, gebouwd op de MLCommons-taxonomie, is ontworpen om LLM-invoer (prompts) en antwoorden te classificeren, waardoor content kan worden gedetecteerd die als onveilig of schadelijk kan worden beschouwd. CyberSecEval 2 breidt zijn voorganger uit door maatregelen toe te voegen om misbruik van het modelcode-interpreter, offensieve cybersecurity-mogelijkheden en gevoeligheid voor prompt-injectieaanvallen te voorkomen.
Code Shield, een nieuwe introductie met Llama 3, voegt inference-time filtering van onveilige code die door LLM’s wordt gegenereerd toe, waardoor risico’s die verband houden met onveilige code-suggesties, code-interpreter-misbruik en beveiligde opdrachtuitvoering worden geminimaliseerd.
Toegang tot en gebruik van Llama 3
Na de lancering van Meta AI’s Llama 3 zijn verschillende open-source tools beschikbaar gesteld voor lokale implementatie op verschillende besturingssystemen, waaronder Mac, Windows en Linux. Deze sectie behandelt drie opvallende tools: Ollama, Open WebUI en LM Studio, elk met unieke functies voor het benutten van de mogelijkheden van Llama 3 op persoonlijke apparaten.
Ollama: Beschikbaar voor Mac, Linux en Windows, Ollama vereenvoudigt de werking van Llama 3 en andere grote taalmodellen op persoonlijke computers, zelfs op apparaten met minder krachtige hardware. Het bevat een pakketbeheerder voor eenvoudig modelbeheer en ondersteunt opdrachten over platforms voor het downloaden en uitvoeren van modellen.
Open WebUI met Docker: Deze tool biedt een gebruikersvriendelijke, Docker-gebaseerde interface die compatibel is met Mac, Linux en Windows. Het integreert naadloos met modellen uit het Ollama-register, waardoor gebruikers Llama 3 en andere modellen kunnen implementeren en ermee kunnen communiceren via een lokale webinterface.
LM Studio: Gericht op gebruikers op Mac, Linux en Windows, LM Studio ondersteunt een reeks modellen en is gebouwd op het llama.cpp-project. Het biedt een chatinterface en faciliteert directe interactie met verschillende modellen, waaronder het Llama 3 8B Instruct-model.
Deze tools garanderen dat gebruikers Llama 3 efficiënt kunnen gebruiken op hun persoonlijke apparaten, rekening houdend met een breed scala aan technische vaardigheden en vereisten. Elk platform biedt stap-voor-stap-processen voor installatie en modelinteractie, waardoor geavanceerde AI meer toegankelijk wordt voor ontwikkelaars en enthousiastelingen.















