Künstliche Intelligenz

Alles, was Sie über Llama 3 wissen müssen | Das leistungsstärkste Open-Source-Modell bisher | Konzepte bis zur Nutzung

Veröffentlicht am 24. April 2024

Aktualisiert am 21. Mai 2026

Von

Aayush Mittal Mittal

Meta Llama 3 open source LLM OUTPERFORM GPT 4

Meta hat kürzlich Llama 3 veröffentlicht, die nächste Generation seines state-of-the-art-Open-Source-Large-Language-Modells (LLM). Basierend auf den Grundlagen, die sein Vorgänger gelegt hat, zielt Llama 3 darauf ab, die Fähigkeiten zu verbessern, die Llama 2 als bedeutenden Open-Source-Konkurrenten von ChatGPT positioniert haben, wie in der umfassenden Rezension im Artikel Llama 2: Ein tiefer Einblick in den Open-Source-Herausforderer von ChatGPT erläutert wird.

In diesem Artikel werden wir die Kernkonzepte hinter Llama 3 diskutieren, seine innovative Architektur und Trainingsprozesse erkunden und praktische Anleitungen dazu geben, wie man auf dieses bahnbrechende Modell verantwortungsvoll zugreift, es nutzt und einsetzt. Ob Sie Forscher, Entwickler oder AI-Enthusiast sind, dieser Beitrag wird Sie mit den notwendigen Kenntnissen und Ressourcen ausstatten, um die Leistung von Llama 3 für Ihre Projekte und Anwendungen zu nutzen.

Die Evolution von Llama: Von Llama 2 zu Llama 3

Metas CEO, Mark Zuckerberg, kündigte die Premiere von Llama 3 an, dem neuesten KI-Modell, das von Meta AI entwickelt wurde. Dieses state-of-the-art-Modell, das jetzt Open-Source ist, soll verschiedene Meta-Produkte, einschließlich Messenger und Instagram, verbessern. Zuckerberg betonte, dass Llama 3 Meta AI als den fortschrittlichsten frei verfügbaren KI-Assistenten positioniert.

Bevor wir uns mit den Spezifika von Llama 3 befassen, sollten wir uns kurz sein Vorgänger, Llama 2, ansehen. Llama 2 wurde 2022 vorgestellt und war ein bedeutender Meilenstein im Open-Source-LLM-Landschaft, der ein leistungsstarkes und effizientes Modell bot, das auf Consumer-Hardware ausgeführt werden konnte.

Allerdings hatte Llama 2 seine Grenzen. Benutzer berichteten über Probleme mit Fehlverweigerungen (das Modell weigerte sich, auf harmlose Prompts zu antworten), begrenzter Nützlichkeit und Raum für Verbesserungen in Bereichen wie Reasoning und Code-Generierung.

Llama 3 ist Metas Antwort auf diese Herausforderungen und das Feedback der Community. Mit Llama 3 will Meta die besten Open-Source-Modelle auf dem Niveau der besten proprietären Modelle entwickeln, die heute verfügbar sind, während es gleichzeitig verantwortungsvolle Entwicklungs- und Einsatzpraktiken priorisiert.

Llama 3: Architektur und Training

Eine der wichtigsten Neuerungen in Llama 3 ist sein Tokenizer, der über ein deutlich erweitertes Vokabular von 128.256 Token (im Vergleich zu 32.000 in Llama 2) verfügt. Dies größere Vokabular ermöglicht effizientere Textcodierung, sowohl für die Eingabe als auch für die Ausgabe, was möglicherweise zu stärkerer Multilingualität und Gesamtleistungsverbesserungen führen kann.

Llama 3 integriert auch Grouped-Query-Attention (GQA), eine effiziente Darstellungstechnik, die die Skalierbarkeit verbessert und es dem Modell ermöglicht, längere Kontexte effektiver zu verarbeiten. Die 8B-Version von Llama 3 nutzt GQA, während beide Versionen, 8B und 70B, Sequenzen von bis zu 8.192 Token verarbeiten können.

Trainingsdaten und Skalierung

Die Trainingsdaten, die für Llama 3 verwendet wurden, sind ein entscheidender Faktor für seine verbesserte Leistung. Meta hat eine massive Datenbank mit über 15 Billionen Token aus öffentlich zugänglichen Online-Quellen kuratiert, die siebenmal größer ist als die Datenbank, die für Llama 2 verwendet wurde. Diese Datenbank enthält auch einen signifikanten Anteil (über 5%) hochwertiger nicht-englischer Daten, der mehr als 30 Sprachen abdeckt, um zukünftige multilinguale Anwendungen vorzubereiten.

Um die Datenqualität sicherzustellen, hat Meta fortschrittliche Filtertechniken eingesetzt, einschließlich heuristischer Filter, NSFW-Filter, semantischer Deduplizierung und Textklassifikatoren, die auf Llama 2 trainiert wurden, um die Datenqualität vorherzusagen. Das Team hat auch umfangreiche Experimente durchgeführt, um die optimale Mischung von Datenquellen für das Pretraining zu bestimmen, um sicherzustellen, dass Llama 3 in einer Vielzahl von Anwendungsfällen, einschließlich Trivia, STEM, Coding und historischem Wissen, gut abschneidet.

Die Skalierung des Pretrainings war ein weiterer kritischer Aspekt bei der Entwicklung von Llama 3. Meta hat Skalierungsgesetze entwickelt, die es ermöglichen, die Leistung der größten Modelle auf Schlüsselaufgaben wie Code-Generierung vorherzusagen, bevor sie tatsächlich trainiert werden. Dies informierte die Entscheidungen über die Datenmischung und die Zuweisung von Rechenleistung, was letztendlich zu effizienterem und effektiverem Training führte.

Die größten Modelle von Llama 3 wurden auf zwei benutzerdefinierten 24.000-GPU-Clustern trainiert, die eine Kombination aus Datenparallelisierung, Modellparallelisierung und Pipeline-Parallelisierung nutzten. Metas fortschrittliches Trainings-Stack automatisierte die Fehlererkennung, -behandlung und -wartung, maximiert die GPU-Auslastung und erhöhte die TrainingsEffizienz um etwa drei Mal im Vergleich zu Llama 2.

Anweisungsfeinabstimmung und Leistung

Um das volle Potenzial von Llama 3 für Chat- und Dialoganwendungen zu entfalten, hat Meta seinen Ansatz für die Anweisungsfeinabstimmung innoviert. Seine Methode kombiniert überwachtes Feinabstimmen (SFT), Ablehnungsstichproben, proximale Policy-Optimierung (PPO) und direkte Präferenzoptimierung (DPO).

Die Qualität der Prompts, die in SFT und der Präferenzrangliste, die in PPO und DPO verwendet werden, spielten eine entscheidende Rolle bei der Leistung der ausgerichteten Modelle. Metas Team hat diese Daten sorgfältig kuratiert und mehrere Runden der Qualitätsicherung auf Annotations durch menschliche Annotatoren durchgeführt.

Das Training auf Präferenzranglisten über PPO und DPO verbesserte auch die Leistung von Llama 3 bei Reasoning- und Codierungsaufgaben erheblich. Meta fand heraus, dass selbst wenn ein Modell Schwierigkeiten hat, eine Reasoning-Frage direkt zu beantworten, es möglicherweise immer noch die richtige Reasoning-Spur produziert. Das Training auf Präferenzranglisten ermöglichte es dem Modell, zu lernen, wie es die richtige Antwort aus diesen Spuren auswählen kann.

Die Ergebnisse sprechen für sich: Llama 3 übertrifft viele verfügbare Open-Source-Chat-Modelle auf gemeinsamen Industriebenchmarks und etabliert neue State-of-the-Art-Leistungen für LLMs bei den 8B- und 70B-Parameter-Skalen.

Verantwortungsvolle Entwicklung und Sicherheitsaspekte

Während Meta nach Spitzenleistungen strebt, priorisiert das Unternehmen auch verantwortungsvolle Entwicklungs- und Einsatzpraktiken für Llama 3. Das Unternehmen verfolgt einen systemweiten Ansatz, bei dem Llama-3-Modelle als Teil eines umfassenderen Ökosystems betrachtet werden, das Entwickler in die Lage versetzt, die Modelle für ihre spezifischen Anwendungsfälle und Sicherheitsanforderungen zu entwerfen und anzupassen.

Meta hat umfangreiche Red-Teaming-Übungen durchgeführt, adversarische Bewertungen durchgeführt und Sicherheitsmaßnahmen implementiert, um die verbleibenden Risiken in seinen anweisungsfeinabgestimmten Modellen zu minimieren. Allerdings erkennt das Unternehmen an, dass verbleibende Risiken wahrscheinlich bestehen bleiben und empfiehlt es Entwicklern, diese Risiken im Kontext ihrer spezifischen Anwendungsfälle zu bewerten.

Um verantwortungsvolle Bereitstellung zu unterstützen, hat Meta seinen Leitfaden für verantwortungsvolle Nutzung aktualisiert, der Entwicklern eine umfassende Ressource bietet, um modell- und systemweite Sicherheitsbest-Praktiken für ihre Anwendungen umzusetzen. Der Leitfaden behandelt Themen wie Inhaltsmoderation, Risikobewertung und den Einsatz von Sicherheitstools wie Llama Guard 2 und Code Shield.

Llama Guard 2, der auf der MLCommons-Taxonomie basiert, ist dafür ausgelegt, LLM-Eingaben (Prompts) und Antworten zu klassifizieren und Inhalte zu erkennen, die als unsicher oder schädlich angesehen werden können. CyberSecEval 2 erweitert seinen Vorgänger, indem es Maßnahmen hinzufügt, um den Missbrauch des Modell-Code-Interpreters, offensiver Cyber-Sicherheitsfunktionen und Anfälligkeit für Prompt-Injection-Angriffe zu verhindern.

Code Shield, eine neue Einführung mit Llama 3, fügt eine Inferenzzeit-Filterung unsicherer Code-Produktion durch LLMs hinzu, um Risiken im Zusammenhang mit unsicheren Code-Vorschlägen, Code-Interpreter-Missbrauch und sicherer Befehlsausführung zu mindern.

Zugriff auf und Nutzung von Llama 3

Nach dem Launch von Meta AI’s Llama 3 wurden mehrere Open-Source-Tools für die lokale Bereitstellung auf verschiedenen Betriebssystemen, einschließlich Mac, Windows und Linux, verfügbar gemacht. Dieser Abschnitt beschreibt drei bemerkenswerte Tools: Ollama, Open WebUI und LM Studio, die jeweils einzigartige Funktionen für die Nutzung der Fähigkeiten von Llama 3 auf persönlichen Geräten bieten.

Ollama: Verfügbar für Mac, Linux und Windows, Ollama vereinfacht den Betrieb von Llama 3 und anderen großen Sprachmodellen auf persönlichen Computern, sogar auf solchen mit weniger leistungsfähiger Hardware. Es enthält einen Paket-Manager für einfache Modellverwaltung und unterstützt Befehle über Plattformen für das Herunterladen und Ausführen von Modellen.

Open WebUI mit Docker: Dieses Tool bietet eine benutzerfreundliche, Docker-basierte Schnittstelle, die mit Mac, Linux und Windows kompatibel ist. Es integriert sich nahtlos mit Modellen aus dem Ollama-Register und ermöglicht es Benutzern, Modelle wie Llama 3 innerhalb einer lokalen Web-Schnittstelle zu bereitstellen und zu interagieren.

LM Studio: Zielgruppe sind Benutzer auf Mac, Linux und Windows, LM Studio unterstützt eine Reihe von Modellen und basiert auf dem llama.cpp-Projekt. Es bietet eine Chat-Schnittstelle und ermöglicht direkte Interaktion mit verschiedenen Modellen, einschließlich des Llama-3-8B-Instruct-Modells.

Diese Tools stellen sicher, dass Benutzer Llama 3 auf ihren persönlichen Geräten effizient nutzen können, unabhängig von ihren technischen Fähigkeiten und Anforderungen. Jede Plattform bietet schrittweise Anleitungen für die Einrichtung und Modellinteraktion, wodurch fortschrittliche KI-Technologie für Entwickler und Enthusiasten zugänglicher wird.

Bereitstellung von Llama 3 im großen Maßstab

Neben der direkten Bereitstellung der Modellgewichte hat Meta Partnerschaften mit verschiedenen Cloud-Anbietern, Modell-API-Diensten und Hardware-Plattformen eingegangen, um eine nahtlose Bereitstellung von Llama 3 im großen Maßstab zu ermöglichen.

Einer der Hauptvorteile von Llama 3 ist seine verbesserte Token-Effizienz, dank des neuen Tokenizers. Benchmarks zeigen, dass Llama 3 bis zu 15% weniger Token im Vergleich zu Llama 2 benötigt, was zu schnellerer und kostengünstigerer Inferenz führt.

Die Integration von Grouped Query Attention (GQA) in der 8B-Version von Llama 3 trägt dazu bei, die Inferenz-Effizienz auf dem Niveau der 7B-Version von Llama 2 zu halten, trotz der Erhöhung der Parameterzahl.

Um den Bereitstellungsprozess zu vereinfachen, hat Meta das Llama-Rezepte-Repository bereitgestellt, das Open-Source-Code und Beispiele für Feinabstimmung, Bereitstellung, Modellbewertung und mehr enthält. Dieses Repository dient als wertvolle Ressource für Entwickler, die die Fähigkeiten von Llama 3 in ihren Anwendungen nutzen möchten.

Für diejenigen, die sich für die Leistung von Llama 3 interessieren, hat Meta seine neuesten Modelle in Meta AI integriert, einen führenden KI-Assistenten, der mit Llama-3-Technologie entwickelt wurde. Benutzer können mit Meta AI über verschiedene Meta-Apps, wie Facebook, Instagram, WhatsApp, Messenger und das Web, interagieren, um Dinge zu erledigen, zu lernen, zu erstellen und mit den Dingen in Verbindung zu treten, die ihnen wichtig sind.

Was kommt als Nächstes für Llama 3?

Während die 8B- und 70B-Modelle den Beginn der Llama-3-Veröffentlichung markieren, hat Meta ambitionierte Pläne für die Zukunft dieses bahnbrechenden LLMs.

In den kommenden Monaten können wir neue Fähigkeiten erwarten, einschließlich Multimodalität (die Fähigkeit, verschiedene Datenmodalitäten wie Bilder und Videos zu verarbeiten und zu generieren), Multilingualität (Unterstützung mehrerer Sprachen) und viel längere Kontextfenster für verbesserte Leistung bei Aufgaben, die umfangreichen Kontext erfordern.

Darüber hinaus plant Meta, größere Modellgrößen zu veröffentlichen, einschließlich Modelle mit über 400 Milliarden Parametern, die derzeit in der Ausbildung sind und vielversprechende Trends in Bezug auf Leistung und Fähigkeiten zeigen.

Um den Fortschritt in diesem Bereich voranzutreiben, wird Meta auch einen detaillierten Forschungsbericht über Llama 3 veröffentlichen, in dem es seine Erkenntnisse und Einblicke mit der breiteren KI-Gemeinschaft teilt.

Als Vorgeschmack auf das, was kommen wird, hat Meta einige frühe Snapshots der Leistung seines größten LLM-Modells auf verschiedenen Benchmarks geteilt. Obwohl diese Ergebnisse auf einem frühen Checkpoint basieren und sich ändern können, bieten sie einen aufregenden Blick in das zukünftige Potenzial von Llama 3.

Schlussfolgerung

Llama 3 stellt einen bedeutenden Meilenstein in der Evolution von Open-Source-Large-Language-Modellen dar, indem es die Grenzen der Leistung, Fähigkeiten und verantwortungsvollen Entwicklungspraktiken vorantreibt. Mit seiner innovativen Architektur, seiner massiven Trainingsdatenbank und seinen bahnbrechenden Feinabstimmungstechniken etabliert Llama 3 neue State-of-the-Art-Benchmarks für LLMs bei den 8B- und 70B-Parameter-Skalen.

Llama 3 ist jedoch mehr als nur ein leistungsstarkes Sprachmodell; es ist ein Zeichen für Metas Engagement, ein offenes und verantwortungsvolles KI-Ökosystem zu fördern. Durch die Bereitstellung umfassender Ressourcen, Sicherheitstools und Best-Praktiken ermöglicht Meta es Entwicklern, das volle Potenzial von Llama 3 zu nutzen, während sie gleichzeitig verantwortungsvolle Bereitstellung an ihre spezifischen Anwendungsfälle und Zielgruppen anpassen.

Während die Reise von Llama 3 mit neuen Fähigkeiten, Modellgrößen und Forschungsergebnissen voranschreitet, erwartet die KI-Gemeinschaft gespannt die innovativen Anwendungen und Durchbrüche, die unweigerlich aus diesem bahnbrechenden LLM hervorgehen werden.

Ob Sie Forscher sind, die die Grenzen der natürlichen Sprachverarbeitung vorantreiben, Entwickler, die die nächste Generation intelligenter Anwendungen bauen, oder KI-Enthusiasten, die sich für die neuesten Fortschritte interessieren, Llama 3 verspricht, ein leistungsstarkes Werkzeug in Ihrem Arsenal zu sein, das neue Türen öffnet und eine Welt der Möglichkeiten freischaltet.

Aayush Mittal, Mittal

Ich habe die letzten fünf Jahre damit verbracht, mich in die faszinierende Welt des Machine Learning und Deep Learning zu vertiefen. Mein Engagement und meine Expertise haben mich dazu geführt, an über 50 verschiedenen Software-Entwicklungsprojekten mit einem besonderen Fokus auf AI/ML beizutragen. Meine anhaltende Neugier hat mich auch zum Bereich der Natural Language Processing hingezogen, einem Feld, das ich weiter erforschen möchte.

Unite.AI