Künstliche Intelligenz

Offene KI schlägt zurück mit Metas Llama 4

mm

In den letzten Jahren hat sich die KI-Welt von einer Kultur der offenen Zusammenarbeit zu einer von eng gehüteten proprietären Systemen verschoben. OpenAI – ein Unternehmen, das wörtlich mit “offen” in seinem Namen gegründet wurde – wechselte nach 2019 zu geheimen Modellen. Konkurrenten wie Anthropic und Google bauten ähnlich fortschrittliche KI hinter API-Wänden, die nur auf ihre Bedingungen zugänglich sind. Dieser geschlossene Ansatz wurde teilweise durch Sicherheits- und Geschäftsinteressen gerechtfertigt, aber er ließ viele in der Gemeinschaft die Verluste des frühen offenen Geistes betrauern.

Jetzt kehrt dieser Geist zurück. Metas neu veröffentlichte Llama-4-Modelle signalisieren einen mutigen Versuch, offene KI auf höchstem Niveau wiederzubeleben – und sogar traditionell abgeschottete Spieler nehmen davon Notiz. OpenAIs CEO Sam Altman gab kürzlich zu, dass das Unternehmen “auf der falschen Seite der Geschichte” hinsichtlich offener Modelle war und Pläne für ein “leistungsstarkes neues offenes Modell” GPT-4-Variante ankündigte. Kurz gesagt, offene KI schlägt zurück, und die Bedeutung und der Wert von “offen” entwickeln sich.

(Quelle: Meta)

Llama 4: Metas offener Herausforderer für GPT-4o, Claude und Gemini

Meta stellte Llama 4 als weitere direkte Herausforderung für die neuen Modelle der KI-Schweregewichte vor, indem es sie als offene Alternative positionierte. Llama 4 kommt in zwei heute verfügbaren Varianten – Llama 4 Scout und Llama 4 Maverick – mit atemberaubenden technischen Spezifikationen. Beide sind Mixture-of-Experts-Modelle (MoE), die nur einen Bruchteil ihrer Parameter pro Abfrage aktivieren, was ermöglicht, massive Gesamtgröße ohne überwältigende Laufzeitkosten zu erreichen. Scout und Maverick verfügen jeweils über 17 Milliarden “aktive” Parameter (der Teil, der an einer gegebenen Eingabe arbeitet), aber dank MoE verteilt Scout diese auf 16 Experten (109 Milliarden Parameter insgesamt) und Maverick auf 128 Experten (400 Milliarden insgesamt). Das Ergebnis: Llama-4-Modelle liefern beeindruckende Leistung – und tun dies mit einzigartigen Vorteilen, die sogar einige geschlossene Modelle nicht haben.

Zum Beispiel verfügt Llama 4 Scout über ein branchenführendes Kontextfenster von 10 Millionen Token, was mehrere Größenordnungen über den meisten Rivalen liegt. Dies bedeutet, dass es riesige Dokumente oder Codebasen in einem Durchgang aufnehmen und darüber nachdenken kann. Trotz seiner Größe ist Scout effizient genug, um auf einer einzelnen H100-GPU zu laufen, wenn er stark quantisiert wird, was darauf hindeutet, dass Entwickler keinen Supercomputer benötigen, um damit zu experimentieren.

Währenddessen ist Llama 4 Maverick für maximale Leistung abgestimmt. Frühe Tests zeigen, dass Maverick die besten geschlossenen Modelle auf Reasoning-, Coding- und Vision-Aufgaben einholt oder übertrifft. Tatsächlich ist Meta bereits ein noch größeres Geschwistermodell, Llama 4 Behemoth, im Training, das intern “GPT-4.5, Claude 3.7 Sonnet und Gemini 2.0 Pro auf mehreren STEM-Benchmarks übertrifft”. Die Botschaft ist klar: Offene Modelle sind nicht länger zweitrangig; Llama 4 zielt auf den Status des State-of-the-Art ab.

Ebenso wichtig ist, dass Meta Llama 4 sofort zum Download und zur Nutzung bereitgestellt hat. Entwickler können Scout und Maverick von der offiziellen Website oder Hugging Face unter der Llama-4-Community-Lizenz herunterladen. Das bedeutet, dass jeder – von einem Hobby-Entwickler bis hin zu einem Fortune-500-Unternehmen – unter die Haube schauen, das Modell an seine Bedürfnisse anpassen und es auf seinem eigenen Hardware- oder Cloud-System bereitstellen kann. Dies ist ein krasser Gegensatz zu proprietären Angeboten wie OpenAIs GPT-4o oder Anthropics Claude 3.7, die über kostenpflichtige APIs mit keinen Zugriff auf die zugrunde liegenden Gewichte angeboten werden.

Meta betont, dass die Offenheit von Llama 4 darum geht, Benutzer zu ermächtigen: “Wir teilen die ersten Modelle im Llama-4-Rudel, das es den Menschen ermöglichen wird, personalisierte multimodale Erfahrungen zu erstellen.” Mit anderen Worten ist Llama 4 ein Werkzeug, das in den Händen von Entwicklern und Forschern auf der ganzen Welt sein soll. Indem Meta Modelle veröffentlicht, die die Fähigkeiten von GPT-4 und Claude rivalisieren, belebt es die Vorstellung wieder, dass Top-Tier-KI nicht hinter einer Paywall leben muss.

(Quelle: Meta)

Echter Idealismus oder strategisches Spiel?

Meta präsentiert Llama 4 in großen, fast altruistischen Worten. “Unser offenes KI-Modell, Llama, wurde über eine Milliarde Mal heruntergeladen”, kündigte CEO Mark Zuckerberg kürzlich an, fügte hinzu, dass “die Offenlegung von KI-Modellen für die Gewährleistung des Zugangs zu den Vorteilen von KI für alle Menschen auf der ganzen Welt unerlässlich ist”. Diese Darstellung malt Meta als Bannerträger der demokratisierten KI – ein Unternehmen, das bereit ist, seine Kronjuwelen-Modelle für das größere Wohl zu teilen. Und tatsächlich unterstützt die Popularität der Llama-Familie dies: Die Modelle wurden in atemberaubendem Maßstab heruntergeladen (von 650 Millionen auf 1 Milliarde Gesamt-Downloads in nur wenigen Monaten) und werden bereits von Unternehmen wie Spotify, AT&T und DoorDash in der Produktion verwendet.

Meta betont stolz, dass Entwickler die “Transparenz, Anpassungsfähigkeit und Sicherheit” von offenen Modellen schätzen, die sie selbst ausführen können, was “helfen kann, neue Levels an Kreativität und Innovation zu erreichen”, im Vergleich zu Black-Box-APIs. Im Prinzip klingt dies wie die alte Open-Source-Software-Ethik (denken Sie an Linux oder Apache) auf KI angewendet – ein unzweideutiger Sieg für die Gemeinschaft.

Doch man kann den strategischen Kalkül hinter dieser Offenheit nicht ignorieren. Meta ist keine Wohltätigkeitsorganisation, und “Open-Source” in diesem Kontext kommt mit Einschränkungen. Insbesondere wird Llama 4 unter einer speziellen Community-Lizenz und nicht unter einer Standard-Lizenz veröffentlicht – also sind die Modellgewichte zwar kostenlos zu verwenden, es gibt jedoch Einschränkungen (z. B. können bestimmte Ressourcen-intensive Anwendungsfälle eine Genehmigung erfordern, und die Lizenz ist “eigentumsrechtlich” in dem Sinne, dass sie von Meta erstellt wurde). Dies entspricht nicht der Open-Source-Initiative (OSI)-Definition von Open Source, was dazu geführt hat, dass einige Kritiker argumentieren, dass Unternehmen den Begriff missbrauchen.

In der Praxis wird Metas Ansatz oft als “offen” oder “quellcodeverfügbar” bezeichnet: Der Code und die Gewichte sind offen, aber Meta behält noch einige Kontrolle und gibt nicht alles preis (Trainingsdaten zum Beispiel). Das verringert nicht die Nützlichkeit für Benutzer, zeigt aber, dass Meta strategisch offen ist – es hält gerade genug Zügel, um sich selbst zu schützen (und vielleicht seinen Wettbewerbsvorteil). Viele Unternehmen kleben “Open-Source”-Etiketten auf KI-Modelle, während sie wichtige Details zurückhalten, was den wahren Geist der Offenheit untergräbt.

Warum würde Meta sich überhaupt öffnen? Die Wettbewerbslandschaft bietet Hinweise. Die Veröffentlichung leistungsstarker Modelle kostenlos kann schnell eine breite Entwickler- und Unternehmensbasis aufbauen – Mistral AI, ein französisches Startup, hat genau das mit seinen frühen offenen Modellen getan, um Glaubwürdigkeit als Top-Tier-Labor zu gewinnen.

Indem Meta den Markt mit Llama besät, stellt es sicher, dass seine Technologie im KI-Ökosystem grundlegend wird, was langfristig Dividenden abwerfen kann. Es ist eine klassische Umarmungs- und Erweiterungsstrategie: Wenn jeder Metas “offenes” Modell verwendet, setzt das Unternehmen indirekt Standards und lenkt vielleicht sogar Menschen zu seinen Plattformen (z. B. nutzen Metas KI-Assistenten-Produkte Llama). Es gibt auch ein Element von PR und Positionierung. Meta kann die Rolle des wohlwollenden Innovators spielen, insbesondere im Vergleich zu OpenAI – das für seinen geschlossenen Ansatz kritisiert wurde. Tatsächlich unterstreicht OpenAIs Sinneswandel hinsichtlich offener Modelle, wie effektiv Metas Schachzug war.

Nachdem das bahnbrechende chinesische offene Modell DeepSeek-R1 im Januar aufgetaucht war und frühere Modelle übertroffen hatte, gab Altman an, dass OpenAI nicht auf der “falschen Seite der Geschichte” sein wolle. Jetzt kündigt OpenAI ein offenes Modell mit starken Reasoning-Fähigkeiten in der Zukunft an, was einen Wechsel in der Einstellung markiert. Es ist schwer, Metas Einfluss in diesem Wechsel nicht zu sehen. Metas offene Haltung ist sowohl echt als auch strategisch: Es erweitert tatsächlich den Zugang zu KI, ist aber auch ein cleverer Schachzug, um Rivalen auszumanövrieren und den Markt auf Metas Bedingungen zu formen.

Auswirkungen auf Entwickler, Unternehmen und die Zukunft von KI

Für Entwickler ist die Rückkehr offener Modelle wie Llama 4 ein frischer Wind. Anstatt in einem einzigen Anbieters Ökosystem und Gebühren festzustecken, haben sie jetzt die Option, leistungsstarke KI auf ihrer eigenen Infrastruktur oder anzupassen.

Dies ist ein riesiger Vorteil für Unternehmen in sensiblen Branchen – denken Sie an Finanzen, Gesundheitswesen oder Regierung – die sich scheuen, vertrauliche Daten in jemand anderes Black Box zu füttern. Mit Llama 4 könnte eine Bank oder ein Krankenhaus ein state-of-the-art-Sprachmodell hinter ihrem eigenen Firewall bereitstellen, es auf privaten Daten anpassen, ohne ein Token mit einer externen Entität zu teilen. Es gibt auch einen Kostenvorteil. Während usagebasierte API-Gebühren für Top-Modelle in die Höhe schießen können, hat ein offenes Modell keine Nutzungskosten – Sie zahlen nur für die Rechenleistung, um es auszuführen. Unternehmen, die schwere KI-Arbeitslasten aufbauen, können durch die Wahl einer offenen Lösung, die sie intern skalieren können, erheblich sparen.

Es ist kein Wunder, dass wir ein größeres Interesse an offenen Modellen von Unternehmen sehen; viele haben erkannt, dass die Kontrolle und Sicherheit von Open-Source-KI besser zu ihren Bedürfnissen passen als einheitsförmige geschlossene Dienste.

Entwickler profitieren auch von Innovationen. Mit Zugriff auf die Modellinternas können sie die KI für Nischenbereiche (Recht, Biotechnologie, regionale Sprachen – nennen Sie es) anpassen und verbessern, was ein geschlossenes API möglicherweise nie berücksichtigen würde. Die Explosion von communitygetriebenen Projekten um frühere Llama-Modelle – von Chatbots, die auf medizinischem Wissen fein abgestimmt wurden, bis hin zu Hobby-Smartphone-Apps, die Miniaturversionen ausführen – hat gezeigt, wie offene Modelle die Experimentierung demokratisieren können.

Jedoch wirft die offene Modell-Renaissance auch harte Fragen auf. Tritt “Demokratisierung” wirklich ein, wenn nur diejenigen mit erheblichen Rechenressourcen ein 400-Milliarden-Parameter-Modell ausführen können? Während Llama 4 Scout und Maverick die Hardware-Schranke im Vergleich zu monolithischen Modellen senken, sind sie immer noch schwerwiegend – ein Punkt, der nicht an Entwickler vorbeigeht, deren PCs sie ohne Cloud-Hilfe nicht bewältigen können.

Die Hoffnung ist, dass Techniken wie Modellkomprimierung, Destillation oder kleinere Experten-Varianten die Leistung von Llama 4 auf zugänglichere Größen herunterbrechen werden. Ein weiteres Anliegen ist der Missbrauch. OpenAI und andere argumentierten lange, dass die Veröffentlichung leistungsstarker Modelle offen schädliche Akteure (z. B. für die Erstellung von Fehlinformationen, Malware-Code usw.) ermöglichen könnte.

Diese Bedenken bleiben bestehen: Ein offenes Modell wie Claude oder GPT könnte ohne die Sicherheitsfilter, die Unternehmen auf ihren APIs durchsetzen, missbraucht werden. Andererseits argumentieren Befürworter, dass Offenheit es der Community ermöglicht, Probleme auch zu identifizieren und zu beheben, was Modelle im Laufe der Zeit robuster und transparenter macht als jedes geheime System. Es gibt Beweise dafür, dass offene Modell-Communities Sicherheit ernst nehmen, eigene Schutzmechanismen entwickeln und bewährte Verfahren teilen – aber es ist ein anhaltender Konflikt.

Was immer deutlicher wird, ist, dass wir auf eine hybride KI-Landschaft zusteuern, in der offene und geschlossene Modelle koexistieren und sich gegenseitig beeinflussen. Geschlossene Anbieter wie OpenAI, Anthropic und Google halten immer noch eine Leistungsüberlegenheit – zumindest vorerst. Tatsächlich deutete die Forschung Ende 2024 an, dass offene Modelle etwa ein Jahr hinter den besten geschlossenen Modellen in der Leistungsfähigkeit lagen. Aber diese Lücke schließt sich schnell.

Heute ist “Open-Source-KI” nicht mehr nur ein Hobbyprojekt oder ältere Modelle – es ist nun im Zentrum der KI-Strategie für Technologie-Riesen und Startups gleichermaßen. Metas Llama-4-Start ist eine mächtige Erinnerung an den sich entwickelnden Wert von Offenheit. Es ist sowohl ein philosophischer Stand für die Demokratisierung von Technologie als auch ein taktischer Schachzug in einer hochriskanten Industrie-Schlacht. Für Entwickler und Unternehmen öffnet es neue Türen zur Innovation und Autonomie, auch wenn es Entscheidungen mit neuen Kompromissen kompliziert. Und für das breitere Ökosystem erweckt es die Hoffnung, dass die Vorteile von KI nicht in den Händen weniger Konzerne eingeschlossen werden – wenn die Open-Source-Ethik ihre Position behaupten kann.

Alex McFarland ist ein KI-Journalist und Schriftsteller, der die neuesten Entwicklungen im Bereich der künstlichen Intelligenz erforscht. Er hat mit zahlreichen KI-Startups und Veröffentlichungen weltweit zusammengearbeitet.