Künstliche Intelligenz

Der Kampf zwischen Open-Source- und Closed-Source-Sprachmodellen: Eine technische Analyse

Veröffentlicht

3 Monate her

12. Februar 2024

Große Sprachmodelle (LLMs) haben in den letzten Jahren die KI-Community in ihren Bann gezogen und zu Durchbrüchen in der Verarbeitung natürlicher Sprache geführt. Hinter dem Hype steckt eine komplexe Debatte: Sollten diese leistungsstarken Modelle Open Source oder Closed Source sein?

In diesem Beitrag analysieren wir die technische Unterscheidung zwischen diesen Ansätzen, um die Chancen und Einschränkungen zu verstehen, die jeder mit sich bringt. Wir werden die folgenden Schlüsselaspekte behandeln:

Definition von Open-Source- und Closed-Source-LLMs
Architektonische Transparenz und Anpassbarkeit
Leistungsbenchmarking
Rechenanforderungen
Anwendungsvielfalt
Zugänglichkeit und Lizenzierung
Datenschutz und Vertraulichkeit
Kommerzielle Unterstützung und Unterstützung

Am Ende verfügen Sie über einen fundierten Überblick über die technischen Kompromisse zwischen Open-Source- und Closed-Source-LLMs, um Ihre eigene KI-Strategie zu steuern. Lass uns eintauchen!

Definition von Open-Source- und Closed-Source-LLMs

Open-Source-LLMs verfügen über öffentlich zugängliche Modellarchitekturen, Quellcode und Gewichtsparameter. Dadurch können Forscher das Innere untersuchen, die Qualität bewerten, Ergebnisse reproduzieren und benutzerdefinierte Varianten erstellen. Zu den führenden Beispielen zählen ConstitutionalAI von Anthropic, LLaMA von Meta und GPT-NeoX von EleutherAI.

Im Gegensatz dazu behandeln Closed-Source-LLMs die Modellarchitektur und -gewichte als proprietäre Vermögenswerte. Kommerzielle Unternehmen wie Anthropic, DeepMind und OpenAI entwickeln sie intern. Ohne zugänglichen Code oder Designdetails stoßen Reproduzierbarkeit und Anpassung an Einschränkungen.

Architektonische Transparenz und Anpassbarkeit

Der Zugriff auf Open-Source-LLM-Interna eröffnet Anpassungsmöglichkeiten, die mit Closed-Source-Alternativen einfach nicht möglich sind.

Durch die Anpassung der Modellarchitektur können Forscher Techniken wie die Einführung einer spärlichen Konnektivität zwischen Schichten oder das Hinzufügen dedizierter Klassifizierungs-Tokens erkunden, um die Leistung bei Nischenaufgaben zu verbessern. Durch den Zugriff auf Gewichtsparameter können Entwickler vorhandene Darstellungen übertragen oder Varianten mit vorab trainierten Bausteinen wie T5- und BERT-Einbettungen initialisieren.

Durch diese Anpassbarkeit können Open-Source-LLMs spezielle Bereiche wie biomedizinische Forschung, Codegenerierung und Bildung besser bedienen. Das erforderliche Fachwissen kann jedoch die Hürde für die Bereitstellung von Implementierungen in Produktionsqualität erhöhen.

Closed-Source-LLMs bieten nur begrenzte Anpassungsmöglichkeiten, da ihre technischen Details proprietär bleiben. Ihre Unterstützer investieren jedoch umfangreiche Ressourcen in die interne Forschung und Entwicklung. Die daraus resultierenden Systeme gehen bis an die Grenzen dessen, was mit einer verallgemeinerten LLM-Architektur möglich ist.

Closed-Source-LLMs sind zwar weniger flexibel, eignen sich aber hervorragend für allgemein anwendbare Aufgaben in natürlicher Sprache. Sie vereinfachen außerdem die Integration, indem sie sich an etablierte Schnittstellen wie den OpenAPI-Standard anpassen.

Leistungsbenchmarking

Trotz architektonischer Transparenz bringt die Messung der Open-Source-LLM-Leistung Herausforderungen mit sich. Ihre Flexibilität ermöglicht unzählige mögliche Konfigurationen und Tuning-Strategien. Es ermöglicht auch, dass Modelle mit dem Präfix „Open Source“ tatsächlich proprietäre Techniken enthalten, die Vergleiche verzerren.

Closed-Source-LLMs verfügen über klarer definierte Leistungsziele, da ihre Unterstützer spezifische Metrikschwellenwerte messen und bekannt geben. Anthropic macht beispielsweise die Genauigkeit von ConstitutionalAI bei kuratierten NLU-Problemsätzen bekannt. Microsoft hebt hervor, wie GPT-4 die menschlichen Grundlagen im SuperGLUE-Sprachverständnis-Toolkit übertrifft.

Allerdings wurden diese eng definierten Benchmarks kritisiert, weil sie die Leistung bei realen Aufgaben überbewerteten und Fehler unterrepräsentierten. Eine wirklich unvoreingenommene LLM-Bewertung bleibt eine offene Forschungsfrage – sowohl für Open- als auch für Closed-Source-Ansätze.

Rechnerische Anforderungen

Das Training großer Sprachmodelle erfordert umfangreiche Rechenressourcen. OpenAI gab Millionen für das Training von GPT-3 in der Cloud-Infrastruktur aus, während Anthropic GPUs im Wert von über 10 Millionen US-Dollar für ConstitutionalAI verbrauchte.

Der Gesetzentwurf für solche Modelle schließt die meisten Einzelpersonen und kleinen Teams aus der Open-Source-Community aus. Tatsächlich musste EleutherAI das GPT-J-Modell aufgrund explodierender Hosting-Kosten aus dem öffentlichen Zugriff entfernen.

Ohne große finanzielle Mittel nutzen Open-Source-LLM-Erfolgsgeschichten gespendete Computerressourcen. LAION kuratierte sein technologieorientiertes LAION-5B-Modell mithilfe von Crowdsourcing-Daten. Das gemeinnützige Projekt Anthropic ConstitutionalAI nutzte freiwilliges Computing.

Die große Technologieunterstützung von Unternehmen wie Google, Meta und Baidu bietet Closed-Source-Bemühungen den nötigen finanziellen Treibstoff für die Industrialisierung der LLM-Entwicklung. Dies ermöglicht eine Skalierung in Größenordnungen, die für Basisinitiativen unvorstellbar sind – sehen Sie sich einfach das 280 Milliarden Parameter umfassende Gopher-Modell von DeepMind an.

Anwendungsvielfalt

Die Anpassbarkeit von Open-Source-LLMs ermöglicht die Bewältigung hochspezialisierter Anwendungsfälle. Forscher können Modellinterna aggressiv modifizieren, um die Leistung bei Nischenaufgaben wie der Vorhersage der Proteinstruktur, der Erstellung von Codedokumentationen und der Überprüfung mathematischer Beweise zu steigern.

Allerdings ist die Möglichkeit, auf Code zuzugreifen und ihn zu bearbeiten, keine Garantie für eine effektive domänenspezifische Lösung ohne die richtigen Daten. Umfassende Trainingsdatensätze für begrenzte Anwendungen erfordern erheblichen Aufwand bei der Kuratierung und Aktualisierung.

Hier profitieren Closed-Source-LLMs von den Ressourcen, Trainingsdaten aus internen Repositories und kommerziellen Partnern zu beziehen. DeepMind lizenziert beispielsweise Datenbanken wie ChEMBL für Chemie und UniProt für Proteine, um die Anwendungsreichweite zu erweitern. Der Datenzugriff im industriellen Maßstab ermöglicht es Modellen wie Gopher, trotz architektonischer Undurchsichtigkeit eine bemerkenswerte Vielseitigkeit zu erreichen.

Zugänglichkeit und Lizenzierung

Die freizügige Lizenzierung von Open-Source-LLMs fördert den freien Zugang und die Zusammenarbeit. Modelle wie GPT-NeoX, LLaMA und Jurassic-1 Jumbo nutzen Vereinbarungen wie Creative Commons und Apache 2.0, um nichtkommerzielle Forschung und faire Kommerzialisierung zu ermöglichen.

Im Gegensatz dazu unterliegen Closed-Source-LLMs restriktiven Lizenzen, die die Modellverfügbarkeit einschränken. Kommerzielle Unternehmen kontrollieren den Zugriff streng, um potenzielle Einnahmequellen aus Vorhersage-APIs und Unternehmenspartnerschaften zu schützen.

Verständlicherweise verlangen Organisationen wie Anthropic und Cohere Gebühren für den Zugriff auf ConstitutionalAI- und Cohere-512-Schnittstellen. Dies birgt jedoch die Gefahr, dass wichtige Forschungsbereiche verdrängt werden und die Entwicklung auf gut finanzierte Industrien verlagert wird.

Auch die offene Lizenzierung bringt Herausforderungen mit sich, insbesondere im Hinblick auf Namensnennung und Haftung. Für Forschungsanwendungsfälle bieten die Freiheiten, die die Open-Source-Zugänglichkeit bietet, jedoch klare Vorteile.

Datenschutz und Vertraulichkeit

Trainingsdatensätze für LLMs aggregieren typischerweise Inhalte aus verschiedenen Online-Quellen wie Webseiten, wissenschaftlichen Artikeln und Diskussionsforen. Dadurch besteht die Gefahr, dass personenbezogene oder anderweitig sensible Informationen in Modellausgaben ans Licht kommen.

Für Open-Source-LLMs bietet die Prüfung der Zusammensetzung von Datensätzen den besten Schutz vor Vertraulichkeitsproblemen. Die Auswertung von Datenquellen, Filterverfahren und die Dokumentation von Beispielen, die während des Tests gefunden wurden, können dabei helfen, Schwachstellen zu identifizieren.

Leider schließen Closed-Source-LLMs eine solche öffentliche Prüfung aus. Stattdessen müssen sich Verbraucher auf die Strenge interner Überprüfungsprozesse verlassen, die auf angekündigten Richtlinien basieren. Zum Vergleich: Azure Cognitive Services verspricht, personenbezogene Daten zu filtern, während Google formelle Datenschutzüberprüfungen und Datenkennzeichnung vorgibt.

Insgesamt ermöglichen Open-Source-LLMs eine proaktivere Identifizierung von Vertraulichkeitsrisiken in KI-Systemen, bevor sich diese Mängel in großem Umfang manifestieren. Geschlossene Pendants bieten relativ begrenzte Transparenz über die Datenverarbeitungspraktiken.

Kommerzielle Unterstützung und Unterstützung

Das Potenzial zur Monetarisierung von Closed-Source-LLMs schafft Anreize für erhebliche kommerzielle Investitionen in Entwicklung und Wartung. In der Erwartung lukrativer Erträge aus seinem Azure-KI-Portfolio stimmte Microsoft beispielsweise milliardenschweren Partnerschaften mit OpenAI rund um GPT-Modelle zu.

Im Gegensatz dazu sind Open-Source-LLMs auf Freiwillige angewiesen, die ihre persönliche Zeit für den Unterhalt aufwenden, oder auf Zuschüsse, die eine zeitlich begrenzte Finanzierung bereitstellen. Diese Ressourcenasymmetrie gefährdet die Kontinuität und Langlebigkeit von Open-Source-Projekten.

Die Hindernisse für die Kommerzialisierung geben Open-Source-Gemeinschaften jedoch auch die Möglichkeit, sich auf den wissenschaftlichen Fortschritt statt auf den Profit zu konzentrieren. Und die dezentrale Natur offener Ökosysteme verringert die übermäßige Abhängigkeit vom nachhaltigen Interesse eines einzelnen Geldgebers.

Letztendlich bringt jeder Ansatz Kompromisse in Bezug auf Ressourcen und Anreize mit sich. Closed-Source-LLMs genießen eine größere Finanzierungssicherheit, konzentrieren aber ihren Einfluss. Offene Ökosysteme fördern die Vielfalt, leiden jedoch unter erhöhter Unsicherheit.

Navigieren in der Open-Source- und Closed-Source-LLM-Landschaft

Die Entscheidung zwischen Open-Source- oder Closed-Source-LLMs erfordert die Abstimmung organisatorischer Prioritäten wie Anpassbarkeit, Zugänglichkeit und Skalierbarkeit mit den Modellfunktionen.

Für Forscher und Startups bietet Open Source mehr Kontrolle, um Modelle an bestimmte Aufgaben anzupassen. Die Lizenzierung erleichtert auch den kostenlosen Austausch von Erkenntnissen zwischen Mitarbeitern. Allerdings kann die Belastung durch die Beschaffung von Trainingsdaten und -infrastruktur die Realisierbarkeit gefährden.

Umgekehrt versprechen Closed-Source-LLMs dank ausreichender Finanzierung und Daten erhebliche Qualitätsverbesserungen. Allerdings schränken Zugriffs- und Änderungsbeschränkungen die wissenschaftliche Transparenz ein und binden Bereitstellungen gleichzeitig an Anbieter-Roadmaps.

In der Praxis können offene Standards rund um Architekturspezifikationen, Modellprüfpunkte und Bewertungsdaten dazu beitragen, die Nachteile beider Ansätze auszugleichen. Gemeinsame Grundlagen wie Googles Transformer oder Oxfords REALTO-Benchmarks verbessern die Reproduzierbarkeit. Interoperabilitätsstandards wie ONNX ermöglichen das Mischen von Komponenten aus offenen und geschlossenen Quellen.

Letztendlich kommt es darauf an, das richtige Tool – Open Source oder Closed Source – für die jeweilige Aufgabe auszuwählen. Die kommerziellen Unternehmen, die Closed-Source-LLMs unterstützen, verfügen über unbestreitbaren Einfluss. Aber die Leidenschaft und die Prinzipien der Open-Science-Gemeinschaften werden weiterhin eine entscheidende Rolle beim Fortschritt der KI spielen.

Als nächstes

Neue Technologietrends für 2024: Der Bericht von Mastercard enthüllt die Auswirkungen generativer KI auf den Handel

Verpassen Sie nicht

Der Stand mehrsprachiger LLMs: Über Englisch hinausgehen

Aayush Mittal

Ich habe die letzten fünf Jahre damit verbracht, in die faszinierende Welt des maschinellen Lernens und des Deep Learning einzutauchen. Meine Leidenschaft und mein Fachwissen haben dazu geführt, dass ich an über 50 verschiedenen Software-Engineering-Projekten mitgewirkt habe, mit besonderem Schwerpunkt auf KI/ML. Meine anhaltende Neugier hat mich auch zur Verarbeitung natürlicher Sprache geführt, einem Bereich, den ich gerne weiter erforschen möchte.