Vordenker

Das Überall-Problem: Warum “Daten Überall” zum definierenden Infrastruktur-Herausforderung der KI-Ära wird

mm

Die folgenreichste Frage in der KI heute ist nicht, welches Modell am cleversten ist. Es ist, wo die Daten leben und ob die Intelligenz sie erreichen kann.

Für den größten Teil eines Jahrzehnts operierte die KI-Industrie unter einer beruhigenden Prämisse: Zentralisieren Sie die Daten, zentralisieren Sie die Rechenleistung, und Genialität wird folgen. Das Hyperscaler-Modell – Zentralisieren von großen Trainingsdatensätzen in großen Cloud-Clustern und Anwenden von massiver GPU-Rechenleistung, um sie in Modellparameter zu komprimieren – produzierte außergewöhnliche Ergebnisse, aber auch eine Architektur, die jetzt unter dem Gewicht ihres eigenen Erfolgs leidet.

Nennen wir es das “Daten-überall-Problem”. Wenn die KI aus dem Forschungslabor und in die Betriebsstruktur von Krankenhäusern, Fabriken, Finanzinstituten und souveränen Regierungen ausblutet, sind die Daten, die diese Systeme informieren müssen, inhärent verteilt, juristisch eingeschränkt und operativ unbeweglich. Regulierungsbehörden in Europa bestehen darauf, dass die Finanzunterlagen ihrer Bürger nie den Kontinent verlassen. Die klinischen Versuchsdaten eines Pharmaunternehmens in Basel können nicht legal in einem Cloud-Bucket mit einem Genomik-Datensatz aus Seoul zusammenleben.

Was auch immer der Fall ist, die Intelligenz muss zu den Daten gehen. Die Daten, betont, werden nicht zu der Intelligenz kommen.

Die Ökonomie des Wandels

Diese strukturelle Spannung wird durch eine gleichzeitige Revolution in der KI-Ökonomie verschärft. Die Branche durchläuft eine tektonische Neubewertung von trainingszentriert zu inferenzzentriertem Ausgaben und die Auswirkungen auf die Datenarchitektur sind tiefgreifend.

Deloitte schätzte , dass Inferenz-Workloads im Jahr 2025 etwa die Hälfte aller KI-Rechenleistung ausmachten, eine Zahl, die 2026 auf zwei Drittel ansteigen wird. Das Verhältnis kehrt sich mit atemberaubender Geschwindigkeit um. Analysten schätzen, dass die Inferenz-Nachfrage 2026 die Trainings-Nachfrage um 118 Mal übersteigen wird. Bis 2030 könnten Inferenzkosten 75% der gesamten KI-Rechenleistung ausmachen und 7 Billionen US-Dollar in Infrastruktur-Investitionen antreiben.

Die Kostenmathematik ist ebenso atemberaubend. Für jeden US-Dollar, der für das Training eines KI-Modells ausgegeben wird, stehen den Organisationen 15-20 Milliarden US-Dollar an Inferenzkosten über die Lebensdauer des Modells gegenüber: ein Verhältnis, das durch GPT-4 verdeutlicht wird, dessen Trainingskosten etwa 150 Millionen US-Dollar betrugen, während die kumulativen Inferenzkosten bis Ende 2024 2,3 Milliarden US-Dollar erreichten. Das Training, einst die Schlagzeile der KI-Investoren und Beschaffungsbeamten, wird nun als einmalige Schulgebühr umdefiniert. Die Inferenz ist der laufende Betriebskosten der Intelligenz und sie ist jetzt der dominierende Posten.

Und hier liegt das Paradox: Inferenzkosten für ein GPT-3.5-System fielen zwischen November 2022 und Oktober 2024 um mehr als 280-fach, während die Hardwarekosten etwa 30% pro Jahr sanken und die Energieeffizienz um 40% pro Jahr verbessert wurde. Die Preise sinken; der Verbrauch beschleunigt sich schneller. Die Kosten pro Einheit sanken um 100 Mal, während Microsoft und Google einen Anstieg der KI-Workloads um 31 Mal in der Hälfte dieser Zeit meldeten.

Die Jevons-Paradox, bei dem Effizienzgewinne zu einer größeren Ressourcennutzung führen, hat in GPU-Clustern eine moderne Ausprägung gefunden.

Wo Daten leben, muss Intelligenz folgen

Die Inferenzwirtschaft verändert die Infrastrukturanforderungen grundlegend, und nirgendwo mehr als bei der Daten-Schwerkraft. Im Gegensatz zum Training ist die Inferenz kein Batch-Job, der einmal in einem Rechenzentrum ausgeführt wird. Sie ist ein kontinuierlicher, latenzsensibler, geografisch verteilter Dienst und nur so gut wie die Daten, die sie im Moment der Abfrage erreichen kann.

Dies ist das Kernstück der Daten-überall-Herausforderung.

Beispielsweise kann ein Sprachmodell, das über eine Patienten-ICU-Telemetrie nachdenkt, es sich nicht leisten, eine 200-Millisekunden-Rundreise zu einem Hyperscaler-Cluster an der Ostküste zu unternehmen. Ein Finanzdienstleistungs-Betrugsmodell, das bei der Transaktion Inferenz ausführt, kann keine Kontodaten in eine Rechtsordnung exfiltrieren, in der es gegen die DSGVO verstoßen würde. Eine souveräne KI-Entwicklung kann nicht auf Infrastruktur basieren, die von einer ausländischen kommerziellen Einheit besessen und betrieben wird.

Die Frontier-Labore sind sich dessen sehr bewusst. Anthropics Vereinbarung mit Google Cloud für bis zu eine Million TPUs, die über eine Gigawatt KI-Rechenleistung bis 2026 liefern, zeigt, wie führende Labore in beispielloser Größenordnung investieren, um die globale Infrastruktur-Fußabdruck der Inferenz zu formen.

Eine Taxonomie der Datenintensität

Nicht alle KI-Systeme stellen diese Herausforderung identisch dar, und es ist lehrreich, eine grobe Taxonomie zu betrachten, da es verschiedene Arten von KI-Modellen und Komplexität gibt. Lassen Sie uns das mit drei Kernbeispielen aufschlüsseln: LLMs, Bild- und physische Modelle.

Große Sprachmodelle – die Claude-, GPT- und Gemini-Familien – beschäftigen sich hauptsächlich mit Sprachtoken: relativ leicht, komprimierbar und anfällig für privatsphäreerhaltende Techniken wie differentielle Privatsphäre oder föderiertes Lernen. Ihr Daten-überall-Problem ist sehr komplex.

Generative visuelle Modelle stellen einen noch härteren Fall dar. Systeme wie Black Forest Labs’ FLUX.2 können hochauflösende, photorealistische Bilder in unter einer Sekunde auf leistungsstarken Hardware produzieren, aber die Erzeugung eines einzelnen Bildes erfordert viel mehr Daten und Rechenleistung als die Erzeugung von Text. Wenn visuelle KI über kreative Tools hinaus in industrielle Inspektion, medizinische Bildgebung und Satellitenanalyse eintritt, sind die zugrunde liegenden Daten oft groß, sensibel und schwer zu bewegen, was den Bedarf an der Ausführung von KI erhöht, wo die Daten bereits residieren.

Die komplexeste Kategorie ist die physische KI. NVIDIA’s Jensen Huang hat erklärt, dass “physische KI angekommen ist und jedes Industrieunternehmen zu einem Robotik-Unternehmen werden wird”. Neue Modelle wie NVIDIA’s Cosmos 3 sollen Maschinen ein allgemeines Verständnis der physischen Welt vermitteln, indem sie Simulation, Sicht und Vernunft kombinieren, während Unternehmen wie Physical Intelligence Roboter auf Echtzeit-Sensordaten – einschließlich Kraft, Bewegung und visuellen Eingaben – trainieren, um mehr anpassungsfähiges, autonomes Verhalten zu ermöglichen.

Die gleichen Skalierungs-Dynamiken, die große Denkmodelle verbessert haben, werden jetzt auf Echtzeit-Daten wie Vibration, Klang und Sensoreingaben angewendet. Aber diese Informationen sind inhärent lokal. Ein Roboter auf einem Fabrikboden kann nicht Echtzeit-Visions- und Berührungsinformationen an eine entfernte Cloud senden, ohne Verzögerungen einzuführen, die Sicherheitsrisiken schaffen könnten, was bedeutet, dass KI zunehmend am Rand, in der Nähe der Datenquelle, ausgeführt werden muss.

Vertrauen, Erklärbarkeit und Ergebnisse

Dies ist der Punkt, an dem die Daten-überall-Herausforderung über die Infrastruktur hinausgeht und zu einer Regierungsfrage wird. Wenn KI auf hochriskante Entscheidungen – von Gesundheitsdiagnosen bis hin zu Finanzrisikomodellen und physischen Kontrollsystemen – angewendet wird, sind Fragen nach dem Wohnort der Daten zunehmend mit der Frage verbunden, wer für die Ergebnisse verantwortlich ist.

In der heutigen Regulierungs-Umgebung ist Erklärbarkeit nicht optional. Der EU-KI-Gesetz, zum Beispiel, erfordert, dass Hochrisiko-Systeme die Grundlage für ihre Ausgaben demonstrieren, was schwierig ist, wenn die Daten, die diese Entscheidungen informieren, über mehrere Systeme, Rechtsordnungen und Regulierungsrahmen verteilt sind.

Vertrauen wird daher zur Voraussetzung für die Übernahme im großen Maßstab. Die Kontrolle über die Datenumgebung wird ebenso wichtig wie die Kontrolle über die Modelle selbst.

Die nächste Generation der KI-Infrastruktur

Die Lösung der Daten-überall-Herausforderung wird die Wettbewerbskarte der KI für das nächste Jahrzehnt definieren. Föderierte Inferenz, sichere Datenverarbeitungsumgebungen, am Rand optimierte Modelle und Orchestrierungssysteme, die berücksichtigen, wo Daten residieren dürfen, sind nicht Nischen-Technikfunktionen, sondern Voraussetzungen für die Expansion der KI über die Anwendungsfälle hinaus, in denen Daten frei zentralisiert werden können.

Die Unternehmen und Regierungen, die Infrastrukturen aufbauen, die vertrauenswürdige, erklärbare, souveräne Inferenz – Intelligenz, die die Daten erreicht, anstatt zu verlangen, dass die Daten zu ihr reisen – liefern können, werden die dauerhaftesten Vorteile der KI-Ära haben. Das Training eines clevereren Modells ist zunehmend ein gelöstes und kommodifiziertes Problem. Die verantwortungsvolle Bereitstellung, am Rand, über Rechtsordnungen hinweg, gegen Daten, die nicht bewegt werden können, ist das Problem, das bleibt.

Daten überall sind kein Slogan. Es ist das härteste ungelöste Problem im Unternehmens-KI-Bereich. Und es wird bestimmen, ob die außergewöhnliche Fähigkeit, die durch die Investitionen der letzten Dekade im Training freigeschaltet wurde, jemals in Ergebnisse übersetzt wird, die die Welt vertrauen kann.

Als Chief Strategy Officer leitet Abhas die gesamte Unternehmensstrategie für Cloudera und ist verantwortlich für die Erstellung der Unternehmensvision, den Aufbau des Geschäfts- und Kundenzielbetriebsmodells, die Kommunikation damit an wichtige Stakeholder über klar definierte OKRs und die Durchführung wichtiger Transformationsinitiativen, um diesen Plan zu verwirklichen. Er ist auch damit betraut, Wachstum und Innovation voranzutreiben und angemessene Build-/Buy-Partnerentscheidungen zu treffen, einschließlich Preisgestaltung und Verpackung, Unternehmensentwicklung und Clouderas Innovationsbeschleuniger, um neue Produkte zu starten. Zuvor war er als Chief of Staff und Vice President für Geschäftstransformation im Unternehmen tätig.

Vor der Cloudera/Hortonworks-Fusion half er dabei, Hortonworks' Go-to-Market-Bemühungen als globaler Leiter für Kundeninnovation und Wertmanagement zu skalieren. Als Managementberater ausgebildet, ist er leidenschaftlich daran interessiert, Handlungen und Veränderungen in der Gesellschaft voranzutreiben und hat Projekte mit mehreren Organisationen geleitet, darunter die Weltwirtschaftsforum, Founders of the Future und andere Non-Profit-Organisationen.