Connect with us

Vordenker

Die nächste AI-Krise wird kein Modellversagen sein. Es wird ein Systemversagen sein.

mm
A wide, clean photograph inside a modern data center aisle with rows of server racks under cool blue lighting. On the right, blue neon energy light trails emanate from a server, representing flowing data and scalable AI infrastructure.

KI und agente KI sind in den letzten Jahren im Unternehmen zu Buzzwords geworden, und die Menge der Investitionen und das Tempo des Marktes sind ein wichtiger Indikator für die steigenden KI-Erwartungen. Allein im ersten Halbjahr 2026 wurden Milliarden von Dollar in KI-Unternehmen wie OpenAI und CoreWeave investiert, was zeigt, dass KI in den kommenden Jahren im Unternehmen weiterhin eine Priorität sein wird.

Diese steigenden Investitionen scheinen darauf abzuzielen, KI von der experimentellen Phase in die Produktionsbereitstellung zu skalieren. Tatsächlich zeigt der jüngste Bericht von Cockroach Labs – The State of AI Infrastructure 2026 – dass 98 % der globalen Technologie-Exekutiven mindestens ein KI-Projekt in den letzten 12 Monaten von der Pilot- in die Produktionsphase überführt haben, in der Hoffnung, ein echtes ROI zu erzielen. Allerdings stellt sich, wenn Organisationen weiter in die Produktionsphase übergehen, eine Frage: Kann die Infrastruktur die Nachfrage und die Geschwindigkeit, mit der diese KI-Projekte skaliert werden, unterstützen?

Warum die aktuelle Infrastruktur nicht mit den KI-Anforderungen übereinstimmt

KI-Workloads stellen neue Herausforderungen im Unternehmen dar, die bisher noch nicht bewältigt wurden. Insbesondere: Einzelhändler erwarten einen Ansturm auf ihre Websites während der Black-Friday- und Cyber-Monday-Veranstaltungen, genau wie Sportwetten-Unternehmen wissen, dass der Super-Bowl-Sonntag einen Ansturm auf ihre Websites verursachen wird. Doch diese Anstürme resultieren alle aus menschlicher Aktivität, die Pausen und Spitzenzeiten ermöglicht und nicht kontinuierlich läuft.

Die Legacy-Systeme, auf denen viele Unternehmen ihre KI-Projekte aufbauen, wurden für menschlichen Datenverkehr mit Klicks, Pausen und Spitzenzeiten entwickelt. KI-Agents funktionieren nicht so; sie laufen 24 Stunden am Tag, 7 Tage die Woche mit Maschinengeschwindigkeit. Mit dem schnellen Auftreten autonomer, maschinengesteuerter Workloads erreichen Architekturen Grenzen, die sie ursprünglich nicht bewältigen sollten. Und wenn Einzelhändler und Wettanbieter bereits mit menschlicher Aktivität überlastet sind, sind sie nicht einmal ansatzweise darauf vorbereitet, mit kontinuierlich operierenden KI-Agents Schritt zu halten.

Derzeit erleben Organisationen im Durchschnitt 86 Ausfälle pro Jahr. Zusätzlich glauben 83 % davon, dass ihre Dateninfrastruktur aufgrund des Gewichts der KI innerhalb des nächsten Jahres versagen wird, wobei 34 % nicht einmal erwarten, dass sie die nächsten 11 Monate überstehen. Und die KI-Nachfrage beschleunigt sich weiter. Eine Modernisierung ist nicht länger eine nette Option, sondern eine Notwendigkeit.

Die Folgen, die Infrastruktur unverändert zu lassen

Während die meisten Organisationen sich der Infrastrukturanforderungen bewusst sind, die KI für einen reibungslosen Betrieb erfordert, bleiben die meisten unvorbereitet, um die notwendigen Änderungen vorzunehmen, um Systemausfälle zu verhindern. Fast zwei Drittel (63 %) der Tech-Führer sagen, dass ihre Teams die Geschwindigkeit, mit der KI-Anforderungen die bestehende Dateninfrastruktur überholen, unterschätzen, was zeigt, dass, obwohl Fortschritte bei der KI-Implementierung erzielt werden, nichts unternommen wird, um eine Katastrophe zu verhindern. Während System-Upgrades und -Umstrukturierungen wie ein langfristiger, teurer Investition erscheinen mögen, sind die Kosten für KI-bedingte Ausfälle noch bedeutender.

Derzeit schätzen über die Hälfte (57 %) der Organisationen, dass bereits eine Stunde KI-bedingter Ausfall 100.000 Dollar oder mehr kosten würde, und je größer die Organisation, desto höher die Kosten. Selbst wenn der Betrieb 99,9 % der Zeit läuft, entspricht dies 0,1 % Ausfallzeit pro Jahr, was 9 Stunden Ausfallzeit pro Jahr bedeutet, bei denen 100.000 Dollar oder mehr pro Stunde verloren gehen; ein Verlust, den die meisten nicht budgetiert haben. Für saisonale Workloads und extreme Spitzen (wie Black Friday und Super Bowl Sunday) riskieren Organisationen geschäftskritische Verluste. Neben finanziellem Verlust droht Unternehmen auch der Verlust des Vertrauens der Verbraucher. Vertrauen ist bereits fragil, wenn es um Ausfälle geht, da 50 % der Online-Einkäufer wahrscheinlich zu einer anderen Marke wechseln, wenn ein Ausfall oder ein Checkout-Fehler auftritt. Die Einsätze für die Aufrechterhaltung des Online-Betriebs sind höher denn je.

Erreichung operativer Widerstandsfähigkeit mit verteilten Architekturen

Wenn es darum geht, die Infrastruktur so umzugestalten, dass sie die intensiven Anforderungen von KI-Workloads unterstützen kann, muss die operative Widerstandsfähigkeit im Vordergrund der Strategie stehen. Mit der Skalierung von KI-Infrastrukturen (55 %), der Erforschung neuer Anwendungsfälle (51 %) und der Stärkung der Widerstandsfähigkeit (51 %) als Top-Strategien, um das Gewicht der KI-Skalierung zu bekämpfen, ist es entscheidend, von der Grundlage aus zu beginnen, um operative Widerstandsfähigkeit zu liefern. Dies kann verwirklicht werden, indem KI-fähige Grundlagen, Kosten, Skalierbarkeit und Widerstandsfähigkeit im Vordergrund stehen, und das ist der Punkt, an dem verteilte Datenbankarchitekturen ihre Stärke entfalten.

Tech-Führer nennen die Integration höherer Durchsatzraten (50 %), bessere Beobachtbarkeit für Kostenkontrolle (48 %) und elastische Skalierbarkeit, um mit unvorhersehbaren KI-Workloads Schritt zu halten (47 %), als wichtigste Erfolgsfaktoren. Mit ihrer Fähigkeit, nahtlos zu skalierten, bieten verteilte SQL-Datenbanken Unternehmen die elastische Skalierbarkeit, die notwendig ist, um sich gemeinsam mit KI-Workloads zu entwickeln, sowie die Fähigkeit, ohne manuelles Eingreifen von Fehlern zu erholen.

Wie bei allen Migrationen dauert es Zeit, von Legacy- zu modernen Systemen zu migrieren. Im Durchschnitt dauert der Wechsel zu verteilten Architekturen etwa 10 Monate und kostet etwa 200.000 Dollar. Unternehmen, die den Sprung wagen, finden, dass die Einsparungen bis zu 700.000 Dollar im ersten Jahr allein betragen. Mit einem starken ROI bereits im ersten Jahr ermöglichen Investitionen in modernisierte Grundlagen, dass massive KI-Investitionen langfristig Früchte tragen, ohne dass man sich um Skalierungs- oder Ausfallrisiken sorgen muss.

Die KI-Nachfrage vorzeitig erfüllen

Die Widerstandsfähigkeit ist in Infrastrukturanwendungen die schwierigste und dringlichste Herausforderung, und jetzt ist der Zeitpunkt, um Probleme anzugehen, bevor Systeme zusammenbrechen und die ROI von KI-Projekten mitnehmen. Agente KI beschleunigt alles im Unternehmen, von potenziellen Umsätzen bis hin zu Kundenanforderungen und Workloads. Während der Beschleunigung legt KI auch die architektonische Fragilität und das geringe Vertrauen der Tech-Führer in die Infrastruktur, die erforderlich ist, um zunehmende Workloads zu unterstützen, offen.

Wenn wir in die nächste Ära von KI-Workloads übergehen, werden Führer von der Frage, wie schnell KI übernommen werden kann, zu der Frage übergehen, ob ihre Infrastruktur überleben wird, wenn KI ihre volle Skalierung erreicht. Durch die Behebung der zugrunde liegenden infrastrukturellen Probleme und die Übernahme von Datenbanken, die die Skalierbarkeit, Flexibilität und Konsistenz unterstützen, die erforderlich sind, um KI-Systeme am Laufen zu halten, werden Führer bereit sein, KI im Jahr 2026 und darüber hinaus zu meistern.

Rob Reid ist ein Technical Evangelist bei Cockroach Labs, wo er Entwicklern und Organisationen hilft, widerstandsfähige, skalierbare Anwendungen mit verteiltem SQL zu erstellen. Als erfahrener Software-Ingenieur mit Sitz in London hat Rob in verschiedenen Branchen wie Finanzen, Einzelhandel, Telekommunikation und Sportwetten gearbeitet und Backend-, Frontend- und Messaging-Systeme entwickelt. Er ist Autor von Practical CockroachDB und CockroachDB: The Definitive Guide und ein häufiger Sprecher, Schriftsteller und Pädagoge zu Themen wie verteilte Systeme, Multi-Region-Architektur und Anwendungsresilienz.