Vordenker
Die verÀnderte Cloud-Prognose

Ein Muster, das ich bereits gesehen habe
Ich war bereits berufstätig, als die Cloud zum Thema wurde. Von diesem Standpunkt aus sah ich die anfängliche Übernahme: die Begeisterung, die Flexibilität, das Gefühl, dass alles schneller werden würde. Dies führte zu einer massiven Übernahme, bei der jede Workload ein Kandidat war und jeder Anbieter eine Cloud-Geschichte hatte.
Die Übernahme war jedoch nur die erste Hälfte dessen, was ich beobachtet habe. Dann sah ich die andere Seite: Repatriierung. Unternehmen, die bestimmte Workloads zurückverlagerten, und sich fragten, ob jede Anwendung wirklich Cloud-Flexibilität benötigte. Dieser zweite Schritt geschah aus einem Grund. Mit wirtschaftlichen Verschiebungen und Workload-Reife hörten die Annahmen, die die Cloud zur offensichtlichen Wahl für fast alles gemacht hatten, auf, zu halten, sobald Organisationen sie im großen Maßstab untersuchten.
Da ich den vollen Bogen bereits einmal durchlebt habe, erkenne ich seine Form, wenn er wieder beginnt. Jetzt, da ich Unternehmen helfe, herauszufinden, was AI in ihren Umgebungen eigentlich tun sollte, beginnt das Muster der massiven Übernahme/Repatriierung wieder vertraut auszusehen.
Die Cloud-Korrektur
Um zu verstehen, warum die Ähnlichkeit wichtig ist, hilft es, mit dem zu beginnen, was tatsächlich mit der Cloud passierte, auf ihre eigenen Bedingungen. Der Wechsel zur Cloud war rational. Er entfernte Reibung, gab Organisationen Flexibilität und Geschwindigkeit und machte Sinn für Workloads, die unsicher oder schnell ändernd waren. Es war rational, weil es für die spezifische Art von Arbeit gebaut war, für die es konzipiert war. DevOps-Teams gingen cloud-first, weil die Cloud für Arbeit gebaut war, die iterativ, variabel oder schwer vorherzusagen war.
Aber das, wofür sie bauten, blieb nicht still. Die Cloud änderte sich nicht, aber die Workloads änderten sich. Als Prozesse gereift und vorhersehbar wurden, gewöhnten sich Organisationen an die Kosten, um ihre eigenen Daten zurückzubekommen. Egress-Gebühren, Speicherkosten, Transfergebühren: Ausgaben, die leicht zu ignorieren waren, als die Flexibilität es wert war, und schwer zu ignorieren, sobald die Workloads stabilisiert wurden. Im Jahr 2024, nach Jahren, in denen sie für Daten-Egress berechnet hatten, hoben AWS, Azure und Google Cloud alle diese Gebühren für Kunden auf, die ihre Plattformen verließen, wie DataCenterDynamics berichtete.
Sobald diese Kosten sichtbar wurden, hörte die Mathematik auf, für einen wachsenden Teil des Portfolios zu funktionieren. Die Ökonomie, die die Cloud zu einer guten Strategie mit einigen Nachteilen gemacht hatte, wurde für eine wachsende Anzahl von AI-orientierten Workloads nicht mehr wirtschaftlich tragbar. Unternehmen schärften ihre Bleistifte und fragten, ob jede Anwendung wirklich das benötigte, was die Cloud bot. Als sie tatsächlich die Zahlen lieferten, war die Antwort für viele Workloads nein.
Diese angesammelten Antworten wurden zu einer Korrektur, die die Branche falsch bezeichnete. Diese Korrektur wurde als “Cloud-Repatriierung” bezeichnet und wird meistens falsch beschrieben. Es handelt sich tatsächlich um Workload-Reife: reife Unternehmen lernen, jede Workload der Infrastruktur zuzuordnen, die sie passt. Die Daten unterstützen die selektive Lektüre anstelle der gesamten. IDC fand heraus, dass etwa 80 % der Organisationen in den nächsten 12 Monaten eine gewisse Repatriierung erwarten, während weniger als 10 % ihre gesamten Workloads repatriiert haben, wie in CIO.com berichtet wird.
Wenn man es richtig liest, lautet die Schlussfolgerung nicht, dass die Cloud ein Fehler war. Die Cloud bleibt wertvoll, aber sie hat aufgehört, universal zu sein. Der reife Zustand ist hybrid: Cloud, wo sie ihren Platz verdient hat, private oder dedizierte Infrastruktur überall sonst.
Ähnliche Korrekturkurve, unterschiedliche Technologie
Dieser Bogen ist jetzt abgeschlossen und beschriftet. Die gleiche Form beginnt sichtbar mit AI. Jeder einzelne Anbieter, jede einzelne Konferenz, jeder einzelne Verkaufsanruf ist derzeit über AI. Die Sättigung ist identisch mit dem, was ich bei der Cloud beobachtet habe. Der Ausgabenanteil unter dem Lärm ist real: Gartner prognostiziert weltweite Ausgaben für generative AI in Höhe von 644 Milliarden Dollar im Jahr 2025, ein Anstieg von 76,4 % im Vergleich zum Vorjahr.
Die gleiche Sättigung impliziert die gleiche kommende Korrektur. Ich glaube, dass eine ähnliche Korrektur kommt, nicht weil AI schlecht ist, sondern weil die gleiche Dynamik, die die Cloud-Repatriierung produzierte, hier auch gilt. Sie kommt, weil Organisationen hart in AI-getriebene Workflows investieren, ohne immer zu wissen, wie die Geschichte in ihren eigenen Umgebungen endet. Die Übernahme-gegen-Reife-Lücke ist messbar: McKinsey findet heraus, dass 88 % der Organisationen jetzt regelmäßigen AI-Einsatz in mindestens einer Funktion melden, während die Mehrheit noch immer Pilotprojekte durchführt und nur etwa 39 % einen EBIT-Einfluss auf Unternehmensebene melden.
Wenn man ohne Strategie zu hart drängt, ist die Abrechnung nicht ein Vielleicht. Diese Korrektur kommt. Sie kommt immer. Man drängt zu hart ohne Strategie, und schließlich zwingen die Ökonomie und die operative Realität eine Abrechnung.
Es gibt bereits einen Namen für das korrigierende Muster, und es ist nicht meiner. AI-Repatriierung, der Vorgang, bestimmte Aufgaben aus probabilistischen AI-Systemen in deterministische Workflows zurückzuführen, wenn diese Aufgaben stabil und wiederholbar werden, ist kein Konzept, das ich erfunden habe. Es ist ein Muster, das ich beobachte. Ich bin nicht allein, es zu beobachten: Gartner prognostiziert, dass mehr als 40 % der agierenden AI-Projekte bis Ende 2027 abgesagt werden, unter Berufung auf steigende Kosten, unklaren Geschäftswert und unzureichende Risikokontrollen.
Wie die AI-Korrektur aussieht
Um die Korrektur vorherzusagen, hilft es, saubere Definitionen für die beiden Arten von Workflows zu haben, die beteiligt sind.
Ein deterministischer Workflow ist regelbasiert, vorhersehbar und wiederholbar. Die gleiche Eingabe und die gleichen Regeln produzieren die gleiche Ausgabe, jedes Mal. Es ist schnell, es ist fest. Es tut genau das, wofür es konzipiert ist, nichts mehr, nichts weniger. Ein probabilistischer Workflow verwendet AI oder modellbasiertes Reasoning, um Kontext zu interpretieren und eine wahrscheinliche Antwort zu produzieren. Es ist nützlich, wenn Prozesse Ambiguität, unstrukturierte Informationen oder Urteilsfälle beinhalten, bei denen feste Regeln zusammenbrechen und Inferenzen die Last tragen.
Wenn die Definitionen gesetzt sind, beantwortet sich die Zeitfrage von selbst. Probabilistische Workflows sind oft das richtige Werkzeug, wenn Prozesse noch nicht vollständig verstanden sind. Sie werden problematisch, wenn Unternehmen sie weiterhin verwenden, wenn Prozesse geklärt sind.
Ein konkreter Workflow macht diese frühe-gegen-spatere Unterscheidung greifbar. Ein Teil dieses Workflows benötigt tatsächlich AI. Die Identifizierung des richtigen Kontos aus einem Anrufprotokoll beispielsweise erfordert Inferenzen, die ein deterministisches System nicht kann. Andere Teile, wie das Anfügen einer Datei an einen Datensatz oder das Posten einer Benachrichtigung, sind deterministische Aufgaben. Ein fester Regelsatz, ein direkter API-Aufruf, ist die gleiche Ausgabe jedes Mal. Ich bin selbst schuldig, dies zu tun: Ich baue derzeit eine interne Automatisierung auf, die Anrufprotokolle, Routeninformationen in unser CRM, Zuweisung von Aufgaben und Push-Benachrichtigungen an Slack verbindet.
Die Versuchung ist, alles durch AI zu führen, und diese Versuchung birgt eine reale, wiederkehrende Belastung. Während es eine Versuchung gibt, alles durch AI-vermittelte Anrufe zu führen, führt jeder AI-Anruf Latenz ein und birgt Nutzungskosten und Infrastrukturkosten. AI-Systeme erfordern Überwachung, Prompt-Verwaltung und Schutzschranken, weil das zugrunde liegende Modell ständig (und unvorhersehbar) von seinem Besitzer entwickelt wird. Man weiß nie, wann es beginnt, anders zu funktionieren; Ausgaben können auf eine Weise variieren, die Governance-Probleme im großen Maßstab schafft, schnell.
Wenn man es weit genug ausspielt, wird diese Belastung zu reinem Verschwendung. Denken Sie an ein Unternehmen, das AI verwendet, um 50.000 Support-Tickets zu analysieren. Die AI identifiziert die fünf häufigsten Lösungspfade. Zunächst behandelt die AI die Weiterleitung probabilistisch: sie liest jedes Ticket und trifft eine Entscheidung. Im Laufe der Zeit validiert das Unternehmen diese Muster. Die Lösungspfade sind jetzt bekannt. Sie in deterministische Workflow-Branchen umzuwandeln, entfernt die AI nicht aus dem Prozess, aber es entfernt die redundante Praxis, AI zu bezahlen, um Antworten zu entdecken, die jetzt bekannt sind.
Das ist die probabilistische Steuer: die zusätzlichen Kosten, Latenz und Governance-Belastung, die durch die Ausführung von AI als Laufzeit für Arbeit entstehen, die nicht mehr probabilistisches Reasoning erfordert.
Wie reife Betriebsmodelle aussehen
Wenn die Ausführung gelöster Arbeit auf AI eine Steuer ist, ist der reife Schritt, die Arbeit nach Art zu teilen. Die Cloud-Reife produzierte hybride Infrastruktur, Cloud, wo sie ihren Platz verdient hat, dedizierte Infrastruktur überall sonst. Ich prognostiziere, dass die AI-Reife hybride Betriebe mit der gleichen Logik produzieren wird.
Diese Teilung produziert eine klare Betriebsregel. Probabilistische Systeme sind wertvoll, wo echte Ambiguität besteht. Menschen sind ambiguitätsgeladen. Unstrukturierte Daten sind ambiguitätsgeladen. Prozesse, die noch nicht vollständig verstanden sind, sind ambiguitätsgeladen. Inferenz ist das richtige Werkzeug für all dies. Die andere Hälfte der Regel ist ebenso wichtig: deterministische Systeme sind, wo Skalierbarkeit, Kosten, Geschwindigkeit und Governance zählen. Die probabilistische Schicht entdeckt und interpretiert. Die deterministische Schicht führt aus.
Auf dem Boden sagen zwei Signale, auf welche Seite eine bestimmte Workload gehört:
- Wenn Sie feststellen, dass Ihr Team auf AI für etwas angewiesen ist, das stabil, wiederholbar und gut verstanden ist, ist das ein Kandidat für Repatriierung, da Sie eine probabilistische Steuer auf deterministische Arbeit zahlen.
- Wenn Sie feststellen, dass Ihr deterministischer Code voller Ausnahmehandler und Variabilitätsüberlegungen ist, ist das ein Zeichen dafür, dass Sie möglicherweise AI benötigen. Der Regelsatz versucht, Inferenz zu approximieren.
In der Praxis wird diese Grenze als Konfidenzschwelle gezogen. Eine bestimmte Konfidenzschwelle, die sich zu einer Entscheidung bekennt, wenn das Modell zu mehr als 90 % sicher ist, oder elegant fehlschlägt, wenn es darunter liegt, ist oft, wo diese Grenze in der Praxis gezogen wird.
Was die Frage beantwortet, was der Sieg mit AI tatsächlich erfordert. Die erfolgreichsten Unternehmen, die AI übernehmen, werden nicht diejenigen sein, die es am meisten verwenden, sondern diejenigen, die wissen, wann sie es verwenden und wann sie es ergänzen sollen.












