Myslitelé
Změňující se předpověď cloudu

Vzorec, který jsem již viděl
Pracoval jsem profesionálně, když se cloud stal věcí. Z toho úhlu pohledu jsem viděl počáteční přijetí: vzrušení, flexibilitu, pocit, že všechno bude fungovat rychleji. To vedlo k masivnímu přijetí, kde každá zátěž byla kandidátem a každý dodavatel měl cloud příběh.
Přijetí však bylo pouze první polovinou toho, co jsem sledoval. Pak jsem viděl druhou stranu: repatriaci. Společnosti přesouvají konkrétní zátěže zpět, ptají se, zda každá aplikace skutečně potřebuje cloud flexibilitu. Tento druhý krok se udál z důvodu. S ekonomickými posuny a zralostí zátěží se předpoklady, které dělaly cloud jasnou volbou pro téměř vše, přestaly platit, když organizace začaly zkoumat je v měřítku.
Mít za sebou celý tento proces, rozpoznám jeho tvar, když začíná tvořit znovu. Nyní, když pomáhám společnostem rozklíčovat, co by AI vlastně mělo dělat v jejich prostředích, masivní přijetí/repatriace vzorec začíná vypadat povědomě.
Cloudová korekce
Abychom pochopili, proč tato podobnost záleží, pomáhá začít s tím, co se vlastně stalo s cloudem, na jeho vlastních podmínkách. Přechod na cloud byl racionální. Odstranil tření, dal organizacím flexibilitu a rychlost, a měl smysl pro zátěže, které byly nejisté nebo se rychle měnily. Byl racionální, protože byl postaven pro konkrétní typ práce.
DevOps týmy šly cloud-first, protože cloud byl postaven pro práci, která je iterativní, variabilní nebo těžko předpověditelná.
Ale věci, pro které se budoval, se nezůstaly stát. Cloud se nezměnil, ale zátěže ano. Jak procesy zrály a staly se předpověditelnými, organizace se seznámily s náklady kolem získání svých vlastních dat zpět. Poplatky za odchozí data, náklady na úložiště, poplatky za přenos: výdaje, které byly snadno přehlédnutelné, když flexibilita stála za to, a těžko přehlédnutelné, když zátěže stabilizovaly. V roce 2024, po letech účtování poplatků za odchozí data, AWS, Azure a Google Cloud všechny zrušily tyto poplatky pro zákazníky, kteří přecházeli z jejich platforem, jak uvádí DataCenterDynamics.
Jakmile tyto náklady byly viditelné, matematika přestala fungovat pro rostoucí podíl portfolia. Ekonomika, která dělala cloud dobrou strategií s některými nevýhodami, se stala ekonomicky nevýhodnou pro rostoucí sadu AI-orientovaných zátěží. Společnosti začaly používat tužku a ptaly se, zda každá aplikace skutečně potřebuje to, co cloud poskytoval. Když skutečně spustily čísla, odpověď, pro mnoho zátěží, byla ne.
Tyto nahromaděné odpovědi se staly korekcí, kterou průmysl nesprávně označil. Tato korekce se nazývá “cloudová repatriace” a je většinou popisována nesprávně. Ve skutečnosti se jedná o zralost zátěží: zralé společnosti se učí přizpůsobit každou zátěž infrastrukturnímu modelu, který jí vyhovuje. Data podporují selektivní čtení spíše než celkové. IDC zjistilo, že přibližně 80 % organizací očekává nějakou repatriaci během následujících 12 měsíců, a to i když méně než 10 % repatriovalo celé zátěže, podle zpráv v CIO.com.
Správně čteno, závěr není, že cloud byl chyba. Cloud zůstává cenný, ale přestal být univerzální. Zralý stav je hybridní: cloud, kde si vydobyl své místo, soukromá nebo dedikovaná infrastruktura všude jinde.
Stejná korekční křivka, jiná technologie
Tento proces je dokončen a označen. Stejné tvary jsou viditelně začínající s AI. Každý jediný dodavatel, každá konference, každý prodejní hovor je nyní o AI. Nasycení je identické s tím, co jsem sledoval u cloudu. Výdaje pod hlukem jsou reálné: Gartner předpovídá, že celosvětové výdaje na generativní AI dosáhnou 644 miliard dolarů v roce 2025, což je nárůst o 76,4 % oproti předchozímu roku.
Stejné nasycení naznačuje stejnou korekci. Věřím, že podobná korekce je na cestě, ne proto, že AI je špatné, ale protože stejná dynamika, která produkovala cloudovou repatriaci, platí zde také. Je na cestě, protože organizace tlačí tvrdě do AI-řízených pracovních postupů, aniž by vždy věděly, jak příběh skončí ve svých vlastních prostředích. Mezera mezi přijetím a zralostí je měřitelná: McKinsey zjistil, že 88 % organizací nyní uvádí pravidelné použití AI alespoň v jedné funkci, zatímco většina z nich je stále ve fázi pilotního projektu a pouze asi 39 % uvádí dopad na podnikání na úrovni EBIT.
Tlačit tak tvrdě bez strategie a vyústit v korekci není možná. Tato korekce přijde. Vždy přijde. Tlačíte příliš tvrdě bez strategie a nakonec ekonomika a provozní realita donutí korekci.
Existuje již název pro korekční vzorec a není to můj. AI repatriace, akt přesunu konkrétních úkolů z probabilistických AI systémů zpět do deterministických pracovních postupů, jakmile tyto úkoly stanou stabilními a opakovanými, není koncept, který jsem vymyslel. Je to vzorec, který sleduji, jak se rozvíjí. Nejsem sám, kdo jej sleduje: Gartner předpovídá, že více než 40 % agentic AI projektů bude zrušeno do konce roku 2027, s odkazem na rostoucí náklady, nejasnou obchodní hodnotu a nedostatečné kontrolní mechanismy.
Co vypadá AI korekce
Abyste mohli předpovědět korekci, pomáhá mít čisté definice pro dva typy pracovních postupů, které jsou zapojeny.
Deterministický pracovní postup je založen na pravidlech, předpověditelný a opakovaný. Stejné vstupní údaje a stejné pravidla produkují stejné výstupní údaje, vždy. Je rychlý, je pevný. Dělá přesně to, co je navržen, nic více, nic méně. Probabilistický pracovní postup používá AI nebo modelové uvažování k interpretaci kontextu a produkci pravděpodobné odpovědi. Je užitečný, když procesy zahrnují nejasnost, nestrukturované informace nebo úsudky, kde pevná pravidla selhávají a inference nese zátěž.
S definicemi nastavenými, časová otázka sama odpověděla. Probabilistické pracovní postupy jsou často správným nástrojem na začátku, kdy procesy nejsou ještě plně pochopeny. Stávají se problematickými, když společnosti pokračují v jejich používání, když procesy jsou již jasné.
Konkrétní pracovní postup dělá ten raný versus pozdní rozdíl hmatatelným. Část tohoto pracovního postupu skutečně vyžaduje AI. Identifikace správného účtu z hovorového záznamu, například, vyžaduje inference, které deterministický systém nemůže udělat. Jiné části, jako je připojení souboru k záznamu nebo odeslání oznámení, jsou deterministické úkoly. Pevné pravidlo, přímé API volání, je stejné výstupní údaje každý čas. Jsem sám viněn z tohoto: buduji interní automatizaci, která spojuje hovorové záznamy, směruje informace do našeho CRM, přiřazuje akční položky a posílá aktualizace do Slacku.
Pokušení je spustit vše skrze AI a toto pokušení nese skutečnou, opakovanou zátěž. Zatímco existuje pokušení spustit celý proces skrze AI-prostřední volání, každé AI volání zavádí latenci a nese použití a infrastrukturní náklady. AI systémy vyžadují monitorování, správu podnětů a ochranné prvky, protože základní model je neustále (a nepředvídatelně) vyvíjen jeho vlastníkem. Nikdy nevíte, kdy začne fungovat jinak; výstupní údaje mohou se lišit způsoby, které vytvářejí problémy s řízením v měřítku, rychle.
Hráno dost daleko, tato zátěž se změní v čistou ztrátu. Zvažte společnost, která používá AI k analýze 50 000 podpůrných lístků. AI identifikuje pět nejčastějších řešení. Na začátku AI zpracovává routing probabilisticky: čte každý lístek a dělá úsudek. V průběhu času společnost ověřuje tyto vzorce. Řešení jsou nyní známa. Přeměna jich na deterministické pracovní postupy neodebere AI z procesu, ale odstraní redundanci placení AI za opětovné objevování odpovědí, které jsou již známy.
To je probabilistická daň: přidaná cena, latence a zátěž řízení spojená s provozem AI jako runtime pro práci, která již nevyžaduje probabilistický rozum.
Co vypadají zralé provozní modely
Pokud provozování vyřešené práce na AI je daň, zralý krok je rozdělit práci podle typu. Cloudová zralost produkovala hybridní infrastrukturu, cloud, kde si vydobyl své místo, dedikovanou infrastrukturu všude jinde. Předpovídám, že AI zralost bude produkovat hybridní provoz se stejnou logikou.
Tento rozdělení produkuje jasnou provozní pravidlo. Probabilistické systémy jsou cenné, kde existuje skutečná nejasnost. Lidé jsou nejasní. Nestrukturovaná data jsou nejasná. Procesy, které nejsou ještě plně pochopeny, jsou nejasné. Inference je správným nástrojem pro všechna tato. Druhá polovina pravidla je stejně důležitá: deterministické systémy jsou tam, kde záleží na měřítku, nákladu, rychlosti a řízení. Probabilistická vrstva objevuje a interpretuje. Deterministická vrstva provádí.
Na zemi, dva signály vám řeknou, na které straně konkrétní zátěž patří:
- Pokud najdete svůj tým, který spoléhá na AI pro něco, co se stalo stabilním, opakovaným a dobře pochopeným, je to kandidát na repatriaci, protože platíte probabilistickou daň za deterministickou práci.
- Pokud najdete svou deterministickou kód plnou výjimek a úvah o variabilitě, je to znamení, že možná skutečně potřebujete AI. Sada pravidel se snaží aproximovat inference.
V praxi se tato hranice nakreslí jako práh důvěry. Konkrétní práh důvěry, závazek k rozhodnutí, když je model nad 90% jistý, nebo selhání elegantně pod ním, je často tam, kde se tato hranice nakreslí v praxi.
Který předefinuje, co vlastně znamená vyhrát s AI. Nejúspěšnější společnosti, které přijímají AI, nebudou ty, které ji používají nejvíce, ale ty, které znají, kdy ji použít a kdy ji doplnit.












