Myslitelé
Problém všude: Proč “DataAnywhere” se stává definujícím infrastrukturálním výzvou éry AI

Nejdůležitější otázka v oblasti AI dnes není, který model je nejchytřejší. Je to otázka, kde žijí data a zda inteligence může dosáhnout jich.
V průběhu téměř desetiletí fungovala odvětví AI na základě uklidňujícího předpokladu: centralizovat data, centralizovat výpočetní výkon a genialita bude následovat. Model hyperscalerů — centralizovat rozsáhlé trénovací datové sady v velkých cloudových clusterech a aplikovat masivní GPU výpočetní výkon na komprimaci těchto dat do modelových parametrů — přinesl mimořádné výsledky, ale také architekturu, která nyní trpí pod váhou svého vlastního úspěchu.
Remezme to “problém data anywhere”. Jak se AI vyvíjí z výzkumných laboratoří a do provozní struktury nemocnic, továren, finančních institucí a suverénních vlád, data, která musí informovat tyto systémy, jsou inherentně distribuována, jurisdikčně omezena a provozně nemobile. Regulátoři v Evropě trvají na tom, že finanční záznamy jejích občanů nesmí opustit kontinent. Klinické údaje farmaceutické společnosti v Basileji nemohou legálně sdílet cloudový bucket s genetickými daty z Souls.
Bez ohledu na to, inteligence musí jít k datům. Data, zdůrazňuji, nepřejdou k inteligenci.
Ekonomika posunu
Tento strukturální napětí je zostřeno současnou revolucí v ekonomice AI. Odvětví prochází tektonickým přeskupením od tréninkově orientovaného k inferenčnímu výdaji, a to má hluboké důsledky pro architekturu dat.
Deloitte odhadl, že inferenční zátěže tvořily polovinu všech AI výpočtů v roce 2025, což se zvýší na dvě třetiny v roce 2026. Poměr se mění s ohromující rychlostí. Analytici odhadují, že do roku 2026 poptávka po inferenci přesáhne poptávku po tréninku 118krát. Do roku 2030 inferenční náklady mohou tvořit 75 % celkových AI výpočtů, což povede k investicím ve výši 7 bilionů dolarů do infrastruktury.
Matematika nákladů je stejně závratná. Za každý 1 miliardu dolarů vynaložených na trénink AI modelu čelí organizace nákladům ve výši 15–20 miliard dolarů na inferenční náklady po dobu životnosti modelu: poměr ilustrovaný ostře u GPT-4, jehož trénink stál přibližně 150 milionů dolarů, zatímco kumulativní inferenční náklady dosáhly 2,3 miliardy dolarů do konce roku 2024. Trénink, dříve hlavní posedlost investorů a úředníků pro nákup, je nyní vnímán jako jednorázový poplatek za studium. Inferenční náklady jsou trvalým provozním nákladem inteligence a nyní jsou dominantním položkám.
Ale tady leží paradox: inferenční náklady pro systém GPT-3.5 se snížily o více než 280krát mezi listopadem 2022 a říjnem 2024, zatímco hardwarové náklady klesly přibližně o 30 % ročně a energetická efektivita se zlepšila o 40 % ročně. Ceny klesají; spotřeba zrychluje rychleji. Náklady na inferenci na jednotku klesly o 100krát, zatímco Microsoft a Google hlásili růst AI zátěží o 31krát za polovinu tohoto období.
Jevonsův paradox, kde zisk z efektivnosti vede k větší spotřebě zdrojů, nalezl moderní vyjádření v GPU clusterech.
Kde žijí data, tam musí být inteligence
Inferenční ekonomika fundamentálně mění požadavky na infrastrukturu, a nikde více než kolem gravitace dat. Inferenční procesy, na rozdíl od tréninku, nejsou dávkovými úlohami spuštěnými jednou v datovém centru. Jedná se o kontinuální, latenci-citlivou, geograficky distribuovanou službu, a je tak dobrá, jak dobrá je data, ke kterým má přístup v okamžiku dotazu.
To je jádro problému data anywhere.
Například jazykový model, který provádí odvozování nad živými telemetrickými údaji pacienta, nemůže si dovolit 200milisekundovou zpáteční cestu do clusteru hyperscaleru na východním pobřeží. Model pro odhalování podvodů ve finančních službách, který provádí inferenci na místě transakce, nemůže vyvést účetní data do jurisdikce, kde by porušila GDPR. Suverénní nasazení AI nemůže být založeno na infrastruktuře vlastněné a provozované cizí komerční entitou.
Přední laboratoře jsou si tohoto problému velmi dobře vědomy. Dohoda Anthropic s Google Cloud na až jeden milion TPUs, které dodají více než gigawatt AI výpočetního výkonu do roku 2026, signalizuje, jak přední laboratoře investují do globální infrastruktury inferenčních služeb.
Taxonomie datové intenzity
Ne všechny systémy AI čelí této výzvě identicky a je instruktivně rozdělit je do hrubé taxonomie, protože existuje několik typů AI modelů a složitosti. Rozdělme to na tři základní příklady: LLM, obrazové a fyzické modely.
Velké jazykové modely — rodiny Claude, GPT a Gemini — se zabývají primárně jazykovými tokeny: relativně lehkými, komprimovatelnými a přístupnými k technikám zachování soukromí, jako je diferenciální soukromí nebo federované učení. Jejich problém data anywhere je velmi složitý.
Generativní vizuální modely představují ještě tvrdší případ. Systémy, jako je Black Forest Labs’ FLUX.2, mohou produkovat vysoce rozlišené, fotorealistické obrázky za méně než sekundu na výkonném hardwaru, ale generování jediného obrázku vyžaduje mnohem více dat a výpočetního výkonu než generování textu. Jak se vizuální AI přesouvá za hranice kreativních nástrojů do průmyslové inspekce, lékařské zobrazovací techniky a satelitní analýzy, podkladová data jsou často velká, citlivá a obtížně přenositelná, což zvyšuje potřebu spouštět AI tam, kde již data sídlí.
Nejsložitější kategorií je fyzická AI. NVIDIA’s Jensen Huang prohlásil, že “fyzická AI již dorazila a každá průmyslová společnost se stane robotickou společností”. Nové modely, jako je NVIDIA’s Cosmos 3, mají za cíl poskytnout strojům obecné pochopení fyzického světa kombinací simulace, vidění a odůvodnění, zatímco společnosti, jako je Physical Intelligence, školí roboty na reálných datech ze senzorů – včetně síly, pohybu a vizuálních vstupů – aby umožnily více adaptabilní a autonomní chování.
Stejné škálovací dynamiky, které zlepšily velké odůvodňovací modely, jsou nyní aplikovány na reálná data, jako je vibrace, zvuk a senzorické vstupy. Ale tyto informace jsou inherentně lokální. Robot na tovární hale nemůže odeslat reálná vizuální a haptická data do vzdáleného cloudu pro zpracování bez zavedení zpoždění, která by mohla vytvořit bezpečnostní rizika, což znamená, že AI musí stále častěji běžet na okraji, blízko místa, kde jsou data generována.
Důvěra, vysvětlitelnost a výsledky
Tady se problém data anywhere přesouvá za hranice infrastruktury a stává se otázkou správy. Jak se AI aplikuje na rozhodnutí s vysokými závažnostmi – od zdravotních diagnóz po finanční rizika a fyzické kontrolní systémy – otázky o tom, kde data sídlí, jsou stále častěji spojeny s otázkou, kdo je zodpovědný za výsledky.
V dnešním regulačním prostředí není vysvětlitelnost volitelná. Například evropský zákon o AI vyžaduje, aby systémy s vysokým rizikem prokázaly základ pro své výstupy, což je obtížné, pokud data, která informují o těchto rozhodnutích, jsou distribuována napříč několika systémy, jurisdikcemi a regulačními rámci.
Důvěra se proto stává předpokladem pro přijetí ve velkém měřítku. Kontrola nad datovým prostředím se stává stejně důležitou jako kontrola nad modely samotnými.
Další generace AI infrastruktury
Řešení problému data anywhere bude definovat konkurenční mapu AI pro příští dekádu. Federovaná inferenční, zabezpečené prostředí pro zpracování dat, modely optimalizované pro okraj a orchestrace, které zohledňují, kde mohou data sídlit, nejsou nikterak zanedbatelné technické funkce, ale podmínky pro expanzi AI za hranice případů, kde lze data centralizovat.
Společnosti a vlády, které postaví infrastrukturu schopnou dodávat důvěryhodnou, vysvětlitelnou a suverénní inferenci — inteligenci, která dosáhne dat, místo aby vyžadovala, aby data cestovala k ní — budou ovládat nejtrvalejší překážku éry AI. Trénink chytřejšího modelu je stále více vyřešeným a komoditním problémem. Nasazení modelu zodpovědně, na okraji, přes jurisdikční hranice, proti datům, která se nemohou pohybovat, je problémem, který zůstává.
Data anywhere nejsou jen heslem. Je to nejobtížněji nevyřešený problém v podnikové AI. A bude určovat, zda mimořádná schopnost odemknutá minulým desetiletím investic do tréninku se někdy přeloží do výsledků, které svět může důvěřovat.












