Myslitelé

Recenze architektury záleží více než model v podnikovém AI

Publikováno 3. června 2026

Aneesh Dhawan, Spoluzakladatel a CEO, Knit

Další fáze zralosti AI v podniku závisí méně na lepších modelech a více na budování důvěryhodné architektury kolem nich.

Každá diskuse o řízení AI, kterou jsem měl za poslední dva roky, se vrací ke stejným obavám: míra halucinací, referenční body přesnosti a testy sladění. Tyto jsou skutečné problémy, samozřejmě, ale diskuse se soustředila na špatný konec problému.

Ačkoli se modely podstatně zlepšily, počet neověřených výstupů AI, které dosahují senior manažerů, se dramaticky zvýšil spolu s nimi. Tento nedostatek naznačuje problém architektury recenze, a průmysl o tom téměř nemluví.

Příběh modelu-centrického se udál před realitou

Dominantní rámec v podnikovém AI stále považuje kvalitu modelu za primární proměnnou: pokud je model dostatečně přesný, výstup je důvěryhodný. Tato logika byla pochopitelná před dvěma lety, kdy rané LLM byly více nekonzistentní a náchylné k halucinacím, ale situace se změnila.

Dnešní modely produkují leštilé, dobře strukturované, bohaté na citace odpovědi na obrovské množství úkolů, formátované v jazyce, který je připraven pro zúčastněné strany. Organizace nyní používají AI v objemu, který výrazně přesahuje kapacitu jejich procesů recenze. Výzkum o přijetí podnikového AI dokumentoval tento nesoulad ve vývoji softwaru, kde AI-pomocní vývojáři dokončují o 21 % více úkolů, zatímco doba recenze žádostí o stažení se zvyšuje o 91 %. Produkce se zvyšuje, takže kapacita již není úzkým místem. Kapacita recenze je skutečnou překážkou.

Co ukazují data v analytické práci

Průmysl analýz je výhodným místem pro studium tohoto problému, protože profesionálové v analýzách jsou školeni jako skeptici. Vědí, jaký je rozdíl mezi korelací, kauzalitou, nálezy a závěry. Otázka kvality dat je součástí práce.

Podle Knit AI Trust Index, 92 % dotázaných profesionálů v podnikových analýzách uvádí, že výstupy AI dosahují senior leadership bez komplexní recenze.
Zjištění Trust Index identifikují tři hlavní tlaky:

Objem překročil kapacitu verifikace. Týmy generují více výstupů, než mají kapacitu je důkladně prověřit.
Důvěra vzrostla rychleji než chování verifikace se změnilo. Výzkumníci se cítí obecně pozitivně vůči kvalitě AI, zatímco uznávají, že jejich postupy recenze se nezměnily.
Nástroje pro recenzi AI prací zaostávají za nástroji pro jejich produkci. Organizace investovaly výrazně do generovacích schopností a relativně málo do infrastruktury pro recenzi a sledování toho, co AI produkuje.

Leštilé výstupy vyzývají k menší kontrole

Těžší režim selhání není případ, kdy AI produkuje zjevně špatnou odpověď a někdo ji odhalí. Těžší problém je automatizovaný bias, tendence snižovat kontrolu výstupů, které vypadají autoritativně a jsou dobře formovány. Systematická recenze z roku 2025 publikovaná v AI & Society prozkoumala tento problém napříč 35 recenzovanými studiemi a zjistila, že leštilé, vysoce důvěryhodné výstupy AI konzistentně snižují hloubku lidské recenze — dokonce i mezi zkušenými profesionály. Když něco vypadá správně, přidělíme méně pozornosti k ověření, zda je to真的.

Tento nedostatek vytváří problém propagace. Výstup výzkumu, který analytik pouze lehce prověřil, se stává datovým bodem ve zprávě na úrovni VP, který se stává základem diskuse na úrovni boardu. Ve chvíli, kdy se chyba dostane tak daleko, její původ je neviditelný a její korekce je drahá. Globální podnikatelské ztráty z nepřesností generovaných AI překročily 67 miliard dolarů v roce 2024. Náklady na verifikaci na zaměstnance mohou dosáhnout 14 200 dolarů ročně, pouze za kontrolu, zda je obsah generovaný AI přesný. Opět, tyto nejsou problémy s kvalitou modelu; jsou to problémy s architekturou recenze.

Jak vypadají zralé pracovní postupy AI

Organizace, které tento problém zvládají dobře, nepoužívají lepší modely než ostatní. Místo toho vybudovaly důvěryhodnější infrastrukturu recenze kolem modelů, které využívají. Čtyři principy definují jejich přístup:

VIDITELNÁ PROVENIENČNÍ HISTORIE

Každý výstup AI nese transparentní záznam o tom, odkud pocházejí jeho vstupy. Tento záznam poskytuje recenzentům cenné informace o tom, co je třeba vyhodnotit, aby mohli výstupy efektivně vyhodnotit. Nemůžete vyhodnotit tvrzení, které je netraceable.

VRSTVENÁ RECENZE PODLE SÁZEK

Ne všechny výstupy AI nesou stejná rizika. Zralé pracovní postupy aplikují intenzitu recenze proporcionálně k následným důsledkům chyby. Výstupy s vysokými sázkami dostanou více očí a strukturované kroky verifikace. Rutinní výstupy postupují rychleji.

TŘENÍ NA SPRÁVNÝCH MÍSTECH

Organizace, které nejvíce bojují s důvěrou AI, odstranily tření uniformně, přičemž považovaly rychlost za univerzální cíl. Úspěšné organizace byly selektivní: zachovaly úmyslné tření na místech, kde výstupy AI se stávají rozhodnutími organizace. Jejich procesy vyžadují schválení, než se AI-generovaný výsledek dostane do prezentace boardu, nebo strukturovaný krok výzvy, než se výstupy dostanou do strategických diskusí.

ZPĚTĚNÍ ZPĚT K VRSTVĚ MODELŮ

Nejlepší pracovní postupy považují recenzi za proces generování dat, ne za kontrolní bod. Když recenzent označí chybu nebo přepsá doporučení AI, tento signál je zachycen a vrácen zpět do toho, jak je AI nasazena v budoucí práci. OpenAI State of Enterprise AI report nalezl, že organizace s nejvyššími výkony se odlišují nikoli složitostí svých modelů, ale rigiditou jejich nasazovacích procesů. Organizace bez této zpětné vazby začínají od začátku každého času.

DALŠÍ FÁZE SE VÍTĚZÍ NA VRSTVĚ RECENZE

Skutečná konkurenční výhoda v analytickém průmyslu je, kdo může konzistentně důvěřovat tomu, co produkuje. Tato důvěra pochází z vědomí, odkud výstup pochází, kdo ho recenzoval a co se stalo, když něco bylo špatně. Nedávná historie odpověděla na otázku modelu; organizační infrastruktura pro zodpovědné nasazení modelů v měřítku je tam, kde je průmysl stále dohánějící.

Skutečnost, že 92 % profesionálů v analýzách vidělo neověřený obsah AI dosahující senior leadership, není technologickým selháním. Je to selhání organizačního designu, a to se objevuje v různých odvětvích, kde byla rychlost optimalizována a recenze byla považována za náklad. Společnost s nejchytřejším modelem nevyhraje další fázi podnikového AI, ale společnost s nejvěrohodnější architekturou recenze kolem něj.

Aneesh Dhawan, Spoluzakladatel a CEO, Knit

Aneesh Dhawan je spoluzakladatel a CEO Knit, agentury pro výzkum založenou na umělém inteligenci. Strávil posledních 5 let na rozhraní podnikového umělého inteligence a metodologie výzkumu. Knit spolupracuje s organizacemi jako Google, Amazon, T-Mobile a ESPN, aby poskytoval rozhodnutí připravená informace na rychlost umělé inteligence.

Unite.AI

Recenze architektury záleží více než model v podnikovém AI

Příběh modelu-centrického se udál před realitou

Co ukazují data v analytické práci

Leštilé výstupy vyzývají k menší kontrole

Jak vypadají zralé pracovní postupy AI

VIDITELNÁ PROVENIENČNÍ HISTORIE

VRSTVENÁ RECENZE PODLE SÁZEK

TŘENÍ NA SPRÁVNÝCH MÍSTECH

ZPĚTĚNÍ ZPĚT K VRSTVĚ MODELŮ

DALŠÍ FÁZE SE VÍTĚZÍ NA VRSTVĚ RECENZE

You may like