Myslitelé
Proč je Generative-Augmented Retrieval další hranicí datové analýzy

Tři ze čtyř lidí říkají, že jejich organizace používají AI. Přesto většina této činnosti stále soustředěna na nestrukturovaný obsah: shrnující schůzky, vytvářející e-maily nebo automatizující zákaznickou podporu.
Ale ironicky, tolik dat, která skutečně řídí obchodní rozhodnutí – finanční zprávy, tabulky skladů a KPI – zůstáválargely nedotčeno AI.
Důvodem není nedostatek ambice, ale nedostatek důvěry. Když model hallucinuje větu, lze to často opravit; když hallucinuje číslo, je to katastrofické. Finanční ředitel nemůže schválit odpověď, kterou nemůže ověřit.
Dnes strukturovaná data žijí napříč desítkami systémů, každý se svými vlastními pravidly a vztahy. Získání AI, aby správně rozumělo této komplexitě, je tvrdším výzvou než jakýkoli chatbot.
Podniky a jejich týmy – včetně netechnických uživatelů – potřebují být schopni interagovat se svými daty jednoduchým způsobem, aby snížili úzká místa a získali rychlé a přesné přehledy. Bez nutnosti učit se SQL.
Některá řešení se objevují – pojďme se podívat na einige prominentní příklady, s jejich výhodami a jejich nedostatky.
AI a strukturovaná data – most příliš daleko
V posledních dvou letech se objevily several snahy mostovat AI přehledy a strukturovaná data.
Mnoho z nich pochází z technologických gigantů s významnými zdroji a daty. Snowflake, například, introduced s jeho Cortex Analyst, který se snaží umožnit uživatelům klást přirozené jazykové otázky proti Snowflake date warehouse.
Pro zlepšení přesnosti má Cortex způsob, jak poskytnout semantické metadata – ale model je silně omezen. Jednak musí být postaven ručně a dokonce tak, může fungovat pouze na maximálně 10 tabulkách, což je nedostatečné i pro středně velkou společnost. Jakékoli vyšší, a důvěra se rozpadá, protože přesnost klesá.
Příběh se opakuje s pokusy Databricks, který přijal text-to-SQL přístup s AI/BI Genie. Toto řešení lze účinně nasadit pouze na malé domény, ztrácí přesnost s rostoucími datovými sadami.
Microsoft Power BI Copilot přijímá povrchový generativní přístup, vkládající AI přímo do dashboardů pro popis vizuálů, navrhování opatření a vytváření zpráv. Zlepšuje průzkum, ale nemění, jak se analytika rozumí nebo ověřuje. Každá odpověď stále závisí na úsudku modelu a když tento úsudek selže, není žádná auditní stopa nebo deterministická logika, na kterou by se dalo spolehnout.
Kolektivně tato systémy ukazují správným směrem: nasazení AI na strukturovaná podniková data. Ale také sdílejí kritický nedostatek. Závisí na AI modelu, aby generoval SQL z přirozeného jazyka a když tento SQL je špatný, což se často stává, je obchodní uživatel uvíznutý. Výkonný ředitel, který nemůže číst SQL, nemá žádný způsob, jak diagnostikovat nebo opravit výsledek. Konverzace se zastaví.
Jiná cesta: Generative-Augmented Retrieval
Generative-Augmented Retrieval (GAR) otočí současný RAG přístup vzhůru nohama (Retrieval-Augmented Generation zdrojů relevantních informací a začlenění jej do LLM pro zvýšení přesnosti).
Místo toho, aby se požadovalo, aby LLM psal SQL, GAR používá generativní AI, aby pochopil záměr dotazu uživatele a poté vytvořil kroky pro vyvození odpovědi.
V GAR dotazy interagují přímo s znalostní bází. Jsou kompilovány spíše než generovány, stejná otázka vždy vede ke stejné odpovědi. Důvodící řetězec v GAR je trvalým, přezkoumatelným artefaktem, ne přechodným chatem, takže celý řetězec důvodu může být reprodukován.
To znamená, že výsledky jsou exponenciálně přesnější než u obecných genAI motorů.
V jádru GAR dělá tři věci:
- Automaticky buduje semantickou vrstvu. GAR používá AI, aby odhalil vztahy a obchodní definice napříč systémy, sjednocující data do jediného modelu
- Překládá obchodní záměr do vysoké úrovně analytického jazyka. Tento jazyk zachycuje dotaz na úrovni obchodního konceptu („tržby za návštěvu poskytovatele za Q2“) a kompiluje přímo do SQL.
- Protokoluje každý krok důvodu pro auditovatelnost. Původ každé odpovědi je stopovatelný.
Proč je to důležité
Omezením důvodu na vnitřní znalostní model podniku může GAR eliminovat halucinace a dodávat odpovědi, které jsou prokazatelně správné.
Definice, metriky a vzorce dotazů se sčítají over time, což dělá budoucí odpovědi dále přizpůsobené pro konkrétního uživatele.
Prvek důvěry je zásadní pro obchodní uživatele, kteří závisí na svých strukturovaných datech, aby učili informovaná obchodní rozhodnutí. Jakmile více a více organizací implementuje pokročilá AI řešení, budou požadovat rámce, které snižují riziko halucinace a chyby na téměř nulu.
To se stane, když dotazování spojuje přímo s vašimi daty, když AI může pracovat na velkých datových sadách bez rozbití a když jsou odpovědi poskytovány s konzistencí a prokazatelností.








