Connect with us

Myslitelé

Iniciativy AI nevyžadují dokonalá data: Pragmatikův pohled na firemní AI

mm

Trh firemní AI dosáhne 204 miliard dolarů do roku 2030. Devadesát dva procent organizací plánuje zvýšit své investice do AI v příštích třech letech. Přesto výzkum MIT ukazuje, že 90 % projektů AI nezvládne překročit pilotní fázi. A primární příčinou není složitost modelu, ale kvalita dat.

V představenstvech se debatuje o ChatGPT versus Claude. Kládou špatnou otázku. Skutečný problém spočívá v tom, zda je firemní data připravena pro jakoukoli implementaci AI. Většina firem buduje pokročilé AI schopnosti na rozdělených, nekonzistentních, kontextově chudých datových základech.

To bohužel vytváří drahé neúspěchy. Finanční instituce nasazují chatboty, které halucinují výnosy. Maloobchodníci implementují doporučovací motory, které doporučují ukončené produkty. Výrobci investují do prediktivní analytiky, která nemůže odpovědět na základní provozní otázky. Tyto neúspěchy pramení z toho, že se spěchá s implementací pokročilých modelů, zatímco se přehlíží základní příprava dat.

Pochopení výzvy datové komplexity

Firemní data existují ve třech kategoriích. Každá vyžaduje odlišný přístup k přípravě. Pochopení těchto rozdílů určuje úspěch AI.

Strukturovaná data vypadají povědomě. Informace jsou uloženy v databázích a tabulkách s jasnými řádky a sloupci. Mnoho organizací předpokládá, že dobře organizované transakční systémy znamenají připravenost pro AI. Tento předpoklad vytváří problémy. Systémy AI bojují se strukturovanými daty ne kvůli jejich dezorganizovanosti, ale kvůli mezerám v kontextu. Když AI narazí na “ProductID” pole napříč několika databázovými tabulkami, nemůže pochopit tyto vztahy bez explicitního pokynu. Výsledkem je AI, které přistupuje k datům, ale nemůže je smysluplně analyzovat.

Nestrukturovaná data představují opačné výzvy a příležitosti. Tato kategorie zahrnuje e-maily, dokumenty, prezentace, videa a další obsah vytvořený lidmi, kde žije většina firemních znalostí. Tradiční analytické nástroje bojují s nestrukturovanými daty. Moderní systémy AI jsou navrženy tak, aby je zpracovávaly. Úspěch vyžaduje systematickou přípravu. Organizace nemohou nahrát tisíce PDF a očekávat smysluplné přehledy. Účinná implementace vyžaduje segmentaci obsahu, tvorbu metadat a optimalizaci vyhledávání.

Polostrukturovaná data obsazují složitou střední půdu. Soubory JSON, systémové protokoly a zprávy kombinují organizované prvky s narativním obsahem. Společný omyl spočívá v tom, že se s těmito zdroji zachází jako s čistě nestrukturovanými, což vede ke ztrátě cenných organizovaných komponent. Úspěšná implementace AI vyžaduje rozbor strukturovaných prvků, zatímco se zachovávají nestrukturované přehledy, a následně je opět kombinuje pro komplexní analýzu.

Každý typ dat vyžaduje specifické strategie přípravy. Systémy AI musí být nakonfigurovány tak, aby zvládly tuto komplexitu. Organizace, které zacházejí se všemi daty uniformně, vytvářejí implementace AI, které vynikají u jednoho typu dat, zatímco selhávají u ostatních.

Mezera v kontextu, která znemožňuje výkon AI

Kontext je nejkritičtějším faktorem úspěchu AI. Je to také nejčastěji přehlížený. Lidský analytik přináší desetiletí firemních znalostí do interpretace dat. Při přehledu čtvrtletních zpráv rozumí, že “Revenue” představuje prodej po zdanění ve Spojených státech v dolarech. Systémy AI nemají takové pochopení. Bez explicitního kontextu může AI vyložit “47%” jako výnosové číslo, zatímco skutečná hodnota je 4,7 milionu dolarů. To vede k fundamentálně chybným obchodním doporučením.

Mezera v kontextu se rozšiřuje za hranice základní interpretace dat. Každá organizace vyvíjí jedinečné definice pro běžné metriky. “Náklad na získání zákazníka” znamená něco úplně jiného u startupu než u zavedené firmy. “Míra odlivu” se dramaticky liší napříč odvětvími a společnostmi. Systémy AI vyžadují explicitní instrukce v těchto firemních nuancích, aby poskytly smysluplné přehledy.

Tradiční přístupy k dokumentaci selhávají při implementaci AI. Statické datové slovníky uložené na serverech zůstávají neviditelné pro systémy AI a rychle se stávají zastaralými. Úspěšné organizace vytvářejí živou dokumentaci, na kterou se systémy AI mohou aktivně odkazovat. Tato dokumentace se aktualizuje automaticky, jak se firemní pravidla vyvíjejí.

Rovnováha mezi automatizací a lidským vstupem se zde stává zásadní. Stroje vynikají v identifikaci technických vztahů. Rozpoznávají, že Sloupec A souvisí s Tabulkou B napříč databázovými systémy. Pouze lidská odbornost poskytuje firemní kontext. Lidé vysvětlují, proč určitá metrika má význam, jak se vypočítává a co představuje normální versus znepokojivý rozsah výkonu. Úspěšná implementace AI kombinuje automatizované objevy s kurací lidských znalostí.

Zesílená rizika v éře AI

Implementace AI zesiluje stávající datové problémy v bezprecedentním měřítku a rychlosti. Tradiční výzvy řízení dat se stávají exponenciálně složitějšími, když systémy AI přistupují, zpracovávají a sdílejí informace napříč firemními hranicemi.

Mechanizmy řízení přístupu navržené pro lidské uživatele se pro systémy AI ukazují jako nedostatečné. Tradiční bezpečnostní modely mohou udělit prodejním analytikům přístup k určitým složkám. Avšak AI asistenti mohou neúmyslně zpřístupnit citlivé informace neoprávněným uživatelům prostřednictvím zdánlivě nevinných dotazů. Zákaznický servis AI může přistupovat k datům o cenách konkurentů a sdílet je v komunikaci se zákazníky. Organizace potřebují bezpečnostní rámce dostatečně sofistikované, aby pochopily, co AI může a nemůže sdílet v různých kontextech.

Požadavky na soulad se stávají podstatně složitějšími, když systémy AI činí rozhodnutí, která ovlivňují jednotlivce. Soulad s GDPR byl náročný, když lidé činili rozhodnutí založená na datech. Nyní organizace musí vysvětlit, jak algoritmy AI dospěly k určitým závěrům. Musí udržovat auditní stopy pro automatizovaná rozhodnutí. Musí zajistit, aby data pro školení AI souladila s předpisy o ochraně soukromí. “Právo na vysvětlení” nabývá nového významu, když rozhodnutím je algoritmický systém místo lidského analytika.

Stavění důvěry vyžaduje nové přístupy k testování a monitorování. Tradiční zajištění kvality se zaměřovalo na to, zda systémy fungují správně za předpokládaných podmínek. Systémy AI vyžadují nepřetržité monitorování, aby se zjistilo, kdy selhávají, jak závažně a proč. Organizace musí implementovat monitorování v reálném čase pro každé rozhodnutí AI, nejen pro metriky výkonu systému.

Směs zpětné vazby se stává kritickou pro zlepšení. Když uživatelé opravují odpovědi AI, tato oprava představuje cenná školicí data. Avšak pouze tehdy, pokud organizace zachytí a systematicky začleňují tuto zpětnou vazbu. To vyžaduje procesy pro sběr uživatelské zpětné vazby, ověření oprav a aktualizaci chování AI.

Navigace v rozhodnutí Postavit versus Koupit

Organizace stojí před volbou mezi vývojem interních AI schopností nebo partnerstvím s externími platformami. Každý přístup má odlišné výhody a výzvy, které musí být sladěny s firemními schopnostmi a strategickými cíli.

Vývoj interních AI schopností nabízí maximální kontrolu a potenciál přizpůsobení. Organizace mohou vyvinout systémy přesně přizpůsobené svým jedinečným požadavkům. Zachovávají úplnou kontrolu nad svými daty a algoritmy. Nicméně, požadavky na zdroje jsou podstatné. Úspěšný interní vývoj obvykle vyžaduje týmy datových inženýrů, specialistů AI a odborníků z dané oblasti. Vývoj trvá 12-24 měsíců. Skryté náklady zahrnují udržování aktuálnosti s rychle se vyvíjejícími technologiemi AI, udržování systémů nepřetržitě a vysvětlování zpoždění ve lhůtách vedení.

Řešení platformy slibují rychlejší implementaci a sníženou technickou zátěž. Organizace mohou nahrát data, nakonfigurovat základní nastavení a začít generovat přehledy AI. Avšak organizace musí pečlivě vyhodnotit schopnosti platformy ve vztahu ke svým specifickým požadavkům. Kritické úvahy zahrnují kompatibilitu formátu dat, porozumění specifickému odvětví, ochrana dat a soukromí a schopnosti integrace se stávajícími systémy.

Hybridní přístup často funguje nejlépe pro mnoho organizací. Zahájení s řešeními platformy umožňuje společnostem rychle prokázat hodnotu AI, zatímco se učí o svých specifických požadavcích. Jakmile organizace pochopí, co funguje, mohou učinit informovaná rozhodnutí o tom, které schopnosti si zaslouží interní vývoj oproti pokračujícímu využití platformy.

Praktický rámec pro postup

Úspěšná implementace AI začíná upřímnou evaluací spíše než ambiciózním plánováním. Organizace by měly začít inventarizací stávajících datových aktiv. Tento proces obvykle odhalí více komplexity a nekonzistence, než se původně očekávalo. Místo pokusu o komplexní transformaci AI by úspěšné společnosti měly identifikovat specifické, měřitelné problémy, kde AI může poskytnout jasnou hodnotu.

Základní práce vyžaduje podstatné úsilí, ale zůstává esenciální. To zahrnuje čištění dat, dokumentaci kontextu, implementaci řízení přístupu a pilotní testování s jasně definovanými metrikami úspěchu. Organizace by měly plánovat realistické časové rámce. Myslet na měsíce nebo roky spíše než týdny. Postupně budovat schopnosti.

Společnosti, které dokončí tuto základní práci, zatímco jejich konkurenti zůstávají soustředěni na výběr modelů AI, získají podstatné výhody. Volba technologie má menší význam než příprava, která umožňuje každému systému AI uspět.

Náklad čekání

Revoluce AI pokračuje bez ohledu na firemní připravenost. Společnosti mohou zvolit investici do řádné přípravy dat nyní. Nebo mohou pokusit se o nápravu řešení později za podstatně vyšší náklad a komplexitu. Organizace, které se stanou lídry v AI, uznají brzy, že úspěch závisí nejen na výběru nejsofistikovanějších modelů, ale na budování datových základů, které umožňují jakémukoli systému AI poskytovat smysluplnou firemní hodnotu.

Otázka, kterou čelí firemní lídři, není, jakou technologii AI implementovat. Je to, zda jejich organizace provedla tu obtížnou práci nezbytnou pro úspěch kterékoliv implementace AI. Schopnosti AI se zlepšují měsíčně. Udržitelná konkurenční výhoda náleží společnostem s datovými základy dostatečně robustními, aby podporovaly jakékoli technologické vývoj, které se objeví dále.

Soham Mazumdar je spoluzakladatel a CEO WisdomAI, společnosti, která je v čele řešení poháněných umělou inteligencí. Předtím, než založil WisdomAI v roce 2023, byl spoluzakladatelem a hlavním architektem ve společnosti Rubrik, kde sehrál klíčovou roli při rozšiřování společnosti po dobu 9 let. Soham dříve zastával vedoucí inženýrské role ve společnostech Facebook a Google, kde přispěl k jádrové vyhledávací infrastruktuře a byl oceněn cenou Google Founder's Award. Také spoluzaložil Tagtile, mobilní platformu pro věrnostní programy, kterou získala společnost Facebook. S dvacetiletými zkušenostmi v oblasti softwarové architektury a inovací umělých inteligencí je Soham zkušený podnikatel a technolog ve oblasti zálivu San Francisco.