Spojte se s námi

Myšlenkové vůdce

Proměna nápadů s umělou inteligencí v dopad: Praktický rámec pro hodnocení konceptu a dalších aspektů

mm

Umělá inteligence už dávno překonala pouhý humbuk kolem ní. Většina podniků nyní od ní očekává hmatatelnou hodnotu – méně manuálních úkolů, lepší rozhodnutí a rychlejší detekci anomálií. Kromě toho požadují řešení, která jsou spolehlivá a snadno implementovatelná.

Signály z trhu jsou znepokojivé. v 202542 % společností uvedlo, že ukončily své probíhající iniciativy v oblasti umělé inteligence. Toto číslo se ve srovnání s předchozím rokem 2024 zvýšilo o 25 %. Navzdory nárůstu pilotních projektů a proof-of-concepts (PoCs) je dosažení úspěchu i nadále obtížné. Studie naznačují, že přibližně 80 % projektů umělé inteligence selže. Dále pouze asi 11 % organizací dokázalo úspěšně škálovat své prototypy na systémy podnikové úrovně. Je zřejmé, že něco nefunguje.

Proč selhávají PoC s umělou inteligencí: Tři základní příčiny

Důvod 1: Paralýza pilota a špatně nastavené priority

V sandboxových prostředích týmy často vyvíjejí působivé modely umělé inteligence a přistupují k nim jako k vědeckým projektům. Poté však mají tendenci zanedbávat cestu k produkčnímu prostředí – ignorují základní aspekty, jako je integrace, autentizace, pozorovatelnost, správa a přijetí uživateli.

Problém sladění sahá hlouběji: bez sdílených metrik úspěchu se oddělení táhnou různými směry. Produkty se snaží o nové funkce, infrastruktura posiluje zabezpečení, datové týmy sanují procesy a compliance navrhují zásady – často nezávisle na sobě. Výsledkem je pohyb bez dynamiky.

Bez jednotných cílů nemají firmy vzájemné porozumění tomu, čeho by měla umělá inteligence dosáhnout a jak k implementaci přistupovat.

Důvod 2: Kvalita dat a oddělená data

Je dobře známo, že umělá inteligence vyžaduje obrovské množství dat. Navzdory značným investicím do svých datových platforem se mnoho organizací potýká s nekonzistentními, neúplnými, duplicitními nebo zastaralými daty. Mezi příklady patří fragmentovaný přístup nebo nejasné vlastnictví a původ. Tyto problémy zvyšují náklady, zpomalují dodání a nechávají PoC (potvrzení o shodě) v nejistotě.

Důvod 3: Měření nesprávných věcí

Technické týmy hodnotí modely umělé inteligence na základě metrik jako je přesnost, spolehlivost nebo správnostTyto metriky ukazují, jak dobře si model vede v porovnání s náhodným odhadem.

Vedení však určuje financování na základě obchodních výsledků. Přesnost bez dopadu není důležitá. Organizace by měly výkon modelu promítnout do ušetřeného času, získaných příjmů, ušetřených nákladů a snížených rizik – a o těchto metrikách by měly konzistentně informovat.

Sedmikrokový rámec pro hodnocení nápadů v oblasti umělé inteligence

Níže uvedený rámec představuje strukturovaný způsob hodnocení nápadů v oblasti umělé inteligence. Jednotlivé kroky vycházejí z výzkumu v oboru, praktických zkušeností a poznatků z nejnovějších zpráv.

1. Definujte problém a odpovědnost

Každá silná iniciativa v oblasti umělé inteligence začíná jasně definovaným obchodním problémem a zodpovědným vlastníkem projektu. Výzva by měla být specifická, měřitelná a dostatečně významná, aby na ní záleželo – například vysoká míra odchodu zákazníků nebo pomalé schvalování úvěrů. A odpovědnost by měla nést vedoucí pracovník, který řešení implementuje.

Například, Technologie Lumen vyčíslila, že její obchodní zástupci stráví průzkumem potenciálních zákazníků čtyři hodiny. Když byla do procesu zavedena automatizace nabídla 50 milionů dolarů ve zdrojích ročně.

2. Vyhodnoťte vhodnost úkolu

Dalším krokem je posouzení vhodnosti úkolu. Ne každý proces těží z umělé inteligence. Ideálními kandidáty jsou opakující se úkoly s velkým objemem práce, zatímco vysoce riziková rozhodnutí často stále vyžadují lidský dohled.

Klíčovou otázkou, kterou si je třeba položit, je, jaká míra chybovosti může být tolerována. V citlivých oblastech vyžadují i ​​drobné chyby zapojení člověka s příslušnými schváleními. Někdy může jednodušší automatizace nebo redesign přinést stejný výsledek rychleji a s nižšími náklady.

3. Posouzení připravenosti dat

Vysoce kvalitní, dostupná a řízená data jsou páteří umělé inteligence. Organizace musí zkoumat, zda jsou jejich data dostatečně dostupná a reprezentativní a zda jsou legálně použitelná. Musí také určit, zda jsou řešeny problémy s kvalitou, jako jsou duplikáty, chybějící hodnoty, zkreslení nebo drift. Dále musí zajistit, aby byly zavedeny mechanismy správy, jako je vlastnictví, původ a uchovávání dat. V ideálním případě jsou tyto mechanismy podporovány nástroji, které snižují potřebu ručního čištění.

4. Určení proveditelnosti a doby realizace

Pak se klíčovými faktory stávají proveditelnost a doba dosažení hodnoty. PoC by měl stanovit základní linii během týdnů, nikoli měsíců. Pokud ne, může proces urychlit zúžení rozsahu nebo snížení závislostí na datech.

Týmy by měly zjistit, zda mají potřebné dovednosti, infrastrukturu a rozpočet, včetně těch, které se týkají strojového učení (ML), datového inženýrství, MLOps, odborných znalostí v dané oblasti, zabezpečení a dodržování předpisů. Pokud ne, je důležité naplánovat školení nebo externí podporu.

Týmy by dále měly včas odhadnout QPS, SLO latence a náklady na tokeny/jednotky, aby zjistily, zda lze realisticky splnit očekávání ohledně objemů transakcí a latence.

5. Odhadněte dopad na podnikání a návratnost investic (ROI)

Pátým krokem je odhad obchodního dopadu a návratnosti investic. Vedoucí pracovníci by se neměli zaměřovat pouze na přesnost modelu, ale měli by zvážit komplexní sadu obchodních metrik – jako je ušetřené hodiny, vyřešené případy, zvýšení míry konverze a snížení počtu oprav nebo reklamací. Dále by měli zohlednit celkové náklady na vlastnictví, které zahrnují náklady na infrastrukturu, licence, využití API nebo tokenů, údržbu, monitorování a rekvalifikaci. V ideálním případě by v rané fázi sladění s finančními záležitostmi měli zohlednit také čistou současnou hodnotu, dobu návratnosti a analýzu citlivosti. Tato šíře hodnocení zvyšuje šanci na škálování.

6. Identifikujte rizika a regulační omezení

Následuje riziko a regulace. Každý systém umělé inteligence musí respektovat požadavky na soukromí, bezpečnost a spravedlnost, které se liší v závislosti na jurisdikci. Patří mezi ně GDPR a zákon o umělé inteligenci EU, rámce USA, jako je NIST RMF, britské regulační principy podporující inovace a nově vznikající normy ISO/IEC po celém světě.

Kontext odvětví také přidává specifické požadavky: pojišťovny čelí povinnostem týkajícím se solventnosti a spravedlnosti, zatímco zdravotní péče vyžaduje vysvětlitelnost a klinické ověření. Jasný přehled o těchto postupech v oblasti dodržování předpisů zabraňuje nákladným překvapením.

7. Plán integrace a přijetí

A konečně, nesmí se přehlížet důležitost integrace a přijetí. Organizace až příliš často oslavují úspěšný prototyp, jen aby zjistily, že se zastaví, když je předán do produkce.

V některých případech byly technicky robustní pilotní projekty opuštěny jednoduše proto, že způsobovaly více problémů, než jich řešily. Mezi běžná úskalí patří nesoulad pracovních postupů, duplicitní pracovní zátěž zaměstnanců nebo nedostatek důvěry, který může být způsoben tím, že uživatelé nejsou proškoleni nebo s nimi nebyly konzultovány.

Aby se tomu zabránilo, je nutné od samého začátku zvážit integraci, aby se zajistilo, že se umělá inteligence hladce začlení do stávajících systémů. Silné řízení změn – školení, jasná komunikace, aktivní zastánci a pobídky – buduje přijetí.

Stejně důležitá je provozuschopnost, která zahrnuje definování SLA a SLO, monitorování odchylek nebo zneužití a udržování možností vrácení zpět. Tato opatření zajišťují odolnost a posilují důvěru, čímž se pilotní projekty stávají trvalými řešeními.

Rozhodovací matice: Porovnání nápadů s umělou inteligencí

Rozhodovací matice je praktický nástroj pro současné porovnávání více nápadů v oblasti umělé inteligence. Každému rozměru rámce je přiřazena váha odrážející jeho důležitost. Čím vyšší skóre, tím silnější je argument pro pokračování (součet všech vah je 100).

Týmy pak mohou porovnat výkonnost každého nápadu s podrobnými pásmy v rámci každé dimenze. Tato skóre jsou sloučena do jednoho čísla: Vážené skóre = (součet vah × normalizovaných skóre)/100.

Váhy nejsou fixní. Měly by odrážet priority vaší organizace. Například ve vysoce regulované bance by si Riziko a regulace mohly zasloužit váhu 20 nebo 25 místo 10. V rychle se rozvíjející SaaS společnosti by však Dopad na podnikání a návratnost investic mohly mít váhu 25, zatímco Regulace by mohla mít váhu pouze 5. A odvětví s vysokou datovou náročností (např. farmaceutický průmysl, pojišťovnictví) by mohla klást větší důraz na připravenost dat.

Případové studie: Aplikace rámce

Abychom ukázali, jak se tento rámec promítá do konkrétních rozhodnutí, jsou dva níže uvedené příklady vyhodnoceny podle stejných sedmi dimenzí, jaké se používají v rozhodovací matici. Pro demonstraci logiky jsme použili jeden příklad váhového schématu. V praxi by však každá společnost měla tato čísla upravit.

Detaily projektu Pojištění: Třídění pojistných událostí

Velká pojišťovna se potýkala se zpožděním ve vyřizování pojistných událostí, protože likvidátoři pojistných událostí trávili hodiny čtením a shrnováním poznámek.

Bankovnictví: Schvalování úvěrů

Retailová banka chtěla plně automatizovat schvalování úvěrů. Banka doufala, že urychlí schvalování a sníží náklady, aby mohla konkurovat fintech společnostem.

Problém a vlastnictví

Hmotnost: 15

Hodnocení: 0 = vágní/nízkohodnotný problém, žádný vlastník → 5 = jasný, měřitelný problém s odpovědným sponzorem

Jasný problém: zpoždění ve vyřizování pojistných událostí.

Silný a odpovědný vlastník (vedoucí oddělení reklamací).

Skóre: 5 / 5

Nejasný cíl.

Žádný jasný odpovědný majitel firmy.

Skóre: 2 / 5

Vhodnost úkolu

Hmotnost: 10

Skóre: 0 = vysoké riziko/nízká tolerance, žádná shoda → 5 = silná shoda (opakující se, podpora rozhodování, interpretovatelná nebo jasná augmentační role)

Opakující se shrnující úkol, zvládnutelné riziko s lidským dohledem.

Skóre: 4 / 5

Vysoké riziko, téměř nulová tolerance. Špatné využití pro plnou automatizaci.

Skóre: 1 / 5

Připravenost dat

Hmotnost: 15

Bodování: 0 = žádná relevantní data → 5 = dostatek, kvalitní a dostupná data s řízeným řízením

Bohaté historické záznamy, dobrá kvalita a řízené.

Skóre: 4 / 5

Fragmentovaná data úřadů, riziko zaujatosti, nedostatečná správa a řízení.

Skóre: 2 / 5

Proveditelnost a doba realizace

Hmotnost: 15

Hodnocení: 0 = nelze vytvořit prototyp za méně než 12 týdnů, chybí dovednosti, mezery v infrastruktuře → 5 = základní úroveň možná za méně než 4 týdny, dovednosti k dispozici, infrastruktura připravena.

Prototyp je proveditelný během několika týdnů s využitím generování s rozšířeným vyhledáváním.

Skóre: 4 / 5

Prototyp by trval měsíce. Chybí dovednosti a řízení.

Skóre: 2 / 5

Dopad na podnikání a návratnost investic

Hmotnost: 20

Úspory nákladů: 0 = žádné, 2 = <5 %, 4 = 5–10 %, 6 = 10–20 %, 8 = 20–30 %, 10 = >30 %.

Úspora času: 0 = žádná, 2 = <10 %, 4 = 10–25 %, 6 = 25–50 %, 8 = 50–75 %, 10 = >75 %.

Dopad na tržby: 0 = žádný, 2 = <5 %, 4 = 5–10 %, 6 = 10–20 %, 8 = 20–30 %, 10 = >30 %.

Uživatelská zkušenost: 0 = žádná změna, 2 = malá, 4 = střední, 6 = významná, 8 = vysoká, 10 = transformační.

Zájem/přijetí: 0 = žádný, 2 = mírný, 4 = znatelný, 6 = významný, 8 = lídr na trhu, 10 = rušivý.

Roční úspora 1.8 milionu EUR. Návratnost za méně než rok.

Skóre:

Úspora nákladů: 7/10 (úspora ~20 %)

Úspora času: 6/10 (~25–50 %)

Dopad na tržby: 4/10 (~5–10 %)

Uživatelská zkušenost: 6/10 (významné)

Zájem/přijetí: 6/10 (významný)

→ Průměr ≈ 5.8/10

→ Hodnocení: 3/5

Atraktivní potenciál růstu, ale převážený regulačním a reputačním rizikem.

Skóre:

Úspora nákladů: 2/10 (<5 %)

Úspora času: 2/10 (<10 %)

Dopad na tržby: 3/10 (~5 %)

Uživatelská zkušenost: 4/10 (střední)

Zájem/přijetí: 3/10 (patrné)

→ Průměr ≈ 2.8/10

→ Hodnocení: 1/5

Riziko a regulace

Hmotnost: 10

Bodové hodnocení: 0 = vysoké neřízené riziko → 5 = nízké riziko, zvládnutelné, cesta k dodržování předpisů jasná

V souladu s GDPR. Rizika zvládnutelná díky interakci s lidmi.

Skóre: 4 / 5

Závažná regulační expozice. Mezery ve spravedlnosti, vysvětlitelnosti a dodržování předpisů.

Skóre: 1 / 5

Integrace a přijetí

Hmotnost: 15

Hodnocení: 0 = závažné narušení/žádný plán → 5 = bezproblémová integrace s pracovními postupy, zavedený plán školení/změn

Hladká integrace do konzole pro seřizování. Vyžaduje se školení a postupné zavádění.

Skóre: 4 / 5

Narušilo by to pracovní postupy upisování. Nízká pravděpodobnost přijetí.

Skóre: 2 / 5

Vážený výpočet

= Σ (váha × normalizované skóre) / 100

(15×5 + 10×4 + 15×4 + 15×4 + 20×3 + 10×4 + 15×4) / 100 = 395 / 100

= 4/5 XNUMX XNUMX

→ Vysoká priorita

(15×2 + 10×1 + 15×2 + 15×2 + 20×1 + 10×1 + 15×2) / 100 = 160/100

= 1.6/5 XNUMX XNUMX

→ Není životaschopné

Výsledek Pokračovat s postupným zaváděním a monitorováním. Stop plná automatizace. Změna rozsahu k rozšířenému upisování (umělá inteligence podporuje, člověk rozhoduje).

Tyto dva případy ukazují, jak sedmikrokový rámec přeměňuje abstraktní hodnocení na konkrétní rozhodnutí. V pojišťovnictví strukturované hodnocení odhalilo silného kandidáta, kterého stojí za to sledovat. V bankovnictví odhalilo kritické mezery, které ukázaly, že projekt je vhodnější pro jednodušší automatizaci.

Závěr: Uzavření cyklu od kořenových příčin k činům

Zacházení s umělou inteligencí jako s jakoukoli jinou strategickou investicí – definování problému, testování proveditelnosti, kvantifikace dopadu na podnikání, řízení rizik a zajištění přijetí – dramaticky zvyšuje šance na proměnu nápadů v hodnotu podniku.

Rozhodovací matice a systém bodování poskytují strukturovaný způsob, jak porovnávat možnosti, alokovat zdroje a sebejistě ukončovat iniciativy, které nemají dostatečný potenciál. Společnosti se od experimentování poháněného humbukem nebo strachem z promeškání příležitosti přesouvají k disciplinovanému provádění, které vytváří trvalou konkurenční výhodu.

Olena Domanska je globální vedoucí oddělení kompetencí ve společnosti AvengaVede mezioborové týmy, které pomáhají organizacím převádět nově vznikající technologie do měřitelných obchodních výsledků. Její práce se zaměřuje na datovou strategii, zavádění umělé inteligence a škálovatelné cloudové architektury.