Myslitelé
Když je “znalost” AI 50 let stará: Riziko compliance, které nelze ignorovat

Problém falešných AI poznatků je naléhavou výzvou, protože podniky zvyšují používání generativních nástrojů. Navzdory širokému nadšení pro přijetí AI existuje také silný proud kritiky. Kritičtí komentátoři často poukazují na zdánlivě náhodné, nepředvídatelné nesprávnosti ve výstupu AI, které podkopávají jeho hodnotu – a mohou dokonce ohrozit skutečnou újmu lidem, zejména v sektorech, jako je zdravotnictví a doprava, kde by falešné výstupy teoreticky mohly vést k všemu od špatného předpisu až po vlaky na kolizním kurzu.
Často se tyto nesprávnosti připisují AI “halucinacím” – instance, ve kterých AI generuje “nejlepší odhad” odpovědi, předávané se stejnou jistotou jako “skutečná” odpověď, místo aby informoval uživatele o mezery ve svých znalostech nebo schopnostech. Halucinace mohou být obtížně rozpoznatelné na první pohled – ale existuje tišší, stejně závažný problém, který je ještě těžší detekovat.
Dluh datové kvality: Achillesova pata AI
Když systémy AI čerpají z zastaralých, neúplných nebo nesprávných dat, dochází k falešným výstupům, ale jsou méně okamžitě rozpoznatelné. Například můžete požádat AI, aby identifikovala příznaky zdravotního stavu, a obdržet odpověď založenou na 50 let staré práci místo současné výzkumu. Výsledek je nepravděpodobné, že se bude zdát zjevně, směšně špatný – ale tato počáteční vrstva pravdivosti představuje skutečné riziko pro pacienta v otázce a poskytovatele zdravotní péče.
Totéž platí napříč průmysly – pokud data, která jsou krmena do modelu AI, zahrnují stará, zastaralá nebo částečná informace, existuje vysoké riziko falešných výstupů. A protože více společností integruje AI do obchodně kritických procesů, roste riziko vyvozování falešných závěrů z nedostatečně řízených dat.
Přesnost pro regulátora
Toto není pouze problém pro denní operace – je to také významná výzva compliance. Regulační požadavky se rychle vyvíjejí, aby řešily obavy o nesprávnou AI. Například řada raných regulačních akcí na AI se uskutečnila; zejména když Itálie dočasně zakázala ChatGPT kvůli obavám o soukromí, a Evropská rada pro ochranu údajů spustila specializovanou úkolu, aby koordinovala potenciální vynucovací akce proti ChatGPT.
Jednou z nejvýznamnějších regulačních změn byla přijetí zákona EU o AI, prvního komplexního právního rámce pro AI. Zákon stanoví povinnosti na základě úrovně rizika AI systémů, od “nepřijatelného rizika” systémů, které jsou zakázány, po “vysokého rizika” systémů, které čelí přísným požadavkům kolem transparentnosti, kvality dat, řízení a lidského dohledu.
Význam zákona EU o AI spočívá nejen v jeho ambiciózním rozsahu, ale také v precedensu, který vytváří. Regulátoři jasně stanovují, že AI bude podléhat závazným, vynutitelným pravidlům, a že organizace musí považovat compliance a transparentnost kolem toho, kde a jak se AI používá, za integrovanou součást přijetí AI, a notně jako následnou myšlenku.
Zákon má široký rozsah, s potenciálem ovlivnit velkou část AI vývoje. V jeho srdci je učinit AI bezpečným, zatímco respektuje základní práva a hodnoty. V rámci tohoto nového principiálního ekosystému přichází diagnóza potenciálních zdrojů pro AI nesprávnosti, včetně dat a datových sad, které krmit modely, modelové neprůhlednosti a přístupu, a systémového designu a použití. AI řešení jsou konstrukcí všech tří – problémy s kterékoli z nich mohou mít negativní výsledek. Nejen to, ale data, která jdou do designu, modelového vývoje, nasazení a provozu AI, jsou pravděpodobně primárně tvořena obchodními záznamy, které samy o sobě podléhají různým požadavkům compliance.
Jinými slovy, regulační prostředí kolem AI se stává stále přísnějším – a to platí stejně pro vstupní data jako pro výstupní data, i když ta druhá získá více pozornosti.
Pět kroků pro krmení AI kompatibilními, aktuálními, relevantními daty
Aby se vyřešila tato dvojí výzva – zajištění jak kompatibilního zpracování dat, tak vysokokvalitního vstupu, který umožňuje vysokokvalitní výstup – podniky potřebují kontrolu nad trénovacími a inferenčními daty. Bohužel, toto je něco, co mnohé podniky stále postrádají.
Aspoň by organizace měly aplikovat své širší programy compliance a řízení na AI iniciativy. Musí začít zachycovat a udržovat příslušné záznamy o datech, která krmit AI modely, jak modely a systémy jsou navrženy, jakož i rozhodnutí a obsah generovaný prostřednictvím AI.
Nicméně, stává se také kriticky důležitým pro organizace jít o krok dále a zajistit, aby měly plnou kontrolu nad všemi daty, která by mohla být teoreticky použita v AI nasazeních, ať už pro počáteční trénink nebo “živou” práci. To vyžaduje strategii vysokokvalitního řízení a úložiště dat, zajišťující, že všechna relevantní data jsou inteligentně shromážděna, vyčištěna, uložena, klasifikována a oprávněna. Aby se toho dosáhlo, organizace potřebují zvážit čtyři klíčové kroky:
1. Provenience a původ dat
To zahrnuje udržování záznamu o zdroji dat, jeho původu, vlastnictví a jakýchkoli změnách metadata (pokud je to povoleno) po celou dobu jeho životního cyklu. To také znamená udržování bohatých metadat a všech základních dokumentů nebo artefaktů, z nichž je odvozeno.
2. Autenticita dat
To vyžaduje udržování jasného řetězce péče o všechna data, ukládání objektů ve svých nativních formách a hašování objektů, které jsou přijaty, aby prokázaly, že data zůstávají nezměněna. Kromě toho musí organizace udržovat úplnou historii auditu pro každý objekt a pro všechny akce a události související se změnami.
3. Klasifikace dat
Stanovení povahy souboru nebo typu dat je důležité. Organizace potřebují být schopny řídit strukturovaná data, polostrukturovaná data a strukturované sady dat. Poskytnutí jedinečné schématy pro každou třídu může umožnit organizacím spravovat rozmanité sady dat bez jediného, pevného ontologie – vyhýbající se zbytečné manipulaci s daty, aby je donutily do neflexibilní datové struktury.
4. Normalizace dat
Stanovení společných definic a formátů metadat je důležité pro použití v analytice a AI řešení. Jasně definované schématy jsou důležitým prvkem, spolu s nástroji, které mohou transformovat nebo mapovat data, aby udržovaly konzistentní, normalizované pohledy na související data.
5. Oprávnění dat
Podniky potřebují jemná oprávnění, včetně na úrovni objektu nebo pole, založené na uživatelských nebo systémových profilech. To znamená, že správná data jsou k dispozici uživatelům a systémům, kteří jsou oprávněni k přístupu, zatímco omezují nebo omezují přístup k těm, kteří nejsou.
S těmito kritickými prvky na místě budou podniky nejlépe umístěny, aby zajistily, že data poskytovaná AI modelům jsou jak vysokokvalitní, tak kompatibilní. AI povede ke zlepšením a efektivitě napříč průmysly – ale aby se to stalo, je zapotřebí pevný základ dat.












