výhonek Předpojatost a spravedlnost systémů založených na umělé inteligenci v rámci finanční kriminality - Unite.AI
Spojte se s námi

Myšlenkové vůdce

Předpojatost a spravedlnost systémů založených na umělé inteligenci v rámci finanční kriminality

mm

Zveřejněno

 on

Pokud jde o boj proti finanční kriminalitě, existují výzvy, které přesahují rámec pouhého zastavení podvodníků nebo jiných špatných aktérů.

Některé z nejnovějších pokročilých technologií, které jsou uváděny na trh, mají často své vlastní specifické problémy, které je třeba vzít v úvahu během fází přijetí, aby bylo možné úspěšně bojovat proti podvodníkům bez regulačních dopadů. Při odhalování podvodů může ke spravedlnosti modelu a zkreslení dat dojít, když je systém silněji vážen nebo postrádá zastoupení určitých skupin nebo kategorií dat. Teoreticky by prediktivní model mohl mylně spojovat příjmení z jiných kultur s podvodnými účty nebo falešně snížit riziko v rámci segmentů populace pro určitý typ finančních aktivit.

Předpojaté systémy umělé inteligence mohou představovat vážnou hrozbu, když může být ovlivněna reputace, a vyskytuje se, když dostupná data nejsou reprezentativní pro populaci nebo fenomén průzkumu. Tato data nezahrnují proměnné, které správně zachycují jev, který chceme předpovídat. Alternativně by data mohla zahrnovat obsah vytvořený lidmi, který může obsahovat zaujatost vůči skupinám lidí, zděděnou kulturními a osobními zkušenostmi, což vede ke zkreslení při rozhodování. I když se na první pohled mohou data zdát objektivní, stále je shromažďují a analyzují lidé, a proto mohou být zkreslená.

I když to není nic špatného, ​​pokud jde o nápravu nebezpečí diskriminace a nespravedlnosti v systémech umělé inteligence nebo trvalé řešení problému spravedlnosti a zmírnění zkreslení při vytváření modelu a použití strojového učení, tyto problémy je třeba vzít v úvahu jak pro společnost, tak pro společnost. obchodní důvody.

Dělat správnou věc v AI

Řešení zaujatosti v systémech založených na AI je nejen správná věc, ale také chytrá věc pro podnikání – a sázky na vedoucí pracovníky jsou vysoké. Předpojaté systémy umělé inteligence mohou finanční instituce svést na špatnou cestu tím, že nespravedlivě přidělují příležitosti, zdroje, informace nebo kvalitu služeb. Mají dokonce potenciál porušovat občanské svobody, představovat újmu pro bezpečnost jednotlivců nebo mít dopad na blaho člověka, jsou-li vnímány jako znevažující nebo urážlivé.

Pro podniky je důležité pochopit sílu a rizika zkreslení AI. Ačkoli to instituce často nezná, neobjektivní systém založený na umělé inteligenci by mohl používat škodlivé modely nebo data, která odhalují rasovou nebo genderovou zaujatost při rozhodování o půjčce. Informace, jako jsou jména a pohlaví, by mohly být zástupnými znaky pro kategorizaci a identifikaci žadatelů nezákonným způsobem. I když je zaujatost neúmyslná, stále vystavuje organizaci riziku nedodržením regulačních požadavků a může vést k tomu, že určitým skupinám lidí budou nespravedlivě odepřeny půjčky nebo úvěrové linky.

V současné době nemají organizace k dispozici nástroje, které by úspěšně zmírnily zaujatost v systémech AI. Ale vzhledem k tomu, že AI je stále více nasazována napříč podniky, aby poskytovala informace o rozhodnutích, je životně důležité, aby se organizace snažily omezit zaujatost, a to nejen z morálních důvodů, ale aby vyhověly regulačním požadavkům a zvýšily příjmy.

Kultura a implementace „s ohledem na spravedlnost“.

Nejpřínosnější výsledky budou mít řešení, která jsou zaměřena na design a implementaci s ohledem na spravedlnost. Poskytovatelé by měli mít analytickou kulturu, která považuje odpovědné získávání, manipulaci a správu dat za nezbytné součásti algoritmické spravedlnosti, protože pokud jsou výsledky projektu umělé inteligence generovány neobjektivními, kompromitovanými nebo zkreslenými datovými soubory, nebudou dotčené strany dostatečně chráněny před diskriminační újmu.

Toto jsou prvky férovosti dat, které musí mít týmy datové vědy na paměti:

  • Reprezentativnost:V závislosti na kontextu může nedostatečné nebo nadměrné zastoupení znevýhodněných nebo zákonem chráněných skupin ve vzorku dat vést k systematickému znevýhodňování zranitelných stran ve výsledcích trénovaného modelu. Abychom se vyhnuli takovýmto druhům zkreslení vzorků, bude mít zásadní význam odborná znalost domény pro posouzení souladu mezi shromážděnými nebo získanými údaji a základní populací, která má být modelována. Členové technického týmu by měli nabídnout prostředky k nápravě, aby se odstranily reprezentativní nedostatky ve vzorkování.
  • Vhodné pro daný účel a dostatek: Je důležité pochopit, zda jsou shromážděná data dostatečná pro zamýšlený účel projektu. Nedostatečné soubory dat nemusí spravedlivě odrážet kvality, které by měly být zváženy, aby se dosáhlo odůvodněného výsledku, který je v souladu s požadovaným účelem systému umělé inteligence. V souladu s tím by členové projektového týmu s technickými a politickými kompetencemi měli spolupracovat na určení, zda je množství dat dostatečné a vhodné pro daný účel.
  • Integrita zdroje a přesnost měření:Efektivní zmírňování zkreslení začíná na samém začátku procesů extrakce a sběru dat. Jak zdroje, tak nástroje měření mohou do datového souboru vnášet diskriminační faktory. Aby bylo zajištěno diskriminační nepoškozování, musí mít vzorek dat optimální integritu zdroje. To zahrnuje zajištění nebo potvrzení, že procesy shromažďování dat zahrnovaly vhodné, spolehlivé a nestranné zdroje měření a robustní metody sběru.
  • Aktuálnost a aktuálnost: Pokud datové sady obsahují zastaralá data, pak změny v základní distribuci dat mohou nepříznivě ovlivnit zobecnitelnost trénovaného modelu. Za předpokladu, že tyto distribuční posuny odrážejí měnící se sociální vztahy nebo dynamiku skupiny, může tato ztráta přesnosti týkající se skutečných charakteristik základní populace vnést do systému AI zkreslení. Aby se zabránilo diskriminačním výsledkům, měla by být prověřována včasnost a aktuálnost všech prvků souboru údajů.
  • Relevance, vhodnost a znalost domény: Pochopení a použití nejvhodnějších zdrojů a typů dat jsou zásadní pro vybudování robustního a nezaujatého systému umělé inteligence. Pro výběr optimálně relevantních měřicích vstupů, které přispívají k rozumnému řešení definovaného řešení, je znalost solidní domény základní distribuce populace a prediktivního cíle projektu. Doménoví experti by měli úzce spolupracovat s týmy datové vědy, aby jim pomohli určit optimálně vhodné kategorie a zdroje měření.

Zatímco systémy založené na AI pomáhají v procesech automatizace rozhodování a přinášejí úspory nákladů, finanční instituce zvažující AI jako řešení musí být ostražité, aby zajistily, že nedojde k zaujatým rozhodnutím. Vedoucí odpovědní za dodržování předpisů by měli být v úzkém kontaktu se svým týmem pro vědu o datech, aby potvrdili, že schopnosti umělé inteligence jsou odpovědné, efektivní a nezaujaté. Mít strategii, která podporuje zodpovědnou umělou inteligenci, je správná věc a může také poskytnout cestu k souladu s budoucími předpisy o umělé inteligenci.

Danny Butvinik je hlavní datový vědec ve společnosti Pěkná aktivaceposkytující technické a profesionální vedení. Danny je odborníkem na umělou inteligenci a datovou vědu, je autorem mnoha vědeckých článků a článků. Ve své současné roli řídí velkou skupinu datových vědců a přispívá k růstu inovací a duševního vlastnictví společnosti s více než 15letými zkušenostmi z výzkumu, vývoje a řízení v oblasti datové vědy a vývoje softwaru.