csonk A kutatók új eszközt fejlesztenek ki a számítógépes látás torzításának leküzdésére – Unite.AI
Kapcsolatba velünk

Etika

A kutatók új eszközt fejlesztenek ki a számítógépes látás torzításának leküzdésére

Közzététel:

 on

A mesterséges intelligencia (AI) területén a közelmúltban felmerült egyik probléma a számítógépes látás torzítása. Sok szakértő most fedez fel elfogultságot az AI-rendszereken belül, ami torz eredményekhez vezet a különböző alkalmazásokban, például a bírósági ítélethozatali programokban.

A jövőben nagy erőfeszítések folynak e problémák némelyikének kijavítására, a legújabb fejlesztés a Princeton Egyetemtől érkezik. Az intézmény kutatói olyan új eszközt hoztak létre, amely képes jelezni az AI-rendszerek betanítására használt képek lehetséges torzításait. 

A munka augusztus 24-én mutatták be a számítógépes látás virtuális európai konferenciáján. 

Elfogultság az AI-rendszerekben

A jelenlegi mesterséges intelligencia-rendszerekben jelenlévő torzítás egyik fő oka az, hogy gyakran képezik őket online forrásokból származó nagy képkészletekre. Ezek a képek lehetnek sztereotipek, és amikor a számítógépes látás fejlesztésére irányulnak, az eredmény akaratlanul is befolyásolt modellek lehetnek. A számítógépes látás az, ami lehetővé teszi a számítógépek számára az emberek, tárgyak és cselekvések azonosítását. 

A kutatók által kifejlesztett eszköz nyílt forráskódú, és képes automatikusan feltárni a vizuális adatkészletek lehetséges torzításait. Úgy működik, hogy azelőtt intézkedik, hogy a képkészleteket a számítógépes látásmodellek betanítására használnák, és az alulreprezentáltság és a sztereotípiák körüli problémák orvosolhatók, mielőtt hatást váltanának ki. 

FELÜLVIZSGÁL

Az új eszköz a REVISE nevet viseli, és statisztikai módszerekre támaszkodik az adatkészlet lehetséges torzításainak azonosítására. A három területre összpontosít: tárgyalapú, nemi alapú és földrajzi alapú. 

A REVISE teljesen automatikus, és a korábbi módszerekre épült, amelyek magukban foglalták az adatkészletek képeinek szűrését és kiegyensúlyozását, hogy a felhasználó jobban irányíthassa. 

Az új eszköz a meglévő képannotációkra és mérésekre támaszkodik az adathalmaz tartalmának elemzéséhez. A meglévő megjegyzések némelyike ​​tartalmazza az objektumok számát és a képek származási országát. 

Az eszköz működésének egyik példájában a REVISE megmutatta, hogy az emberekről és a virágokról készült képek nemtől függően eltérőek. A hímek nagyobb valószínűséggel jelentek meg virággal szertartásokon vagy találkozókon, a nőstények pedig festményeken vagy színpadi forgatókönyveken.

Olga Russaskovsky számítástechnikai adjunktus és a Visual AI Lab vezető kutatója. A tanulmányt Angelina Wang végzős hallgatóval és Arvind Narayanan számítástechnikai professzorral közösen írták.

Miután az eszköz az eltéréseket azonosítja, „akkor felmerül a kérdés, hogy ez egy teljesen ártalmatlan tény, vagy valami mélyebb dolog történik, és ezt nagyon nehéz automatizálni” – mondta Russaskovsky. 

Alulreprezentált vagy hamisan reprezentált régiók

A világ különböző régiói alulreprezentáltak a számítógépes látási adatkészletekben, és ez torzításhoz vezethet az AI-rendszerekben. Az egyik megállapítás az volt, hogy drámaian nagyobb mennyiségű kép érkezik az Egyesült Államokból és az európai országokból. A REVISE azt is feltárta, hogy a világ más részeiről származó képeken gyakran nem szerepelnek a helyi nyelvű képaláírások, ami azt jelenti, hogy sok származhat egy turista nézetéből a nemzetről. 

„…ez a földrajzi elemzés azt mutatja, hogy a tárgyfelismerés továbbra is meglehetősen elfogult és kirekesztő lehet, és egyenlőtlenül érintheti a különböző régiókat és embereket” – folytatta Russaskovsky. 

"A számítástechnika adatkészlet-gyűjtési gyakorlatát a közelmúltig nem vizsgálták ilyen alaposan" - mondta Wang. Amikor a képgyűjtésről van szó, „kikaparják őket az internetről, és az emberek nem mindig veszik észre, hogy a képeiket [adatkészletekben] használják. Többféle embercsoporttól kellene képeket gyűjtenünk, de amikor ezt tesszük, ügyeljünk arra, hogy a képeket tiszteletteljes módon kapjuk meg.”

Vicente Ordonez-Roman a Virginiai Egyetem számítástechnikai adjunktusa. 

„Az eszközök és a benchmarkok fontos lépést jelentenek… lehetővé teszik számunkra, hogy ezeket a torzításokat a folyamat elején megragadjuk, és újragondoljuk a problémafelállításunkat és a feltételezésünket, valamint az adatgyűjtési gyakorlatunkat” – mondta Ordonez-Roman. „A számítógépes látásban van néhány sajátos kihívás a reprezentációval és a sztereotípiák terjesztésével kapcsolatban. A Princeton Visual AI Labhoz hasonló munkái segítenek tisztázni és felhívni a számítógépes látással foglalkozó közösség figyelmét néhány ilyen problémára, és stratégiákat kínálnak ezek enyhítésére.”

A kutatók által kifejlesztett új eszköz fontos lépés az AI-rendszerekben jelenlévő torzítás orvoslásában. Itt az ideje, hogy kijavítsuk ezeket a problémákat, mivel a rendszerek előrehaladtával és bonyolultabbá válásával ez sokkal nehezebb lesz. 

 

Alex McFarland mesterséges intelligencia újságíró és író, aki a mesterséges intelligencia legújabb fejleményeit vizsgálja. Számos AI startup vállalkozással és publikációval működött együtt világszerte.