Inteligență artificială

Oamenii de știință din domeniul calculatoarelor abordează problema prejudecăților în inteligența artificială

mm

Oamenii de știință din domeniul calculatoarelor de la Princeton și Stanford lucrează acum la rezolvarea problemelor legate de prejudecăți în inteligența artificială (IA). Ei lucrează la metode care conduc la seturi de date mai echitabile, conținând imagini cu oameni. Cercetătorii colaborează îndeaproape cu ImageNet, o bază de date cu peste 13 milioane de imagini. De-a lungul ultimului deceniu, ImageNet a contribuit la progresul viziunii calculate. Cu ajutorul metodelor lor, cercetătorii au recomandat îmbunătățiri pentru baza de date.

ImageNet conține imagini cu obiecte, peisaje și oameni. Cercetătorii care creează algoritmi de învățare automată care clasifică imagini utilizează ImageNet ca sursă de date. Din cauza dimensiunii masive a bazei de date, a fost necesară colectarea automată de imagini și annotarea acestora de către crowdsource. Acum, echipa ImageNet lucrează la corectarea prejudecăților și a altor probleme. Imaginile conțin adesea oameni care sunt consecințe neintenționate ale construirii ImageNet.

Olga Russakovsky este coautor și profesor asistent de știința calculatoarelor la Princeton.

“Viziunea calculată funcționează acum foarte bine, ceea ce înseamnă că este utilizată peste tot, în toate contextele”, a spus el. “Acest lucru înseamnă că acum este momentul să discutăm despre impactul pe care îl are asupra lumii și să ne gândim la aceste tipuri de probleme de echitate.”

În noul articol, echipa ImageNet a identificat sistematic concepte nevizuale și categorii ofensatoare. Aceste categorii include caracterizări rasiale și sexuale, iar echipa a propus eliminarea lor din baza de date. Echipa a dezvoltat, de asemenea, un instrument care permite utilizatorilor să specifice și să obțină seturi de imagini cu oameni, și poate face acest lucru în funcție de vârstă, exprimare de gen și culoare a pielii. Scopul este de a crea algoritmi care clasifică fețele și activitățile oamenilor din imagini într-un mod mai echitabil.

Lucrarea cercetătorilor a fost prezentată pe 30 ianuarie la Conferința Asociației pentru Calculatoare și Mașini pe tema Echității, Răspunderii și Transparenței de la Barcelona, Spania.

“Există o nevoie mare pentru cercetători și laboratoare cu expertiză tehnică de bază să se implice în aceste tipuri de conversații”, a spus Russakovsky. “Având în vedere realitatea că trebuie să colectăm date la scară largă, având în vedere realitatea că va fi făcută prin crowdsource, deoarece aceasta este cea mai eficientă și bine stabilită conductă, cum putem face acest lucru într-un mod mai echitabil – care nu cade în aceste tipuri de capcane anterioare? Mesajul de bază al acestui articol este despre soluții constructive.”

ImageNet a fost lansat în 2009 de un grup de oameni de știință din domeniul calculatoarelor de la Princeton și Stanford. A fost destinat să servească ca resursă pentru cercetători academici și educatori. Crearea sistemului a fost condusă de absolvent și membru al facultății Princeton Fei-Fei Li.

ImageNet a putut deveni o bază de date atât de mare de imagini etichetate datorită utilizării crowdsource-ului. Una dintre principalele platforme utilizate a fost Amazon Mechanical Turk (MTurk), iar lucrătorii au fost plătiți pentru a verifica imagini candidate. Acest lucru a cauzat unele probleme, iar existau multe prejudecăți și categorizări inadecvate.

Autorul principal Kaiyu Yang este student doctorand în știința calculatoarelor.

“Când ceri oamenilor să verifice imagini prin selectarea celor corecte dintr-un set mare de candidați, oamenii se simt presați să selecteze unele imagini, și aceste imagini tind să fie cele cu caracteristici distinctive sau stereotipe”, a spus el.

Prima parte a studiului a implicat filtrarea categoriilor de persoane potențial ofensatoare sau sensibile din ImageNet. Categoriile ofensatoare au fost definite ca cele care conțineau profanitate sau insulte rasiale sau de gen. O astfel de categorie sensibilă a fost clasificarea oamenilor în funcție de orientarea sexuală sau religie. Doisprezece studenți doctoranzi din medii diverse au fost aduși pentru a annota categoriile și au fost instruiți să marcheze o categorie ca sensibilă dacă erau nesiguri de ea. Aproximativ 54% din categorii au fost eliminate, sau 1.593 din cele 2.932 de categorii de persoane din ImageNet.

Lucrătorii MTurk au evaluat apoi “imaginabilitatea” categoriilor rămase pe o scară de la 1 la 5. 158 de categorii au fost clasificate ca fiind atât sigure, cât și imaginabile, cu o notă de 4 sau mai mare. Setul de categorii filtrate a inclus peste 133.000 de imagini, care pot fi foarte utile pentru antrenarea algoritmilor de viziune calculată.

Cercetătorii au studiat reprezentarea demografică a oamenilor din imagini, iar nivelul de prejudecată din ImageNet a fost evaluat. Conținutul sursă de la motoarele de căutare oferă adesea rezultate care supradimensionează bărbații, oamenii cu pielea deschisă la culoare și adulții între 18 și 40 de ani.

“Oamenii au descoperit că distribuțiile demografice în rezultatele căutării de imagini sunt foarte prejudecate, și acesta este motivul pentru care distribuția din ImageNet este, de asemenea, prejudecată”, a spus Yang. “În acest articol, am încercat să înțelegem cât de prejudecată este și să propunem o metodă pentru a echilibra distribuția.”

Cercetătorii au considerat trei atribute care sunt, de asemenea, protejate de legile antidiscriminare din SUA: culoarea pielii, exprimarea de gen și vârsta. Lucrătorii MTurk au annotat apoi fiecare atribut al fiecărei persoane dintr-o imagine.

Rezultatele au arătat că conținutul ImageNet are o prejudecată considerabilă. Cele mai subreprezentate au fost oamenii cu pielea întunecată, femeile și adulții peste 40 de ani.

Un instrument de interfață web a fost proiectat pentru a permite utilizatorilor să obțină un set de imagini care sunt echilibrate din punct de vedere demografic într-un mod ales de utilizator.

“Nu vrem să spunem care este modul corect de a echilibra demografia, deoarece nu este o problemă foarte simplă”, a spus Yang. “Distribuția poate fi diferită în diferite părți ale lumii – distribuția culorilor pielii în SUA este diferită de cea din țările asiatice, de exemplu. Așadar, lăsăm această întrebare utilizatorului nostru și îi oferim doar un instrument pentru a obține un subset echilibrat de imagini.”

Echipa ImageNet lucrează acum la actualizări tehnice ale hardware-ului și bazei de date. Ei încearcă, de asemenea, să implementeze filtrarea categoriilor de persoane și instrumentul de reechilibrare dezvoltat în această cercetare. ImageNet urmează să fie relansat cu actualizările, împreună cu o solicitare de feedback din partea comunității de cercetare a viziunii calculate.

Articolul a fost coautor și de studentul doctorand de la Princeton Klint Qinami și profesorul asistent de știință calculatoare Jia Deng. Cercetarea a fost sprijinită de Fundația Națională pentru Știință.

Alex McFarland este un jurnalist și scriitor de inteligență artificială, care explorează cele mai recente dezvoltări în domeniul inteligenței artificiale. El a colaborat cu numeroase startup-uri de inteligență artificială și publicații din întreaga lume.