Connect with us

Inteligență artificială

Provocarea ‘Categorizării Rase’ pentru Sistemele de Sinteză a Imaginilor bazate pe CLIP

mm

O nouă cercetare din Statele Unite ale Americii a constatat că unul dintre modelele populare de vedere computerizată din spatele seriei foarte apreciate DALL-E, precum și multe alte modele de generare și clasificare a imaginilor, prezintă o tendință demonstrabilă către hipodescență – regula de categorizare a rasei (cunoscută și sub numele de ‘regula picăturii’) care categorizează o persoană cu o cantitate mică de “amestec” (adică non-caucaziană) de linie genetică în întregime într-o categorie “minoritară” de rasă.

Deoarece hipodescența a caracterizat unele dintre cele mai urâte capitole din istoria umanității, autorii noului studiu sugerează că astfel de tendințe în cercetarea și implementarea viziunii computerizate ar trebui să primească o atenție mai mare, nu în ultimul rând pentru că cadrul de susținere în cauză, descărcat aproape un milion de ori pe lună, ar putea să disemineze și să promoveze în continuare prejudecățile rasiale în cadrul downstream.

Arhitectura studiată în noul studiu este Contrastive Language Image Pretraining (CLIP), un model de învățare multimodală care învață asocieri semantice prin antrenarea pe perechi de imagini/captionuri extrase de pe internet – o abordare semi-supervizată care reduce costul semnificativ al etichetării, dar care este probabil să reflecte prejudecățile persoanelor care au creat captionurile.

Scriitor pe machine learning, specialist în domeniul sintezei de imagini umane. Foster head of research content la Metaphysic.ai.