Artificiell intelligens
Studie visar att AI-modeller inte matchar mÀnsklig visuell bearbetning

En ny studie frÄn York University visar att djupa konvolutionella neurala nÀtverk (DCNN) inte matchar mÀnsklig visuell bearbetning genom att anvÀnda konfigurerad formuppfattning. Enligt professor James Elder, medförfattare till studien, kan detta fÄ allvarliga och farliga verkliga konsekvenser för AI-tillÀmpningar.
Den nya studien med titeln "Modeller för djupinlĂ€rning lyckas inte fĂ„nga den konfigurerade karaktĂ€ren hos mĂ€nsklig formuppfattningâ publicerades i tidskriften Cell Press iScience.
Det var en samarbetsstudie av Elder, som innehar York Research Chair in Human and Computer Vision, samt som meddirektör för Yorks Center for AI & Society, och professor Nicholas Baker, som Àr bitrÀdande psykologiprofessor och tidigare VISTA postdoktor vid York.
Roman Visual Stimuli "Frankensteins"
Teamet förlitade sig pÄ nya visuella stimuli kallade "Frankensteins", som hjÀlpte dem att utforska hur bÄde den mÀnskliga hjÀrnan och DCNNs bearbetar holistiska, konfigurerade objektegenskaper.
"Frankensteins Àr helt enkelt föremÄl som har tagits isÀr och satts ihop pÄ fel sÀtt", sÀger Elder. "Som ett resultat har de alla rÀtt lokala funktioner, men pÄ fel platser."
Studien fann att DCNN inte Àr förvirrade av Frankensteins som det mÀnskliga visuella systemet Àr. Detta avslöjar en okÀnslighet för konfigurerade objektegenskaper.
"VĂ„ra resultat förklarar varför djupa AI-modeller misslyckas under vissa förhĂ„llanden och pekar pĂ„ behovet av att övervĂ€ga uppgifter bortom objektigenkĂ€nning för att förstĂ„ visuell bearbetning i hjĂ€rnan", fortsĂ€tter Elder. "Dessa djupa modeller tenderar att ta "genvĂ€gar" nĂ€r de löser komplexa igenkĂ€nningsuppgifter. Ăven om dessa genvĂ€gar kan fungera i mĂ„nga fall, kan de vara farliga i nĂ„gra av de verkliga AI-applikationer som vi för nĂ€rvarande arbetar med med vĂ„r industri och regeringspartners."

Bild: York University
Verkliga konsekvenser
Elder sÀger att en av dessa tillÀmpningar Àr trafikvideosÀkerhetssystem.
"FöremĂ„len i en trafikerad trafikplats - fordonen, cyklarna och fotgĂ€ngarna - hindrar varandra och kommer fram till en förares öga som ett virrvarr av frĂ„nkopplade fragment", sĂ€ger han. "HjĂ€rnan mĂ„ste gruppera dessa fragment korrekt för att identifiera de korrekta kategorierna och platserna för objekten. Ett AI-system för trafiksĂ€kerhetsövervakning som bara kan uppfatta fragmenten individuellt kommer att misslyckas med denna uppgift, vilket potentiellt missförstĂ„r riskerna för utsatta trafikanter.â
Forskarna sÀger ocksÄ att modifieringar av trÀning och arkitektur som syftar till att göra nÀtverk mer hjÀrnliknande inte uppnÄdde konfigurerad bearbetning. Inget av nÀtverken kunde korrekt förutsÀga bedömningar av mÀnskliga objekt försök för försök.
"Vi spekulerar i att för att matcha mÀnsklig konfigurationskÀnslighet mÄste nÀtverk trÀnas för att lösa ett bredare utbud av objektuppgifter bortom kategoriigenkÀnning," avslutar Elder