Anslut dig till vÄrt nÀtverk!

Artificiell intelligens

Studie visar att AI-modeller inte matchar mÀnsklig visuell bearbetning

mm

En ny studie frĂ„n York University visar att djupa konvolutionella neurala nĂ€tverk (DCNN) inte matchar mĂ€nsklig visuell bearbetning genom att anvĂ€nda konfigurerad formuppfattning. Enligt professor James Elder, medförfattare till studien, kan detta fĂ„ allvarliga och farliga verkliga konsekvenser för AI-tillĂ€mpningar. 

Den nya studien med titeln "Modeller för djupinlĂ€rning lyckas inte fĂ„nga den konfigurerade karaktĂ€ren hos mĂ€nsklig formuppfattning” publicerades i tidskriften Cell Press iScience. 

Det var en samarbetsstudie av Elder, som innehar York Research Chair in Human and Computer Vision, samt som meddirektör för Yorks Center for AI & Society, och professor Nicholas Baker, som Àr bitrÀdande psykologiprofessor och tidigare VISTA postdoktor vid York.

Roman Visual Stimuli "Frankensteins" 

Teamet förlitade sig pĂ„ nya visuella stimuli kallade "Frankensteins", som hjĂ€lpte dem att utforska hur bĂ„de den mĂ€nskliga hjĂ€rnan och DCNNs bearbetar holistiska, konfigurerade objektegenskaper. 

"Frankensteins Ă€r helt enkelt föremĂ„l som har tagits isĂ€r och satts ihop pĂ„ fel sĂ€tt", sĂ€ger Elder. "Som ett resultat har de alla rĂ€tt lokala funktioner, men pĂ„ fel platser." 

Studien fann att DCNN inte Ă€r förvirrade av Frankensteins som det mĂ€nskliga visuella systemet Ă€r. Detta avslöjar en okĂ€nslighet för konfigurerade objektegenskaper. 

"VĂ„ra resultat förklarar varför djupa AI-modeller misslyckas under vissa förhĂ„llanden och pekar pĂ„ behovet av att övervĂ€ga uppgifter bortom objektigenkĂ€nning för att förstĂ„ visuell bearbetning i hjĂ€rnan", fortsĂ€tter Elder. "Dessa djupa modeller tenderar att ta "genvĂ€gar" nĂ€r de löser komplexa igenkĂ€nningsuppgifter. Även om dessa genvĂ€gar kan fungera i mĂ„nga fall, kan de vara farliga i nĂ„gra av de verkliga AI-applikationer som vi för nĂ€rvarande arbetar med med vĂ„r industri och regeringspartners."

Bild: York University

Verkliga konsekvenser

Elder sĂ€ger att en av dessa tillĂ€mpningar Ă€r trafikvideosĂ€kerhetssystem. 

"FöremĂ„len i en trafikerad trafikplats - fordonen, cyklarna och fotgĂ€ngarna - hindrar varandra och kommer fram till en förares öga som ett virrvarr av frĂ„nkopplade fragment", sĂ€ger han. "HjĂ€rnan mĂ„ste gruppera dessa fragment korrekt för att identifiera de korrekta kategorierna och platserna för objekten. Ett AI-system för trafiksĂ€kerhetsövervakning som bara kan uppfatta fragmenten individuellt kommer att misslyckas med denna uppgift, vilket potentiellt missförstĂ„r riskerna för utsatta trafikanter.” 

Forskarna sĂ€ger ocksĂ„ att modifieringar av trĂ€ning och arkitektur som syftar till att göra nĂ€tverk mer hjĂ€rnliknande inte uppnĂ„dde konfigurerad bearbetning. Inget av nĂ€tverken kunde korrekt förutsĂ€ga bedömningar av mĂ€nskliga objekt försök för försök. 

"Vi spekulerar i att för att matcha mÀnsklig konfigurationskÀnslighet mÄste nÀtverk trÀnas för att lösa ett bredare utbud av objektuppgifter bortom kategoriigenkÀnning," avslutar Elder

Alex McFarland Àr en AI-journalist och författare som utforskar den senaste utvecklingen inom artificiell intelligens. Han har samarbetat med mÄnga AI-startups och publikationer över hela vÀrlden.