Robotikk
Menneskehjernens evne til å prosessere lys kan føre til bedre robotisk sansning

Menneskehjernen tjener ofte som inspirasjon for kunstig intelligens (AI), og det er tilfelle igjen da et team av armeforskere har klart å forbedre robotisk sansning ved å se på hvordan menneskehjernen prosesserer lys og kontrast. Den nye utviklingen kan hjelpe til å føre til samarbeid mellom autonome agenter og mennesker.
Ifølge forskerne er det viktig at maskin sansning er effektiv over forskjellige miljø, noe som fører til utvikling i autonomi.
Forskningen ble publisert i Journal of Vision.
100 000 til 1-skjermekapasitet
Andre Harrison er en forsker ved U.S. Army Combat Capabilities Development Command’s Army Research Laboratory.
“Når vi utvikler maskinlæringsalgoritmer, komprimeres vanligvis verdensbilder til et smalere område, som en mobilkamera gjør, i en prosess kalt tone mapping,” sa Harrison. “Dette kan bidra til at maskinens synsalgoritmer blir skjøre fordi de er basert på kunstige bilder som ikke helt matcher mønsterene vi ser i den virkelige verden.”
Forskergruppen utviklet et system med 100 000 til 1-skjermekapasitet, som gjorde det mulig for dem å få innsikt i hjernens beregningsprosess i den virkelige verden. Ifølge Harrison gjorde dette det mulig for gruppen å implementere biologisk motstandskraft i sensorer.
De nåværende synsalgorithmene har fortsatt langt igjen før de blir ideelle. Dette har å gjøre med den begrensede rekkevidden i lysstyrke, på rundt 100 til 1-forhold, på grunn av at algoritmene er basert på menneske- og dyrestudier med datamonitorer. 100 til 1-forholdet er mindre enn ideelt i den virkelige verden, hvor variasjonen kan gå helt opp til 100 000 til 1. Dette høye forholdet kalles høy dynamisk rekkevidde, eller HDR.
Dr. Chou Po Hung er en armeforsker.
“Endringer og betydelige variasjoner i lys kan utfordre armésystemer — droner som flyr under en skogskrone kan bli forvirret av refleksjonsendringer når vinden blåser gjennom bladene, eller autonome kjøretøy som kjører på ru terreng kan ikke gjenkjenne hull eller andre hindringer fordi lysforholdene er litt forskjellige fra dem som deres synsalgoritmer var trent på,” sa Hung.
Menneskehjernens komprimeringskapasitet
Menneskehjernen er i stand til å automatisk komprimere 100 000 til 1-inndata til et smalere område, og dette er det som gjør det mulig for mennesker å tolke form. Forskergruppen satte ut å forstå denne prosessen ved å studere tidlig visuell prosessering under HDR. Gruppen så mot enkle funksjoner som HDR-lysstyrke.
“Hjernen har mer enn 30 visuelle områder, og vi har fortsatt bare en rudimentær forståelse av hvordan disse områdene prosesserer øyets bilde til en forståelse av 3D-form,” fortsatte Hung. “Våre resultater med HDR-lysstyrke-studier, basert på menneskelig atferd og skalleopptak, viser bare hvor lite vi virkelig vet om hvordan vi kan bruke laboratorie- til virkelige miljøer. Men disse funnene bryter oss ut av denne boksen, og viser at våre tidligere antakelser fra standard datamonitorer har begrensede evner til å generalisere til den virkelige verden, og de avslører prinsipper som kan veilede vår modellering mot de riktige mekanismene.”
Ved å oppdage hvordan lys og kontrastkanter samhandler i hjernens visuelle representasjon, vil algoritmene være mer effektive til å rekonstruere den 3D-verden under virkelige lysforhold. Når man estimerer 3D-form fra 2D-informasjon, er det alltid usikkerheter, men denne nye oppdagelsen gjør det mulig å korrigere dem.
“Gjennom millioner av år med evolusjon, har hjernene våre utviklet effektive kortveier for å rekonstruere 3D fra 2D-informasjon,” sa Hung. “Det er et flere tiår gammelt problem som fortsatt utfordrer maskin synsvitenskapsmenn, selv med de nyeste fremgangene i AI.”
Forskergruppens oppdagelse er også viktig for utviklingen av AI-enhetene som radar og fjern taleforståelse, som utnytter vid dynamisk rekkevidde sansning.
“Spørsmålet om dynamisk rekkevidde er ikke bare et sansningsproblem,” sa Hung. “Det kan også være et mer generelt problem i hjernecomputing fordi enkeltneuroner har titusener av inndata. Hvordan bygger man algoritmer og arkitekturer som kan lytte til de riktige inndataene over forskjellige kontekster? Vi håper at, ved å arbeide med dette problemet på et sansningsnivå, kan vi bekrefte at vi er på riktig spor, så vi kan ha de riktige verktøyene når vi bygger mer komplekse AI.”










