Robotik
Menneskehjernens evne til at behandle lys kan føre til bedre robotisk sansning

Menneskehjernen tjener ofte som inspiration for kunstig intelligens (AI), og det er tilfældet igen, da et hold af hærforskere har formået at forbedre robotisk sansning ved at se på, hvordan menneskehjernen behandler lys og kontrast. Den nye udvikling kan hjælpe med at føre til samarbejdet mellem autonome agenter og mennesker.
Ifølge forskerne er det vigtigt, at maskinSansning er effektiv på tværs af skiftende miljøer, hvilket fører til udviklinger i autonomi.
Forskningen blev offentliggjort i Journal of Vision.
100.000 til 1 display kapacitet
Andre Harrison er en forsker ved U.S. Army Combat Capabilities Development Commands Army Research Laboratory.
“Når vi udvikler maskinlæringsalgoritmer, komprimeres billeder fra den virkelige verden normalt til en smallere række, som en mobilkamera gør, i en proces kaldet tone mapping,” sagde Harrison. “Dette kan bidrage til, at maskinvision-algoritmerne er skrøbelige, fordi de er baseret på kunstige billeder, der ikke helt matcher mønstrene, vi ser i den virkelige verden.”
Forskerholdet udviklede et system med 100.000 til 1 display kapacitet, hvilket gjorde det muligt for dem at få indsigt i hjernens beregningsproces i den virkelige verden. Ifølge Harrison gjorde dette det muligt for holdet at implementere biologisk robusthed i sensorer.
De nuværende vision-algoritmer har endnu langt til at gå, før de bliver ideelle. Dette har at gøre med den begrænsede række i luminans, på omkring 100 til 1-forhold, på grund af, at algoritmerne er baseret på menneske- og dyreforsøg med computermonitore. 100 til 1-forholdet er mindre end ideelt i den virkelige verden, hvor variationen kan gå helt op til 100.000 til 1. Dette høje forhold kaldes høj dynamisk række, eller HDR.
Dr. Chou Po Hung er en hærforsker.
“Ændringer og betydelige variationer i lys kan udfordre hærsystemer – droner, der flyver under en skovklædt kappe, kan blive forvirret af refleksionsændringer, når vinden blæser gennem bladene, eller autonome køretøjer, der kører på ujævnt terræn, kan ikke genkende huller eller andre hindringer, fordi lysforholdene er lidt anderledes end dem, som deres vision-algoritmer er trænet til,” sagde Hung.
Menneskehjernens komprimeringskapacitet
Menneskehjernen er i stand til automatisk at komprimere 100.000 til 1-indgang til en smallere række, og det er dette, der giver mennesker mulighed for at fortolke form. Forskerholdet satte sig for at forstå denne proces ved at studere tidlig visuel bearbejdning under HDR. Holdet så på simple funktioner som HDR-luminans.
“Hjernen har mere end 30 visuelle områder, og vi har stadig kun en rudimentær forståelse af, hvordan disse områder bearbejder øjets billede til en forståelse af 3D-form,” fortsatte Hung. “Vore resultater med HDR-luminansstudier, baseret på menneskelig adfærd og skalindførlinger, viser blot, hvor lidt vi virkelig ved om, hvordan vi kan brobygge mellem laboratorie- og virkelige miljøer. Men disse fund bryder os ud af den kasse, viser, at vores tidligere antagelser fra standard computermonitore har begrænset evne til at generalisere til den virkelige verden, og de afslører principper, der kan vejlede vores modellering mod de korrekte mekanismer.”
Ved at opdage, hvordan lys og kontrastkanter interagerer i hjernens visuelle repræsentation, vil algoritmerne være mere effektive til at genskabe den 3D-verden under virkelige lysforhold. Når man estimerer 3D-form fra 2D-information, er der altid usikkerheder, men denne nye opdagelse giver mulighed for at korrigere dem.
“Gennem millioner af års evolution har vores hjerner udviklet effektive genveje for at genskabe 3D fra 2D-information,” sagde Hung. “Det er et årtiers gammelt problem, der fortsat udfordrer maskinvision-forskere, selv med de seneste fremskridt i AI.”
Forskerholdets opdagelse er også vigtig for udviklingen af AI-enheder som radar og fjern taleforståelse, der udnytter bred dynamisk række sansning.
“Spørgsmålet om dynamisk række er ikke kun et sansningsproblem,” sagde Hung. “Det kan også være et mere generelt problem i hjernecomputation, fordi enkeltneuroner har titusinder af indgange. Hvordan bygger man algoritmer og arkitekturer, der kan lytte til de rigtige indgange på tværs af forskellige kontekster? Vi håber, at ved at arbejde på dette problem på et sansningsniveau, kan vi bekræfte, at vi er på den rigtige vej, så vi kan have de rigtige værktøjer, når vi bygger mere komplekse AI.”












