stomp Die menslike brein se ligverwerkingsvermoë kan lei tot beter robotiese waarneming - Unite.AI
Verbinding met ons

Robotics

Die menslike brein se ligverwerkingsvermoë kan lei tot beter robotiese waarneming

Opgedateer on

Die menslike brein dien dikwels as inspirasie vir kunsmatige intelligensie (KI), en dit is weereens die geval aangesien 'n span weermagnavorsers daarin geslaag het om robotiese waarneming te verbeter deur te kyk na hoe die menslike brein helder en kontrasterende lig verwerk. Die nuwe ontwikkeling kan help lei tot die samewerking tussen outonome agente en mense.

Volgens die navorsers is dit belangrik dat masjienwaarneming doeltreffend is oor veranderende omgewings, wat lei tot ontwikkelings in outonomie.

Die navorsing is gepubliseer in die Tydskrif vir Visie

100,000 1-tot-XNUMX vertoonvermoë

Andre Harrison is 'n navorser by die US Army Combat Capabilities Development Command se Army Research Laboratory. 

"Wanneer ons masjienleeralgoritmes ontwikkel, word werklike wêreldbeelde gewoonlik saamgepers tot 'n nouer reeks, soos 'n selfoonkamera doen, in 'n proses wat toonkartering genoem word," het Harrison gesê. "Dit kan bydra tot die brosheid van masjienvisie-algoritmes omdat hulle gebaseer is op kunsmatige beelde wat nie heeltemal ooreenstem met die patrone wat ons in die regte wêreld sien nie." 

Die span navorsers het 'n stelsel met 100,000 1-tot-XNUMX vertoonvermoë ontwikkel, wat hulle in staat gestel het om insig te kry in die brein se rekenaarproses in die werklike wêreld. Volgens Harrison het dit die span in staat gestel om biologiese veerkragtigheid in sensors te implementeer.

Die huidige visie-algoritmes het nog 'n lang pad om te gaan voordat dit ideaal word. Dit het te make met die beperkte omvang in helderheid, teen ongeveer 100-tot-1-verhouding, as gevolg van die algoritmes wat gebaseer is op menslike en dierstudies met rekenaarmonitors. Die 100-tot-1-verhouding is minder as ideaal in die werklike wêreld, waar die variasie tot 100,000 1-tot-XNUMX kan gaan. Hierdie hoë verhouding word hoë dinamiese reeks of HDR genoem.

Dr. Chou Po Hung is 'n weermagnavorser. 

"Veranderinge en beduidende variasies in lig kan weermagstelsels uitdaag - hommeltuie wat onder 'n bosdak vlieg kan verwar word deur weerkaatsingsveranderinge wanneer wind deur die blare waai, of outonome voertuie wat op rowwe terrein ry, herken dalk nie slaggate of ander struikelblokke nie omdat die beligtingstoestande effens anders as dié waarvan hul visie-algoritmes opgelei is,” het Hung gesê. 

Die menslike brein se saampersvermoë

Die menslike brein is in staat om die 100,000 1-tot-XNUMX-invoer outomaties in 'n nouer reeks saam te druk, en dit is wat mense toelaat om vorm te interpreteer. Die span navorsers het probeer om hierdie proses te verstaan ​​deur vroeë visuele verwerking onder HDR te bestudeer. Die span het gekyk na eenvoudige kenmerke soos HDR-helderheid. 

"Die brein het meer as 30 visuele areas, en ons het nog net 'n rudimentêre begrip van hoe hierdie areas die oog se beeld verwerk tot 'n begrip van 3D-vorm," het Hung voortgegaan. “Ons resultate met HDR-helderheidstudies, gebaseer op menslike gedrag en kopvelopnames, wys net hoe min ons werklik weet oor hoe om die gaping van laboratorium- na werklike omgewings te oorbrug. Maar hierdie bevindinge breek ons ​​uit daardie boks, wat wys dat ons vorige aannames van standaard rekenaarmonitors beperkte vermoë het om na die werklike wêreld te veralgemeen, en hulle openbaar beginsels wat ons modellering na die korrekte meganismes kan lei. 

Deur te ontdek hoe lig- en kontrasrande in die brein se visuele voorstelling in wisselwerking tree, sal algoritmes meer effektief wees om die 3D-wêreld onder werklike helderheid te rekonstrueer. Wanneer 3D-vorm uit 2D-inligting geskat word, is daar altyd onduidelikhede, maar hierdie nuwe ontdekking laat toe dat dit reggestel word.

"Deur miljoene jare van evolusie het ons brein effektiewe kortpaaie ontwikkel om 3D uit 2D-inligting te rekonstrueer," het Hung gesê. "Dit is 'n dekade oue probleem wat masjienvisie-wetenskaplikes steeds uitdaag, selfs met die onlangse vooruitgang in KI."

Die span se ontdekking is ook belangrik vir die ontwikkeling van KI-toestelle soos radar en afgeleë spraakverstaan, wat wye dinamiese reekswaarneming gebruik. 

"Die kwessie van dinamiese omvang is nie net 'n waarnemingsprobleem nie," het Hung gesê. "Dit kan ook 'n meer algemene probleem in breinberekening wees omdat individuele neurone tienduisende insette het. Hoe bou jy algoritmes en argitekture wat na die regte insette oor verskillende kontekste kan luister? Ons hoop dat ons, deur op sensoriese vlak aan hierdie probleem te werk, kan bevestig dat ons op die regte pad is, sodat ons die regte gereedskap kan hê wanneer ons meer komplekse Als bou.” 

Alex McFarland is 'n KI-joernalis en skrywer wat die jongste ontwikkelings in kunsmatige intelligensie ondersoek. Hy het wêreldwyd met talle KI-opstarters en publikasies saamgewerk.