кочан Способността на човешкия мозък за обработка на светлина може да доведе до по-добро роботизирано усещане - Unite.AI
Свържете се с нас

Роботика

Способността на човешкия мозък за обработка на светлина може да доведе до по-добро роботизирано усещане

Обновено on

Човешкият мозък често служи като вдъхновение за изкуствения интелект (AI) и това е случаят отново, тъй като екип от армейски изследователи успя да подобри роботизираното усещане, като наблюдава как човешкият мозък обработва ярка и контрастираща светлина. Новото развитие може да помогне за сътрудничество между автономни агенти и хора.

Според изследователите е важно машинното отчитане да бъде ефективно в променящите се среди, което води до развитие на автономността.

Изследването е публикувано в Journal of Vision

Възможност за показване 100,000 1 към XNUMX

Андре Харисън е изследовател в Армейската изследователска лаборатория на Командването за развитие на бойните способности на армията на САЩ. 

„Когато разработваме алгоритми за машинно обучение, изображенията от реалния свят обикновено се компресират до по-тесен диапазон, както прави камерата на мобилен телефон, в процес, наречен тонално картографиране“, каза Харисън. „Това може да допринесе за крехкостта на алгоритмите за машинно зрение, тъй като те се основават на изкуствени изображения, които не съвпадат съвсем с моделите, които виждаме в реалния свят.“ 

Екипът от изследователи разработи система с възможност за показване 100,000 1 към XNUMX, която им позволи да получат представа за изчислителния процес на мозъка в реалния свят. Според Харисън това е позволило на екипа да внедри биологична устойчивост в сензори.

Настоящите алгоритми за зрение все още трябва да изминат дълъг път, преди да станат идеални. Това е свързано с ограничения диапазон на осветеност, около съотношение 100 към 1, поради алгоритмите, базирани на изследвания върху хора и животни с компютърни монитори. Съотношението 100 към 1 е по-малко от идеалното в реалния свят, където вариацията може да стигне до 100,000 1 към XNUMX. Това високо съотношение се нарича висок динамичен диапазон или HDR.

Д-р Чоу По Хунг е изследовател от армията. 

„Промените и значителните вариации в светлината могат да предизвикат армейските системи – дронове, летящи под горски покрив, могат да бъдат объркани от промени в отразяването, когато вятърът духа през листата, или автономните превозни средства, движещи се по неравен терен, може да не разпознаят дупки или други препятствия, тъй като условията на осветеност са малко по-различни от тези, на които са обучени алгоритмите им за зрение“, каза Хунг. 

Способността на човешкия мозък да компресира

Човешкият мозък е в състояние автоматично да компресира входа 100,000 1 към XNUMX в по-тесен диапазон и това е, което позволява на хората да интерпретират формата. Екипът от изследователи се зае да разбере този процес чрез изучаване на ранна визуална обработка при HDR. Екипът погледна към прости функции като HDR осветеност. 

„Мозъкът има повече от 30 зрителни области и ние все още имаме само елементарно разбиране за това как тези области обработват изображението на окото в разбиране на 3D форма“, продължи Хунг. „Нашите резултати с HDR изследвания на осветеността, базирани на човешко поведение и записи на скалпа, показват колко малко наистина знаем за това как да преодолеем празнината между лабораторните и реалните среди. Но тези открития ни изваждат от тази кутия, показвайки, че предишните ни предположения от стандартните компютърни монитори имат ограничена способност да се обобщават към реалния свят и разкриват принципи, които могат да насочат нашето моделиране към правилните механизми. 

Откривайки как светлината и контрастните ръбове си взаимодействат във визуалното представяне на мозъка, алгоритмите ще бъдат по-ефективни при реконструирането на 3D света при осветеност в реалния свят. Когато се оценява 3D форма от 2D информация, винаги има неясноти, но това ново откритие позволява те да бъдат коригирани.

„През милиони години на еволюция нашите мозъци са разработили ефективни преки пътища за реконструиране на 3D от 2D информация“, каза Хунг. „Това е проблем от десетилетия, който продължава да предизвиква учените по машинно зрение, дори и с последните постижения в ИИ.“

Откритието на екипа също е важно за разработването на AI-устройства като радар и дистанционно разбиране на реч, които използват разпознаване на широк динамичен обхват. 

„Проблемът с динамичния обхват не е само проблем със сензорите“, каза Хунг. „Това може да е и по-общ проблем в изчисленията на мозъка, тъй като отделните неврони имат десетки хиляди входове. Как изграждате алгоритми и архитектури, които могат да слушат правилните входове в различни контексти? Надяваме се, че като работим върху този проблем на сетивно ниво, можем да потвърдим, че сме на прав път, така че да можем да разполагаме с правилните инструменти, когато изграждаме по-сложни Als. 

Алекс Макфарланд е AI журналист и писател, изследващ най-новите разработки в областта на изкуствения интелект. Той е сътрудничил с множество стартиращи фирми и публикации в областта на изкуствения интелект по целия свят.