Робототехника
Способность человеческого мозга обрабатывать свет может привести к улучшению робототехнической сенсорики

Человеческий мозг часто служит источником вдохновения для искусственного интеллекта (ИИ), и это снова так, поскольку команда исследователей армии смогла улучшить робототехническую сенсорную систему, изучая, как человеческий мозг обрабатывает яркий и контрастный свет. Это новое развитие может помочь в сотрудничестве между автономными агентами и людьми.
По мнению исследователей, для эффективной работы машинной сенсорики важно, чтобы она была эффективна в меняющихся средах, что приводит к разработкам в области автономности.
Исследование было опубликовано в Журнале зрения.
Возможность отображения 100 000:1
Андре Харрисон – исследователь в Армейской исследовательской лаборатории Командования по разработке боевых возможностей армии США.
«Когда мы разрабатываем алгоритмы машинного обучения, реальные изображения обычно сжимаются до более узкого диапазона, как это делает камера смартфона, в процессе, называемом тонкой картой», – сказал Харрисон. «Это может способствовать хрупкости алгоритмов машинного зрения, поскольку они основаны на искусственных изображениях, которые не совсем соответствуют закономерностям, которые мы видим в реальном мире».
Команда исследователей разработала систему с возможностью отображения 100 000:1, что позволило им получить представление о процессе вычислений мозга в реальном мире. По словам Харрисона, это позволило команде реализовать биологическую устойчивость в датчиках.
Текущие алгоритмы зрения еще далеко не идеальны. Это связано с ограниченным диапазоном яркости, примерно 100:1, из-за того, что алгоритмы основаны на исследованиях человека и животных с помощью компьютерных мониторов. Отношение 100:1 менее чем идеально в реальном мире, где вариация может достигать 100 000:1. Это высокое соотношение называется высоким динамическим диапазоном или HDR.
Доктор Чоу По Хунг – исследователь армии.
«Изменения и значительные вариации света могут представлять проблемы для систем армии – беспилотные летательные аппараты, летящие под лесным пологом, могут быть сбиты с толку изменениями отражения, когда ветер проходит через листья, или автономные транспортные средства, движущиеся по неровной местности, могут не распознавать ямы или другие препятствия, поскольку условия освещения немного отличаются от тех, на которых были обучены их алгоритмы зрения», – сказал Хунг.
Способность человеческого мозга сжимать
Человеческий мозг способен автоматически сжимать вход 100 000:1 в более узкий диапазон, и это позволяет людям интерпретировать форму. Команда исследователей попыталась понять этот процесс, изучая раннюю зрительную обработку под HDR. Команда обратилась к простым особенностям, таким как HDR-яркость.
«Мозг имеет более 30 зрительных областей, и мы все еще имеем только базовое понимание того, как эти области обрабатывают изображение глаза в понимание 3D-формы», – продолжил Хунг. «Наши результаты с исследованиями HDR-яркости, основанные на поведении человека и записях скальпа, показывают, насколько мало мы действительно знаем о том, как мостить разрыв между лабораторией и реальными условиями. Но эти результаты выводят нас из этой коробки, показывая, что наши предыдущие предположения из стандартных компьютерных мониторов имеют ограниченную возможность обобщения на реальный мир, и они раскрывают принципы, которые могут руководить нашим моделированием к правильным механизмам».
Открывая, как свет и контрастные края взаимодействуют в зрительном представлении мозга, алгоритмы будут более эффективны в реконструкции 3D-мира в реальных условиях освещения. При оценке 3D-формы из 2D-информации всегда есть неоднозначности, но это новое открытие позволяет их исправлять.
«Через миллионы лет эволюции наш мозг эволюционировал эффективные сокращения для реконструкции 3D из 2D-информации», – сказал Хунг. «Это десятилетняя проблема, которая продолжает представлять проблемы для ученых машинного зрения, даже с учетом недавних достижений в области ИИ».
Открытие команды также важно для разработки устройств ИИ, таких как радар и удаленное понимание речи, которые используют широкий динамический диапазон сенсорики.
«Проблема динамического диапазона не только проблема сенсорики», – сказал Хунг. «Она также может быть более общей проблемой вычислений мозга, поскольку отдельные нейроны имеют десятки тысяч входов. Как построить алгоритмы и архитектуры, которые могут слушать правильные входы в разных контекстах? Мы надеемся, что, работая над этой проблемой на сенсорном уровне, мы можем подтвердить, что мы находимся на правильном пути, чтобы иметь правильные инструменты, когда мы построим более сложные ИИ».










