Робототехніка

Можливість обробки світла людським мозком може привести до кращого робототехнічного відчуття

Published September 16, 2020

Updated April 5, 2026

Alex McFarland

Людський мозок часто слугує джерелом натхнення для штучного інтелекту (AI), і це знову так, оскільки команда дослідників армії змогла покращити робототехнічне відчуття, вивчаючи, як людський мозок обробляє яскраве та контрастне світло. Ця нова розробка може допомогти у співробітництві між автономними агентами та людьми.

За словами дослідників, для машинного відчуття важливо бути ефективним у різних середовищах, що призводить до розробок у галузі автономності.

Дослідження було опубліковано в Journal of Vision.

Спроможність дисплея 100 000 до 1

Андре Гаррісон – дослідник відділу розробки бойових можливостей армії США.

“Коли ми розробляємо алгоритми машинного навчання, реальні зображення зазвичай стискаються до вузького діапазону, як це робить камера мобільного телефону, у процесі, який називається тономапінг”, – сказав Гаррісон. “Це може сприяти крихкості алгоритмів машинного зору, оскільки вони засновані на штучних зображеннях, які не зовсім відповідають тим патернам, які ми бачимо у реальному світі.”

Команда дослідників розробила систему зі спроможністю дисплея 100 000 до 1, яка дозволила їм здобути уявлення про процес обробки мозком у реальному світі. За словами Гаррісона, це дозволило команді реалізувати біологічну стійкість у сенсорах.

Поточні алгоритми зору ще далеко не досконалі. Це пов’язано з обмеженим діапазоном яскравості, близько 100 до 1, через те, що алгоритми засновані на дослідженнях людини та тварин з використанням комп’ютерних моніторів. Відношення 100 до 1 є менш ніж ідеальним у реальному світі, де варіація може сягати 100 000 до 1. Це високе відношення називається високим динамічним діапазоном, або HDR.

Доктор Чоу По Хунг – дослідник армії США.

“Зміни та значні варіації світла можуть створити проблеми для систем армії США – безпілотні літаки, які літають під пологом лісу, можуть бути сплутані змінами відбиття, коли вітер проходить крізь листя, або автономні транспортні засоби, які рухаються по нерівній місцевості, можуть не розпізнавати ями чи інші перешкоди через те, що умови освітлення трохи відрізняються від тих, для яких були навчені їхні алгоритми зору”, – сказав Хунг.

Спроможність мозку до стиснення

Людський мозок здатний автоматично стискати вхід 100 000 до 1 у вузький діапазон, і це дозволяє людям інтерпретувати форму. Команда дослідників намагалася зрозуміти цей процес, вивчаючи ранню візуальну обробку під HDR. Команда звернулася до простих функцій, таких як HDR-яскравість.

“Мозок має понад 30 візуальних зон, і ми ще тільки почали розуміти, як ці зони обробляють зображення ока у розуміння 3D-форми”, – продовжив Хунг. “Наші результати з дослідження HDR-яскравості, засновані на поведінці людини та реєстрації з поверхні голови, показують, наскільки мало ми дійсно знаємо про те, як зв’язати пробіл між лабораторією та реальним світом. Але ці результати виводять нас з цього обмеження, показуючи, що наші попередні припущення, засновані на стандартних комп’ютерних моніторах, мають обмежену можливість узагальнення до реального світу, і вони розкривають принципи, які можуть спрямовувати наше моделювання до правильних механізмів.”

Відкривши, як світло та контрастні краї взаємодіють у візуальній репрезентації мозку, алгоритми будуть більш ефективними у реконструкції 3D-суспільства у реальному світі під яскравістю. Коли оцінюється 3D-форма з 2D-інформації, завжди існують двозначності, але це нове відкриття дозволяє виправити їх.

“Через мільйони років еволюції наш мозок розвинув ефективні скорочення для реконструкції 3D з 2D-інформації”, – сказав Хунг. “Це проблема, яка триває вже десятиліттями, і продовжує викликати науковців машинного зору, навіть з недавніми досягненнями у галузі штучного інтелекту.”

Відкриття команди також важливе для розробки пристроїв штучного інтелекту, таких як радар та віддалене розуміння мови, які використовують широкий динамічний діапазон сенсорів.

“Проблема динамічного діапазону не тільки проблема сенсорів”, – сказав Хунг. “Це може бути більш загальна проблема обчислення мозку, оскільки окремі нейрони мають десятки тисяч входів. Як побудувати алгоритми та архітектури, які можуть слухати правильні входи у різних контекстах? Ми сподіваємося, що, працюючи над цією проблемою на рівні сенсорів, ми можемо підтвердити, що ми на правильному шляху, щоб мати правильні інструменти, коли будемо створювати більш складні штучні інтелекти.”

Related Topics:AI artificial intelligence Robotics

Alex McFarland

Алекс Макфарленд - журналіст та письменник з питань штучного інтелекту, який досліджує останні розробки в галузі штучного інтелекту. Він співпрацював з численними стартапами та виданнями з штучного інтелекту у світі.