Robotika

Schopnost lidského mozku zpracovávat světlo by mohla vést k lepšímu robotickému vnímání

Published September 16, 2020

Updated April 5, 2026

Alex McFarland

Lidský mozek často slouží jako inspirace pro umělou inteligenci (AI) a je tomu tak opět v tomto případě, kdy tým armádních výzkumníků dokázal zlepšit robotické vnímání tím, že se podíval na to, jak lidský mozek zpracovává jasná a kontrastní světla. Tento nový vývoj může pomoci vést ke spolupráci mezi autonomními agenty a lidmi.

Podle výzkumníků je důležité, aby strojové vnímání bylo efektivní napříč měnícími se prostředími, což vede k rozvoji autonomie.

Výzkum byl zveřejněn v Journal of Vision.

Schopnost zobrazení 100 000 ku 1

Andre Harrison je výzkumník v U.S. Army Combat Capabilities Development Command’s Army Research Laboratory.

“Když vyvíjíme algoritmy strojového učení, reálné obrázky jsou obvykle komprimovány do užšího rozsahu, stejně jako to dělá kamerka mobilního telefonu, v procesu nazývaném tónové mapování,” řekl Harrison. “To může přispět k křehkosti algoritmů strojového vidění, protože jsou založeny na umělých obrazech, které neodpovídají přesně vzorům, které vidíme ve skutečném světě.”

Tým výzkumníků vyvinul systém se schopností zobrazení 100 000 ku 1, který jim umožnil získat vhled do výpočetního procesu mozku ve skutečném světě. Podle Harrisona to umožnilo týmu implementovat biologickou odolnost do senzorů.

Aktuální algoritmy vidění ještě mají dlouhou cestu, než se stanou ideálními. To souvisí s omezeným rozsahem luminance, kolem poměru 100 ku 1, kvůli tomu, že algoritmy jsou založeny na studiích lidského a animálního vidění s počítačovými monitory. Poměr 100 ku 1 je méně než ideální ve skutečném světě, kde variace může dosáhnout až 100 000 ku 1. Tento vysoký poměr se nazývá vysoký dynamický rozsah, nebo HDR.

Dr. Chou Po Hung je armádní výzkumník.

“Změny a významné variace světla mohou ohrozit armádní systémy – drony létající pod lesním polokruhem by mohly být zmateny změnami odrazivosti, když vítr fouká listy, nebo autonomní vozidla jezdící na drsném terénu by nemusela rozpoznat díry ani jiné překážky, protože světelné podmínky jsou mírně odlišné od těch, pro které byly jejich algoritmy vidění trénovány,” řekl Hung.

Schopnost lidského mozku komprimovat

Lidský mozek je schopen automaticky komprimovat vstup 100 000 ku 1 do užšího rozsahu, a to je to, co umožňuje lidem interpretovat tvar. Tým výzkumníků se snažil pochopit tento proces studiem raného vizuálního zpracování pod HDR. Tým se zaměřil na jednoduché funkce, jako je HDR luminance.

“Mozek má více než 30 vizuálních oblastí a stále máme pouze základní porozumění toho, jak tyto oblasti zpracovávají obraz oka do porozumění 3D tvaru,” pokračoval Hung. “Naše výsledky s studiemi HDR luminance, založené na lidském chování a záznamu z skalpu, ukazují, jak málo skutečně víme o tom, jak most mezi laboratoří a skutečným světem. Ale tyto nálezy nás osvobozují z této schránky, ukazují, že naše předchozí předpoklady ze standardních počítačových monitorů mají omezenou schopnost generalizovat do skutečného světa a odhalují principy, které mohou vést naše modelování k správným mechanismům.”

Objevením, jak světlo a kontrastní hrany interagují v mozku, budou algoritmy účinnější při rekonstrukci 3D světa ve skutečném světě. Při odhadu 3D tvaru z 2D informací jsou vždy nejasnosti, ale toto nové objevy umožňují je opravovat.

“Prostřednictvím milionů let evoluce se naše mozky vyvinuly efektivní zkratky pro rekonstrukci 3D z 2D informací,” řekl Hung. “Je to desetiletí starý problém, který pokračuje v ohrožování vědců strojového vidění, i s nedávnými pokroky v AI.”

Objev týmu je také důležitý pro vývoj AI zařízení, jako je radar a vzdálené porozumění řeči, které využívají široký dynamický rozsah senzorů.

“Problém dynamického rozsahu není pouze problémem senzoru,” řekl Hung. “Může to být také obecnější problém v mozkovém výpočtu, protože jednotlivé neurony mají desítky tisíc vstupů. Jak můžete vytvořit algoritmy a architektury, které mohou naslouchat správným vstupům napříč různými kontexty? Doufáme, že prací na tomto problému na senzorické úrovni můžeme potvrdit, že jsme na správné cestě, abychom měli správné nástroje, když budeme budovat komplexnější AI.”

Related Topics:AI artificial intelligence Robotics

Alex McFarland

Alex McFarland je AI novinář a spisovatel, který zkoumá nejnovější vývoj v oblasti umělé inteligence. Spolupracoval s mnoha AI startupy a publikacemi po celém světě.

Unite.AI

Schopnost lidského mozku zpracovávat světlo by mohla vést k lepšímu robotickému vnímání

Schopnost zobrazení 100 000 ku 1

Schopnost lidského mozku komprimovat

You may like