ロボティクス

ヒト脳の光処理能力がロボットの感知能力の向上につながる

Published September 16, 2020

Updated April 5, 2026

Alex McFarland

ヒト脳はしばしば人工知能（AI）のインスピレーションの源となり、それが今回も同様である。陸軍の研究チームは、ヒト脳が明るさとコントラストの光をどのように処理するかを調べることで、ロボットの感知能力を向上させることに成功した。この新しい開発は、自律エージェントとヒトの協力につながる可能性がある。

研究者によると、機械の感知は環境の変化に効果的に対応できることが重要であり、これは自律性の向上につながる。

この研究は、Journal of Visionに掲載された。

100,000対1の表示能力

Andre Harrisonは、U.S. Army Combat Capabilities Development CommandのArmy Research Laboratoryの研究者である。

「機械学習アルゴリズムを開発する際、実世界の画像は通常、携帯電話のカメラのように、トーンマッピングというプロセスで狭い範囲に圧縮される」とHarrisonは述べた。「これは、機械ビジョンのアルゴリズムが実世界で見られるパターンとまったく一致しない人工的な画像に基づいているため、機械ビジョンのアルゴリズムの脆弱性につながる可能性がある。」

研究者チームは、100,000対1の表示能力を持つシステムを開発し、実世界での脳の計算プロセスを理解することができた。Harrisonによると、これにより、センサーに生物学的な回復力を実装することができた。

現在のビジョンアルゴリズムは、理想的なものになるまでまだ長い道のりがある。これは、人間や動物の研究に基づくコンピューターモニターの100対1の比率による限られた明るさ範囲によるものである。100対1の比率は、実世界では10万対1まで変化する可能性があるため、理想的なものではない。この高い比率は、高ダイナミックレンジ（HDR）と呼ばれる。

Dr. Chou Po Hungは、陸軍の研究者である。

「光の変化や大きな変化は、陸軍のシステムに課題をもたらす可能性がある。森林の木の葉の下を飛行するドローンは、風が木の葉を吹き抜けるときの反射率の変化によって混乱する可能性がある。あるいは、自律走行車は、照明条件がアルゴリズムの訓練に使用されたものとわずかに異なるため、路面の穴やその他の障害物を認識できない可能性がある」とHungは述べた。

ヒト脳の圧縮能力

ヒト脳は、10万対1の入力を自動的に狭い範囲に圧縮することができ、これがヒトが形を解釈できることを可能にしている。研究者チームは、HDRの明るさなどの単純な特徴を調べながら、早期の視覚処理を研究することで、このプロセスを理解しようとした。

「脳には30以上の視覚領域があり、それらが網膜の画像を3Dの形に処理する方法についてはまだ基本的な理解しかない」とHungは続けた。「HDRの明るさに関する研究、人間の行動、頭皮の記録に基づく結果は、私たちが実際にはそれらをどのように実世界の環境に橋渡しする方法についてあまり知らないことを示している。しかし、これらの発見は、私たちがその箱から抜け出すことを可能にし、標準的なコンピューターモニターからの私たちの前提は実世界に一般化する能力が限られていることを示し、正しいメカニズムに向けて私たちのモデリングを導く原則を明らかにしている。」

光とコントラストのエッジが脳の視覚表現でどのように相互作用するかを発見することで、アルゴリズムは実世界の明るさの下で3D世界を再構築するのにより効果的になる。2Dの情報から3Dの形を推定する際には、常に曖昧さがあるが、この新しい発見により、それらを修正することができる。

「数百万年の進化を経て、私たちの脳は2Dの情報から3Dを再構築するための効果的なショートカットを発達させてきた」とHungは述べた。「これは、AIの最近の進歩にもかかわらず、機械ビジョンの科学者にとって数十年来の課題である。」

チームの発見は、レーダーや遠隔音声認識などの広いダイナミックレンジを使用するAIデバイスの開発にも重要である。

「ダイナミックレンジの問題は、感覚の問題だけではない」とHungは述べた。「これは、個々のニューロンが数千の入力を持つ脳の計算におけるより一般的な問題である可能性もある。コンテキストが異なる場合に、どのようにして正しい入力を聞くアルゴリズムとアーキテクチャを構築するのか。私たちは、この問題を感覚レベルで取り組むことで、正しい道にいることを確認し、より複雑なAIを構築するための適切なツールを持っていることを希望する。」