부본 인간 두뇌의 가벼운 처리 능력은 더 나은 로봇 감지로 이어질 수 있습니다 - Unite.AI
Rescale 미팅 예약

로보틱스

인간 두뇌의 빛 처리 능력은 더 나은 로봇 감지로 이어질 수 있습니다.

업데이트 on

인간의 두뇌는 종종 인공 지능(AI)에 영감을 주는 역할을 하며, 육군 연구원 팀이 인간의 두뇌가 밝고 대조되는 빛을 처리하는 방법을 살펴봄으로써 로봇 감지를 개선하는 데 성공하면서 다시 한 번 그 경우가 되었습니다. 새로운 개발은 자율 에이전트와 인간 간의 협업으로 이어질 수 있습니다.

연구원들에 따르면 머신 센싱이 변화하는 환경에서 효과적이어서 자율성을 개발하는 것이 중요합니다.

연구 결과는 비전 저널

100,000:1 디스플레이 기능

Andre Harrison은 미 육군 전투 능력 개발 사령부 육군 연구소의 연구원입니다. 

해리슨은 “우리가 기계 학습 알고리즘을 개발할 때 실제 이미지는 일반적으로 휴대폰 카메라처럼 톤 매핑이라는 프로세스를 통해 더 좁은 범위로 압축됩니다.”라고 말했습니다. "이것은 실제 세계에서 볼 수 있는 패턴과 완전히 일치하지 않는 인공 이미지를 기반으로 하기 때문에 머신 비전 알고리즘의 취약성에 기여할 수 있습니다." 

연구팀은 100,000:1 디스플레이 기능을 갖춘 시스템을 개발하여 실제 세계에서 뇌의 컴퓨팅 프로세스에 대한 통찰력을 얻을 수 있었습니다. Harrison에 따르면 이를 통해 팀은 센서에 생물학적 탄력성을 구현할 수 있었습니다.

현재의 비전 알고리즘이 이상적이 되려면 아직 갈 길이 멀다. 이는 컴퓨터 모니터를 사용한 인간 및 동물 연구를 기반으로 하는 알고리즘으로 인해 약 100:1 비율의 제한된 휘도 범위와 관련이 있습니다. 100:1 비율은 실제 세계에서 이상적이지 않으며, 변형은 최대 100,000:1까지 갈 수 있습니다. 이 높은 비율을 HDR(High Dynamic Range)이라고 합니다.

Chou Po Hung 박사는 육군 연구원입니다. 

"빛의 변화와 상당한 변화는 육군 시스템에 도전할 수 있습니다. 숲 캐노피 아래에서 비행하는 드론은 바람이 잎사귀를 통해 불 때 반사율 변화로 인해 혼동될 수 있으며, 거친 지형을 주행하는 자율주행 차량은 조명 조건이 비전 알고리즘이 훈련된 것과 약간 다릅니다.”라고 Hung은 말했습니다. 

인간 두뇌의 압축 능력

인간의 두뇌는 100,000:1 입력을 더 좁은 범위로 자동 압축할 수 있으며, 이것이 인간이 모양을 해석할 수 있게 하는 것입니다. 연구팀은 HDR에서 초기 시각적 처리를 연구하여 이 프로세스를 이해하기 시작했습니다. 팀은 HDR 휘도와 같은 단순한 기능을 찾았습니다. 

"뇌에는 30개 이상의 시각 영역이 있으며, 우리는 이 영역이 어떻게 눈의 이미지를 3D 형태에 대한 이해로 처리하는지에 대한 기초적인 이해만 가지고 있습니다."라고 Hung은 계속 말했습니다. “인간 행동과 두피 기록을 기반으로 한 HDR 휘도 연구 결과는 실험실과 실제 환경 사이의 간극을 연결하는 방법에 대해 우리가 진정으로 아는 것이 거의 없음을 보여줍니다. 그러나 이러한 발견은 표준 컴퓨터 모니터의 이전 가정이 실제 세계로 일반화하는 능력이 제한적이며 올바른 메커니즘으로 모델링을 안내할 수 있는 원칙을 보여줌으로써 우리를 틀에서 벗어나게 합니다.” 

뇌의 시각적 표현에서 빛과 대비 가장자리가 어떻게 상호 작용하는지 발견함으로써 알고리즘은 실제 조명 아래에서 3D 세계를 재구성하는 데 더 효과적일 것입니다. 3D 정보에서 2D 형상을 추정할 때 항상 모호함이 있지만 이번 새로운 발견을 통해 이를 수정할 수 있습니다.

"수백만 년의 진화를 통해 우리의 두뇌는 3D 정보에서 2D를 재구성하기 위한 효과적인 지름길을 진화시켰습니다."라고 Hung은 말했습니다. "최근 AI의 발전에도 불구하고 머신 비전 과학자들이 계속해서 도전하는 수십 년 된 문제입니다."

이 팀의 발견은 넓은 동적 범위 감지를 활용하는 레이더 및 원격 음성 이해와 같은 AI 장치 개발에도 중요합니다. 

Hung은 “다이내믹 레인지 문제는 단순한 감지 문제가 아닙니다. “또한 개별 뉴런에는 수만 개의 입력이 있기 때문에 뇌 계산에서 보다 일반적인 문제일 수 있습니다. 다양한 상황에서 올바른 입력을 수신할 수 있는 알고리즘과 아키텍처를 어떻게 구축합니까? 우리는 감각적 수준에서 이 문제를 해결함으로써 우리가 올바른 길을 가고 있다는 것을 확인할 수 있기를 바랍니다. 그래서 더 복잡한 AI를 구축할 때 올바른 도구를 가질 수 있습니다.” 

Alex McFarland는 인공 지능의 최신 개발을 탐구하는 AI 저널리스트이자 작가입니다. 그는 전 세계 수많은 AI 스타트업 및 출판물과 협력해 왔습니다.