Connect with us

로보틱스

페이스북, 지도 없이도 AI 로봇이 탐색할 수 있는 방법 개발

mm

페이스북은 최근에 AI 에이전트가 환경을 탐색하는 능력을 향상시키는 알고리즘을 개발하였으며, 에이전트가 지도 없이 새로운 환경에서 최단 경로를 결정할 수 있도록 합니다. 일반적으로 모바일 로봇은 지도 데이터가 내장되어 있지만, 페이스북이 설계한 새로운 알고리즘은 지도 없이 환경을 탐색할 수 있는 로봇을 만들 수 있을 것입니다.

페이스북 연구자들이 작성한 게시물에 따르면, 로봇 탐색의 주요 도전은 AI 시스템에 새로운 환경을 탐색하고 지도 없이 목적지에 도달하는 능력을 부여하는 것입니다. 이 도전을 해결하기 위해 페이스북은 다중 학습자에 분산된 강화 학습 알고리즘을 개발했습니다. 이 알고리즘은 분산된 근접 정책 최적화(DD-PPO)라고 불리며, 나침반 데이터, GPS 데이터, 및 RGB-D 카메라 액세스만을 사용하여 가상 환경에서 목표에 도달할 수 있었습니다.

연구자들에 따르면, 에이전트들은 가상 환경에서 훈련되었으며, 결과적으로 알고리즘은 시뮬레이션된 실내 환경에서 탐색할 수 있었으며, 경로에서 올바른 분기를 선택하고, 잘못된 경로를 선택한 경우 빠르게 복구할 수 있었습니다. 가상 환경의 결과는 유망했으며, 에이전트들이 이러한 일반적인 환경을 신뢰성 있게 탐색할 수 있는 것은 중요합니다. 실제 세계에서 에이전트가 실패할 경우 에이전트 또는 주변 환경을 손상시킬 수 있기 때문입니다.

페이스북 연구 팀은 그들의 프로젝트의 초점이 보조 로봇であったことを 설명했으며, 보조 로봇과 AI 에이전트의 경우 적절한 탐색이 필수적입니다. 연구 팀은 탐색이 다양한 보조 AI 시스템에 필수적임을 주장했으며, 집에서 작업을 수행하는 로봇부터 시각 장애인들을 도와주는 AI 구동 장치까지 포함됩니다. 연구 팀은 또한 AI 제작자가 일반적으로 지도 사용을 중단해야 한다고 주장했으며, 지도는 그들이 그려질 때 이미 구식이며, 실제 세계 환경에서는 지속적으로 변경되고 발전하고 있기 때문입니다.

TechExplore가 보고한 바와 같이, 페이스북 연구 팀은 오픈 소스 AI 하비타트 플랫폼을 사용하여 시뮬레이션된 환경에서 에이전트를 훈련시킬 수 있었습니다. 하비타트는 현실적인 3D 환경에서 에이전트를 훈련시킬 수 있는 기능을 제공했으며, 이러한 환경은 충분히 현실적이므로 AI 모델에서 생성된 데이터를 실제 세계의 경우에 적용할 수 있습니다. MIT Technology Review의 Douglas Heaven은 모델의 훈련 강도를 설명했습니다.

“페이스북은 3일 동안 AI 하비타트 내에서 로봇을 훈련시켰으며, 이는 건물 내부의 사진 실감적인 가상 모의 환경입니다. 그期间 로봇은 2.5억 번의 단계를 수행했으며, 이는 80년의 인간 경험에 해당합니다.”

훈련 작업의 복잡성으로 인해 연구자들은 훈련 시간을 단축하기 위해 훈련이 진행됨에 따라 약한 학습자를 제거했습니다. 연구 팀은 현재 모델을 더욱 발전시키고, 카메라 데이터만을 사용하여 복잡한 환경을 탐색할 수 있는 알고리즘을 만들기 위해 노력하고 있습니다. 이유는 GPS 데이터와 나침반 데이터가 실내에서 종종 방해를 받거나, 너무 노이즈가 많거나, 사용할 수 없기 때문입니다.

기술이 아직 실외에서 테스트되지 않았으며, 장거리 탐색에 어려움이 있지만, 알고리즘의 개발은 다음 세대의 로봇, 특히 배달 드론 및 사무실 또는 집에서 작동하는 로봇의 개발에서 중요한 단계입니다.

블로거이자 프로그래머로 Machine Learning Deep Learning 주제에 전문가입니다. 다니엘은 다른 사람들이 AI의 힘을 사회적善으로 사용하는 것을 돕기를 희망합니다.