부본 로봇이 인간을 관찰하여 학습할 수 있는 학습 방법 - Unite.AI
Rescale 미팅 예약

로보틱스

로봇이 인간을 관찰하여 학습할 수 있는 학습 방법

게재

 on

이미지: CMU

카네기 멜론 대학(CMU)의 연구원들이 개발한 새로운 학습 방법은 로봇이 인간 상호 작용 비디오에서 직접 학습하고 정보를 새로운 작업에 일반화하여 집안일을 수행하는 방법을 배우는 데 도움이 됩니다. WHIRL은 In-the-wild Human Imitating Robot Learning의 약자로, 로봇이 작업을 관찰하고 비디오 데이터를 수집하여 결국 작업 자체를 완료하는 방법을 학습하는 데 도움이 됩니다. 

이 연구는 뉴욕에서 열린 Robotics: Science and Systems 컨퍼런스에서 발표되었습니다. 

배우는 방법으로서의 모방

Shikhar Bahl은 박사입니다. Carnegie Mellon University 컴퓨터 과학 학교의 Robotics Institute(RI) 학생. 

“모방은 배울 수 있는 좋은 방법입니다.”라고 Bahl은 말했습니다. "로봇이 인간을 직접 보면서 실제로 학습하게 하는 것은 현장에서 해결되지 않은 문제로 남아 있지만 이 작업은 그 능력을 가능하게 하는 데 중요한 단계를 밟았습니다."

Bahl은 RI의 교수이기도 한 Deepak Pathak 및 Abhinav Gupta와 함께 일했습니다. 팀은 20개가 넘는 작업을 완료하는 방법을 배운 기성품 로봇에 카메라와 소프트웨어를 추가했습니다. 이러한 작업에는 기기를 열고 닫는 것부터 쓰레기통에서 쓰레기 봉투를 꺼내는 것까지 모든 것이 포함되었습니다. 로봇이 스스로 시도하기 전에 인간이 작업을 완료하는 것을 지켜볼 때마다. 

Pathak은 RI의 조교수입니다.

"이 작업은 로봇을 가정으로 가져오는 방법을 제시합니다."라고 Pathak은 말했습니다. “로봇이 사람들의 집에 배치되기 전에 다양한 작업을 성공적으로 완료하도록 프로그래밍되거나 훈련될 때까지 기다리는 대신, 이 기술을 사용하면 로봇을 배치하고 작업을 완료하는 방법을 배우면서 환경에 적응하고 전적으로 개선할 수 있습니다. 보고.” 

WHIRL: 야생에서 인간 대 로봇 모방. RSS 2022에 게시되었습니다.

WHIRL 대 현재 방법

로봇에게 작업을 가르치는 대부분의 현재 방법은 모방 또는 강화 학습에 의존합니다. 모방 학습을 통해 인간은 수동으로 로봇을 조작하고 로봇이 학습하기 전에 여러 번 수행해야 하는 작업을 완료하는 방법을 가르칩니다. 강화 학습을 통해 로봇은 일반적으로 훈련을 실제 세계에 적용하기 전에 시뮬레이션에서 수백만 개의 예에 대해 훈련됩니다. 

이 두 모델 모두 구조화된 환경에서 로봇에게 단일 작업을 가르치는 데 효율적이지만 확장 및 배포가 어렵다는 것이 입증되었습니다. 그러나 WHIRL을 사용하면 인간이 작업을 완료하는 모든 비디오에서 로봇이 학습할 수 있습니다. 또한 쉽게 확장 가능하고 특정 작업에 국한되지 않으며 가정 환경에서 작동할 수 있습니다. 

WHIRL은 로봇이 자연 환경에서 작업을 수행할 수 있도록 합니다. 그리고 처음 몇 번의 시도는 대개 실패로 끝났지만 몇 번의 성공 후에 매우 빠르게 학습할 수 있었습니다. 로봇은 항상 사람과 같은 움직임으로 작업을 수행하는 것은 아니지만 다르게 움직이는 부분이 다르기 때문입니다. 즉, 작업 수행의 최종 결과는 항상 동일합니다.

"야생에서 로봇 공학을 확장하려면 데이터가 신뢰할 수 있고 안정적이어야 하며 로봇은 스스로 연습하여 환경에서 더 좋아져야 합니다."라고 Pathak은 말했습니다. 

Alex McFarland는 인공 지능의 최신 개발을 탐구하는 AI 저널리스트이자 작가입니다. 그는 전 세계 수많은 AI 스타트업 및 출판물과 협력해 왔습니다.