로보틱스
인간이 주도하는 AI 프레임워크, 새로운 환경에서 더 빠른 로봇 학습을 약속한다

智能 घर의 미래 시대에, 가정을 위한 일들을 간소화하기 위한 로봇을 획득하는 것은 드문 일이 아닐 것이다. 그러나 이러한 자동화된 도우미들이 간단한 작업을 수행하지 못할 때 좌절감이 생길 수 있다. MIT의 전기공학 및 컴퓨터 과학부의 학자인 Andi Peng와 그녀의 팀은 로봇의 학습 곡선을 개선하기 위한 길을 만들고 있다.
Peng와 그녀의 연구팀은 인간-로봇 상호작용 프레임워크를 개척했다. 이 시스템의 핵심은 로봇이 작업을 성공적으로 수행하기 위해 필요한 변경 사항을 가리키는 대안적 내러티브를 생성하는 것이다.
예를 들어, 로봇이 특이하게 페인트가 된 머그를 인식하지 못할 때, 시스템은 로봇이 성공할 수 있는 대체 상황을 제공한다. 예를 들어, 머그가 더 일반적인 색상이었다면 성공할 수 있었을 것이다. 이러한 대안적 설명과 인간의 피드백은 로봇의 세부 튜닝을 위한 새로운 데이터를 생성하는 과정을 간소화한다.
Peng는 “세부 튜닝은 이미 하나의 작업에 능숙한 기존 기계 학습 모델을 최적화하여 두 번째, 유사한 작업을 수행할 수 있도록 하는 과정”이라고 설명한다.
효율성과 성능의飞躍
이 시스템을 테스트한 결과, 로봇은 빠른 학습 능력을 보여주었으며, 인간 교사의 시간 투자를 줄였다. 이 혁신적인 프레임워크를 대규모로 성공적으로 구현할 경우, 로봇은 새로운 환경에 신속하게 적응할 수 있으며, 사용자가 고급 기술 지식을 갖추지 않아도 된다. 이 기술은 효율적으로 노인이나 장애인을 지원할 수 있는 일반적인 목적의 로봇을 잠금 해제하는 열쇠가 될 수 있다.
Peng는 “최종 목표는 로봇이 인간과 같은 추상적인 수준에서 학습하고 작동할 수 있도록 하는 것”이라고 믿는다.
로봇 훈련의 혁신
로봇 학습의 주요 장애물은 ‘분포 이동’이라고 하는 용어로, 로봇이 훈련 기간 동안 노출되지 않은 객체나 공간을 만났을 때 발생하는 상황이다. 연구자들은 이 문제를 해결하기 위해 ‘모방 학습’이라는 방법을 구현했다. 그러나 그것에는 한계가 있었다.
“30,000개의 머그를 로봇에게 집어서 로봇이任意의 머그를 집을 수 있도록 가르치는 대신, 한 개의 머그로 로봇이任意의 색상의 머그를 집을 수 있도록 가르치는 것이 더 좋다”고 Peng는 말한다.
이에 대응하여, 팀의 시스템은 작업에 필수적인 객체의 속성(예: 머그의 모양)을 식별하고, 중요하지 않은 속성(예: 머그의 색상)을 식별한다. 이러한 정보를 사용하여, 시스템은 합성 데이터를 생성하여 “중요하지 않은” 시각적 요소를 변경하여 로봇의 학습 과정을 최적화한다.
인간의 추론과 로봇 논리 연결
이 프레임워크의 효능을 평가하기 위해, 연구자들은 인간 사용자를 대상으로 테스트를 수행했다. 참가자들은 시스템의 대안적 설명이 로봇의 작업 수행을 이해하는 데 도움이 되었는지 물었다.
Peng는 “인간은 본질적으로 이러한 형태의 대안적 추론에 능숙하다. 이것이 인간의 추론을 로봇 논리와無마찰로 번역할 수 있도록 한다”고 말했다.
다수의 시뮬레이션에서, 로봇은 일관되게 더 빠르게 학습했으며, 다른 기술보다 더 나은 성능을 보여주었으며, 사용자로부터 더 적은 시연이 필요했다.
미래를 내다보면, 팀은 이 프레임워크를 실제 로봇에 구현하고, 생성적 기계 학습 모델을 통해 데이터 생성 시간을 단축하는 데 집중할 계획이다. 이 혁신적인 접근법은 로봇 학습의 궤적을 변革할 수 있는 잠재력을 가지고 있으며, 로봇이 우리의 일상生活에서 조화롭게 공존하는 미래를 위한 길을 열어줄 수 있다.












