로보틱스

인간이 주도하는 AI 프레임워크, 새로운 환경에서 더 빠른 로봇 학습을 약속한다

Published July 23, 2023

Updated April 28, 2026

Alex McFarland

智能 घर의 미래 시대에, 가정을 위한 일들을 간소화하기 위한 로봇을 획득하는 것은 드문 일이 아닐 것이다. 그러나 이러한 자동화된 도우미들이 간단한 작업을 수행하지 못할 때 좌절감이 생길 수 있다. MIT의 전기공학 및 컴퓨터 과학부의 학자인 Andi Peng와 그녀의 팀은 로봇의 학습 곡선을 개선하기 위한 길을 만들고 있다.

Peng와 그녀의 연구팀은 인간-로봇 상호작용 프레임워크를 개척했다. 이 시스템의 핵심은 로봇이 작업을 성공적으로 수행하기 위해 필요한 변경 사항을 가리키는 대안적 내러티브를 생성하는 것이다.

예를 들어, 로봇이 특이하게 페인트가 된 머그를 인식하지 못할 때, 시스템은 로봇이 성공할 수 있는 대체 상황을 제공한다. 예를 들어, 머그가 더 일반적인 색상이었다면 성공할 수 있었을 것이다. 이러한 대안적 설명과 인간의 피드백은 로봇의 세부 튜닝을 위한 새로운 데이터를 생성하는 과정을 간소화한다.

Peng는 “세부 튜닝은 이미 하나의 작업에 능숙한 기존 기계 학습 모델을 최적화하여 두 번째, 유사한 작업을 수행할 수 있도록 하는 과정”이라고 설명한다.

효율성과 성능의飞躍

이 시스템을 테스트한 결과, 로봇은 빠른 학습 능력을 보여주었으며, 인간 교사의 시간 투자를 줄였다. 이 혁신적인 프레임워크를 대규모로 성공적으로 구현할 경우, 로봇은 새로운 환경에 신속하게 적응할 수 있으며, 사용자가 고급 기술 지식을 갖추지 않아도 된다. 이 기술은 효율적으로 노인이나 장애인을 지원할 수 있는 일반적인 목적의 로봇을 잠금 해제하는 열쇠가 될 수 있다.

Peng는 “최종 목표는 로봇이 인간과 같은 추상적인 수준에서 학습하고 작동할 수 있도록 하는 것”이라고 믿는다.

로봇 훈련의 혁신

로봇 학습의 주요 장애물은 ‘분포 이동’이라고 하는 용어로, 로봇이 훈련 기간 동안 노출되지 않은 객체나 공간을 만났을 때 발생하는 상황이다. 연구자들은 이 문제를 해결하기 위해 ‘모방 학습’이라는 방법을 구현했다. 그러나 그것에는 한계가 있었다.

“30,000개의 머그를 로봇에게 집어서 로봇이任意의 머그를 집을 수 있도록 가르치는 대신, 한 개의 머그로 로봇이任意의 색상의 머그를 집을 수 있도록 가르치는 것이 더 좋다”고 Peng는 말한다.

이에 대응하여, 팀의 시스템은 작업에 필수적인 객체의 속성(예: 머그의 모양)을 식별하고, 중요하지 않은 속성(예: 머그의 색상)을 식별한다. 이러한 정보를 사용하여, 시스템은 합성 데이터를 생성하여 “중요하지 않은” 시각적 요소를 변경하여 로봇의 학습 과정을 최적화한다.

인간의 추론과 로봇 논리 연결

이 프레임워크의 효능을 평가하기 위해, 연구자들은 인간 사용자를 대상으로 테스트를 수행했다. 참가자들은 시스템의 대안적 설명이 로봇의 작업 수행을 이해하는 데 도움이 되었는지 물었다.

Peng는 “인간은 본질적으로 이러한 형태의 대안적 추론에 능숙하다. 이것이 인간의 추론을 로봇 논리와無마찰로 번역할 수 있도록 한다”고 말했다.

다수의 시뮬레이션에서, 로봇은 일관되게 더 빠르게 학습했으며, 다른 기술보다 더 나은 성능을 보여주었으며, 사용자로부터 더 적은 시연이 필요했다.

미래를 내다보면, 팀은 이 프레임워크를 실제 로봇에 구현하고, 생성적 기계 학습 모델을 통해 데이터 생성 시간을 단축하는 데 집중할 계획이다. 이 혁신적인 접근법은 로봇 학습의 궤적을 변革할 수 있는 잠재력을 가지고 있으며, 로봇이 우리의 일상生活에서 조화롭게 공존하는 미래를 위한 길을 열어줄 수 있다.

Unite.AI

인간이 주도하는 AI 프레임워크, 새로운 환경에서 더 빠른 로봇 학습을 약속한다

효율성과 성능의飞躍

로봇 훈련의 혁신

인간의 추론과 로봇 논리 연결

You may like