인공 지능

Minecraft 기계 학습 경쟁에서 경쟁하는 AI

업데이트 on 2022 년 12 월 9 일

로에서보고 자연, AI 엔지니어와 코더가 관찰과 예를 통해 학습할 수 있는 프로그램을 만들도록 장려하는 새로운 AI 대회인 MineRL 대회가 곧 열릴 예정입니다. 이러한 AI 시스템의 테스트 사례는 매우 인기 있는 제작 및 생존 비디오 게임인 Minecraft가 될 것입니다.

인공 지능 시스템은 비디오 게임과 관련하여 최근 인상적인 성과를 거두었습니다. 최근에 AI는 전략 게임인 스타크래프트 II에서 세계 최고의 인간 플레이어를 이겼습니다. 그러나 스타크래프트 II에는 AI가 훈련하는 데 사용할 수 있는 일관된 단계로 쉽게 세분화할 수 있는 정의 가능한 목표가 있습니다. 훨씬 더 어려운 작업은 AI가 Minecraft와 같은 대규모 오픈 월드 샌드박스 게임을 탐색하는 방법을 배우는 것입니다. 연구자들은 AI 프로그램이 관찰과 예를 통해 학습하도록 돕는 것을 목표로 하고 있으며, 성공할 경우 인공 지능 프로그램을 교육하는 데 필요한 처리 능력의 양을 크게 줄일 수 있습니다.

경쟁 참가자는 AI를 훈련하기 위해 최대 XNUMX만 단계를 거쳐 마인크래프트로 테스트할 AI를 만드는 데 XNUMX일의 시간이 주어집니다. AI의 목표는 땅을 파서 게임 내에서 다이아몬드를 찾는 것입니다. XNUMX만 단계의 훈련은 오늘날 강력한 AI 모델을 훈련하는 데 필요한 시간보다 훨씬 짧은 시간이므로 대회 참가자는 현재 훈련 방법보다 획기적으로 개선된 방법을 설계해야 합니다.

참가자가 사용하는 접근 방식은 모방 학습이라는 학습 유형을 기반으로 합니다. 모방 학습은 공장의 로봇 팔이나 스타크래프트 II에서 인간 플레이어를 이길 수 있는 AI와 같은 정교한 시스템을 훈련하는 데 널리 사용되는 강화 학습과 대조됩니다. 강화 학습 알고리즘의 주요 단점은 학습을 위해 함께 연결된 수백 또는 수천 대의 컴퓨터에 의존하여 훈련하는 데 엄청난 컴퓨터 처리 능력이 필요하다는 사실입니다. 대조적으로, 모방 학습은 훨씬 더 효율적이고 계산 비용이 덜 드는 훈련 방법입니다. 모방 학습 알고리즘은 인간이 관찰을 통해 학습하는 방식을 모방하려고 노력합니다.

Carnegie Mellon University의 심층 학습 이론 박사 과정 학생인 William Guss는 Nature에 AI가 환경에서 패턴을 탐색하고 학습하는 것은 엄청나게 어려운 작업이지만 모방 학습은 AI에게 지식의 기준선 또는 좋은 정보를 제공한다고 설명했습니다. 환경에 대한 사전 가정. 이를 통해 강화 학습에 비해 AI 교육이 훨씬 빨라질 수 있습니다.

Minecraft는 여러 가지 이유로 특히 유용한 교육 환경 역할을 합니다. 한 가지 이유는 Minecraft를 통해 플레이어가 간단한 빌딩 블록을 사용하여 복잡한 구조와 항목을 만들 수 있고 이러한 구조를 만드는 데 필요한 많은 단계가 연구원이 메트릭으로 사용할 수 있는 진행 상황의 가시적인 마커 역할을 하기 때문입니다. Minecraft도 매우 인기가 있으며, 이 때문에 교육 데이터를 수집하기가 비교적 쉽습니다. MineRL 대회의 주최자는 많은 Minecraft 플레이어를 모집하여 도구 생성 및 블록 제동과 같은 다양한 작업을 시연했습니다. 데이터 생성을 크라우드소싱함으로써 연구자들은 게임에서 취할 수 있는 행동의 60천만 가지 예를 포착할 수 있었습니다. 연구원들은 경쟁 팀에 약 1000시간 분량의 비디오를 제공했습니다.

Rohin Shah 박사는 인간이 축적한 지식을 사용한다고 말합니다. University of California, Berkeley의 컴퓨터 과학 후보자는 이번 대회가 AI 훈련을 촉진하기 위해 인간이 이미 생성한 지식을 사용하는 데 초점을 맞춘 최초의 대회일 가능성이 높다고 Nature에 설명했습니다.

Guss와 다른 연구자들은 이 대회가 Minecraft를 넘어 더 나은 모방 학습 알고리즘을 발생시키고 더 많은 사람들이 모방 학습을 AI 교육의 실행 가능한 형태로 고려하도록 영감을 주는 결과를 가져올 수 있기를 희망합니다. 이 연구는 복잡하고 변화하는 환경에서 사람들과 더 잘 상호 작용할 수 있는 AI를 만드는 데 잠재적으로 도움이 될 수 있습니다.