부본 연구원들은 강화 학습 시스템에 상식을 부여하기 위해 동물을 찾습니다 - Unite.AI
Rescale 미팅 예약

인공 지능

연구원은 강화 학습 시스템에 상식을 부여하기 위해 동물을 찾습니다.

mm
업데이트 on

Imperial College London, University of Cambridge, Google DeepMind와 같은 기관의 AI 연구원들은 강화 학습 시스템의 성능을 개선하는 방법에 대한 영감을 얻기 위해 동물을 찾고 있습니다. 관절에서 CellPress Reviews에 게재된 논문"인공 지능과 동물의 상식"이라는 제목의 논문에서 연구원들은 동물 인지가 강화 학습 에이전트에 대한 유용한 벤치마크와 평가 방법을 제공하고 작업 및 환경 엔지니어링에 정보를 제공할 수 있다고 주장합니다.

AI 연구원과 엔지니어는 알고리즘의 구조를 알리기 위해 행동 과학 및 신경 과학의 원칙을 사용하여 알고리즘을 설계할 때 영감을 얻기 위해 오랫동안 생물학적 신경망을 살펴왔습니다. 그러나 AI 연구자들이 신경과학/행동과학 분야에서 취하는 단서의 대부분은 인간을 기반으로 하며, 어린 아이들과 유아의 인지가 초점 역할을 합니다. AI 연구원은 아직 동물 모델에서 많은 영감을 얻지 못했지만 동물 인지는 강화 학습 공간에서 중요한 돌파구로 이어질 잠재력이 있는 미개척 자원입니다.

심층 강화 학습 시스템은 시행착오 과정을 통해 훈련되며, 강화 학습 에이전트가 원하는 목표 달성에 가까워질 때마다 보상으로 강화됩니다. 이는 보상으로 음식을 사용하여 원하는 작업을 수행하도록 동물을 가르치는 것과 매우 유사합니다. 생물학자와 동물인지 전문가들은 많은 실험을 해왔습니다. 인지 능력 평가 개, 곰, 다람쥐, 돼지, 까마귀, 돌고래, 고양이, 생쥐, 코끼리, 문어 등 다양한 동물들. 많은 동물들이 인상적인 지능을 보이며, 코끼리와 돌고래와 같은 동물도 있습니다. 마음의 이론을 가질 수도 있습니다.

동물 인지에 관해 수행된 연구를 살펴보면 AI 연구자들이 다른 각도에서 문제를 고려하도록 영감을 줄 수 있습니다. 딥 강화 학습이 더욱 강력하고 정교해짐에 따라 해당 분야의 AI 연구자들은 강화 학습 에이전트의 인지 능력을 테스트하는 새로운 방법을 모색하고 있습니다. 연구 논문에서 연구팀은 영장류와 조류를 대상으로 한 실험 유형을 언급하며 유사한 유형의 작업을 수행할 수 있는 시스템을 설계하는 것을 목표로 한다고 언급하며 AI에 일종의 "상식". 이 논문의 저자에 따르면 그들은 "아마도 아직 개발되지 않은 아키텍처를 가진 RL 에이전트가 풍부한 가상 환경과의 확장된 상호 작용을 통해 필요한 것을 획득하는 접근 방식을 옹호합니다."

VentureBeat에서 보고한 바와 같이, 인공 지능 연구자들은 상식이 인간에게만 고유한 특성이 아니며 물체가 점과 공간을 차지하는 방법, 해당 물체에 어떤 제약이 있는지와 같은 물리적 세계의 기본 속성에 대한 이해에 달려 있다고 주장합니다. 움직임, 원인과 결과에 대한 감사. 동물은 실험실 연구에서 이러한 특성을 나타냅니다. 예를 들어, 까마귀는 씨앗이 숨겨져 있거나 다른 물체에 가려져 있어도 씨앗을 회수할 수 있기 때문에 물체가 영구적인 것임을 이해합니다.

강화 학습 시스템에 이러한 속성을 부여하기 위해 연구자들은 올바른 아키텍처와 쌍을 이룰 때 학습된 원칙을 다른 작업으로 전달할 수 있는 에이전트를 생성할 작업을 만들어야 한다고 주장합니다. 연구자들은 그러한 모델에 대한 훈련에는 소수의 예에만 노출된 후 에이전트가 개념을 이해하도록 요구하는 기술(퓨샷 훈련이라고 함)이 포함되어야 한다고 주장합니다. 이것은 일반적으로 RL 에이전트의 시행 착오 교육에 들어가는 기존의 수백 또는 수천 번의 시행과 대조됩니다.

연구팀은 계속해서 일부 최신 RL 에이전트가 여러 작업을 해결하는 방법을 배울 수 있지만 그 중 일부는 학습된 원칙의 기본 전달이 필요하지만 RL 에이전트가 "상식"에서 추상적인 개념을 학습할 수 있는지는 확실하지 않다고 설명합니다. . 이러한 개념을 잠재적으로 학습할 수 있는 에이전트가 있는 경우 RL 에이전트가 컨테이너의 개념을 이해했는지 확인할 수 있는 테스트가 필요합니다.

특히 DeepMind는 강화 학습 에이전트를 개발하고 테스트하는 새롭고 다양한 방법에 참여하게 된 것을 기쁘게 생각합니다. 최근 10월 초에 열린 스탠포드 HAI 컨퍼런스에서 딥마인드의 신경과학 연구 책임자인 매튜 보트비닉(Matthew Botvinick)은 기계 학습 연구원과 엔지니어들에게 다른 과학 분야에서 더 많은 협력을 촉구했습니다. Botvinick은 다음과 같은 강연에서 AI 분야에 대한 심리학자 및 신경과학과의 학제간 작업의 중요성을 강조했습니다. "지능 삼각측량: 신경과학, 심리학 및 AI 융합".