인공지능

AI를 연구자로: 인간 없이 작성된 첫 번째 피어 리뷰 연구 논문

Published August 30, 2025

Updated April 26, 2026

Dr. Tehseen Zia

인공지능은 기계가 독립적으로 달성할 수 있는 것에 대한 우리의 이해를 도전하는 또 하나의 중요한 里程碑을 넘었습니다. 과학 역사상 처음으로, 인공지능 시스템은 인간의 도움 없이 학술 회의에서 피어 리뷰를 통과한 완전한 연구 논문을 작성했습니다. 이 획기적인 성과는 과학 연구가 미래에 어떻게 수행될지에 대한 근본적인 전환을 가져올 수 있습니다.

역사적인 성과

The AI Scientist-v2가 생성한 논문은 최고의 국제 인공지능 회의 중 하나인 ICLR 2025 워크샵에서 피어 리뷰 과정을 통과했습니다. 이 연구는 기계 학습에서 가장 권위 있는 장소 중 하나인 ICLR 2025 워크샵에 제출되었습니다. 이 논문은 원래 AI Scientist의 개선된 버전인 The AI Scientist-v2에 의해 생성되었습니다.

수락된 논문 “Compositional Regularization: Unexpected Obstacles in Enhancing Neural Network Generalization“은 인간 리뷰어로부터 인상적인 점수를 받았습니다. 3개의 제출된 논문 중 1개는 수락 임계값 이상의 등급을 받았습니다. 이 획기적인 성과는 인공지능이 과학 발견의 근본적인 과정에 참여할 수 있다는 것을 보여주며, 이는 수세기 동안 인간의 독점적인 영역이었습니다.

Sakana AI의 연구 팀은 브리티시컬럼비아 대학교와 옥스포드 대학교의 협력자와 함께 이 실험을 수행했습니다. 그들은 기관 검토委员会의 승인을 받고 ICLR 회의 주최자와 직접 협력하여 실험이 적절한 과학적 프로토콜을 따르는지 확인했습니다.

AI Scientist-v2의 작동 방식

AI Scientist-v2는 여러 주요 개선으로 인해 이러한 성공을 달성했습니다. 그의 전임자와는 달리, AI Scientist-v2는 인간이 작성한 코드 템플릿의 필요성을 제거하고, 다양한 기계 학습 도메인에서 작동하며, 여러 연구 경로를 동시에 탐색하기 위한 트리 검색 방법론을 사용합니다.

시스템은 인간 연구자가 작동하는 방식을 반영하는 종단간 프로세스를 통해 작동합니다. 그것은 할당된 연구 도메인에 따라 과학적 가설을 공식화하여 시작합니다. 그런 다음 AI는 이러한 가설을 테스트하기 위한 실험을 설계하고, 실험을 수행하기 위한 필요한 코드를 작성하며, 자동으로 실험을 실행합니다.

이 시스템이 특히 발전된 이유는 에이전트 트리 검색 방법론을 사용하는 것입니다. 이 접근 방식은 인간 연구자가 문제를 해결하기 위한 다양한 접근 방식을 고려하는 방식과 유사하게, AI가 여러 연구 방향을 동시에 탐색할 수 있도록 합니다. 이것은 에이전트 트리 검색을 통해 실험을 실행하고, 결과를 분석하며, 논문 초안을 생성하는 것을 포함합니다. 专用 실험 관리자 에이전트가 이整个 프로세스를 조정하여 연구가 집중적이고 생산적이도록 합니다.

시스템에는 또한 비전-언어 모델을 사용하여 연구 결과의 내용과 시각적 표현에 대한 피드백을 제공하는 고급 AI 리뷰어 구성 요소가 포함되어 있습니다. 이것은 AI가 피드백에 따라 자신의 작업을 개선할 수 있는 반복적인 개선 프로세스를 생성합니다. 이는 인간 연구자가 동료의 입력에 따라 원고를 개선하는 방식과 유사합니다.

이 연구 논문의 특별한 점

수락된 논문은 기계 학습에서 어려운 문제인 조합 일반화에 중점을 두었습니다. 이것은 신경망이 이전에 본 적 없는 새로운 조합에서 학습된 개념을 이해하고 적용하는 능력을 말합니다. AI Scientist-v2는 이 능력을 개선할 수 있는 새로운 규제 방법을 조사했습니다.

흥미롭게도, 이 논문은 또한 부정적인 결과를 보고했습니다. AI는 실제로 신경망 성능을 개선하는 것으로 생각한 접근 방식이 실제로 예상치 못한 장애물을 생성한다는 것을 발견했습니다. 과학에서 부정적인 결과는 다른 연구자가 비생산적인 경로를 추구하지 않도록 방지하고, 무엇이 작동하지 않는지에 대한 우리의 이해에 기여하기 때문에 가치があります.

연구는 전체 프로세스에서 엄격한 과학적 표준을 따랐습니다. AI Scientist-v2는 통계적 유효성을 보장하기 위해 여러 실험을 수행했으며, 자신의 발견에 대한 명확한 시각화를 생성했으며, 관련 이전 연구를 적절하게 인용했습니다. 또한 전체 원고를 학술 표준에 따라 형식화하고, 자신의 방법론과 발견에 대한 포괄적인 토론을 작성했습니다.

이 프로젝트를 감독한 인간 연구자들은 세 개의 생성된 논문에 대한 자신의 철저한 검토를 수행했습니다. 그들은 수락된 논문이 워크샵 품질이지만, 주요 회의 트랙에서 수락되지 않을 기술적인 문제가 포함되어 있음을 발견했습니다. 이誠實한 평가에서는 현재의 제한을 보여주면서도 달성된 상당한 진행을 인정합니다.

기술적 능력과 개선

AI Scientist-v2는 이전 자동화된 연구 시스템과 구별되는 몇 가지 주목할만한 기술적 능력을展示합니다. 시스템은 사전 작성된 코드 템플릿이 필요하지 않으며, 다양한 기계 학습 도메인에서 작동할 수 있으며, 여러 연구 경로를 동시에 탐색할 수 있는 트리 검색 방법론을 사용합니다.

트리 검색 방법론은 AI 연구 자동화에서 중요한 혁신입니다. 단일 연구 방향을 추구하는 대신, 시스템은 여러 가설을 동시에 유지할 수 있으며, 각 방향이 보여주는 약속에 따라 계산 리소스를 할당할 수 있습니다. 이는 경험 많은 인간 연구자가 여러 연구 스레드를 유지하면서 가장 약속하는 경로에 집중하는 방식과 유사합니다.

또 다른 중요한 개선은 연구 논문의 시각적 요소를 검토하고 개선하기 위해 비전-언어 모델의 통합입니다. 과학적 그림과 시각화는 연구 결과를 효과적으로 전달하는 데 중요합니다. AI는 이제 자신의 데이터 시각화를 반복적으로 평가하고 개선할 수 있습니다.

시스템은 또한 과학적 작성 규칙을 이해합니다. 그것은 적절한 섹션으로 논문을 구조화하고, 원고 전체에서 일관된 용어를 유지하며, 연구 내러티브의 다양한 부분 사이에 논리적인 흐름을 생성합니다. AI는 방법론을 제시하고, 제한을 논의하며, 발견을 기존 문헌 내에서 맥락화하는 방법을 알고 있습니다.

현재의 제한과 도전

이 역사적인 성과에도 불구하고, 현재 AI 생성 연구의 능력을 제한하는 몇 가지 중요한 제한이 있습니다. 회사는 자신의 내부 기준을 충족하는 ICLR 회의 트랙 출판 표준에 도달하지 못한 AI 생성 연구가 없다고 말했습니다. 이것은 AI가 워크샵 품질의 연구를 생성할 수 있지만, 최고의 과학적 출판에 도달하는 것은 여전히 도전적임을 나타냅니다.

수락률은 이 성과를 평가하기 위한 중요한 맥락을 제공합니다. 이 논문은 일반적으로 주요 회의 트랙보다 기준이 덜 엄격한 워크샵 트랙에서 수락되었습니다(수락률 60-70% 대 20-30%). 이것은 이 성과의 중요성을 약화시키지 않지만,真正의 획기적인 연구를 생성하는 것은 여전히 현재 AI의 능력을 넘어서는 것임을 시사합니다.

AI Scientist-v2는 인간 연구자가 검토 과정에서 식별한 일부 약점을 보여주었습니다. 시스템은 때때로 인용 오류를犯했으며, 연구 결과를 잘못된 저자 또는 출판물에 속했습니다. 또한 인간 전문가가 다르게 접근했을 일부 실험 설계 측면에서 어려움을 겪었습니다.

아마도 가장 중요한 것은 AI 생성 연구가 새로운 방식으로 과학적 문제에 접근하는 것보다 기존 연구 프레임워크 내에서 철저한 조사를 수행하는 데 더 능숙하다는 것입니다.

앞으로의 길

AI 생성 연구의 성공적인 피어 리뷰는 새로운 과학 연구의 시작입니다. 기초 모델이 계속 개선됨에 따라, 우리는 AI Scientist와 유사한 시스템이 인간의 능력과 경쟁하며, 많은 도메인에서 이를 능가하는越来越 복잡한 연구를 생성할 것으로 기대할 수 있습니다.

연구 팀은 미래의 버전이 최고의 회의와 저널에서 수락될만한 논문을 생성할 수 있을 것으로 예상합니다. 논리적인 진행은 AI 시스템이 의학, 물리학, 화학 등 다양한 분야에서 획기적인 발견에 기여할 수 있음을 시사합니다.

이 발전은 또한 연구 윤리와 출판 표준에 대한 중요한 질문을 제기합니다. 과학적 커뮤니티는 AI 참여와 언제, 어떻게 공개할 것인지, AI 생성 연구를 인간 생성 연구와 함께 평가하는 방법에 대한 새로운 규범을 개발해야 합니다.

이 실험에서 연구 팀이 보여준 투명성은 미래의 AI 연구 평가를 위한 귀중한 모델을 제공합니다. 회의 주최자와 함께 공개적으로 협력하고, 자신의 AI 생성 연구를 인간 연구와 동일한 표준으로 평가함으로써, 그들은 자동화된 연구 능력의 책임 있는 개발을 위한 중요한 선례를樹立했습니다.

결론

인간 없이 작성된 연구 논문이 최고의 기계 학습 워크샵에서 수락된 것은 AI의 능력에서 중요한 발전입니다. 아직 최고의 회의 수준에 도달하지 못했지만, 이는 AI 시스템이 과학적 발견에 중요한 기여를 할 수 있는 방향으로 나아가고 있음을 보여줍니다.現在의 도전은 기술을 발전시키는 것뿐만 아니라, 이 새로운 연구 전선에 대한 윤리적 및 학술적 프레임워크를 형성하는 것입니다.

Dr. Tehseen Zia

Dr. Tehseen Zia는 COMSATS University Islamabad의 정교수이며, 오스트리아 비엔나 기술대학교에서 인공지능 박사학위를 취득했습니다. 인공지능, 기계학습, 데이터 과학, 컴퓨터 비전을 전문으로 하며, 유명한 과학 저널에 발표된 논문으로 знач적인 기여를 했습니다. Dr. Tehseen은 주요 연구자로서 다양한 산업 프로젝트를 이끌었으며, 인공지능 컨설턴트로도 활동했습니다.