Connect with us

Anderson의 관점

개인적인 컴퓨터 비전 문헌 동향에 대한 관점 2025

mm
AI-generated image, by gpt-image-1 via ChatGPT-5.2, featuring a stylized isometric illustration of white-coated scientists in a computer laboratory.

윤리적 공개와 가우시안 스플래팅은衰退하고 있지만, 제출된 논문의 엄청난 양은 2026년에 AI가 해결해야 할 새로운 문제를 나타낸다.

 

의견 나는 약 7년 동안 arXiv와 관련된 장소에서 컴퓨터 비전과 이미지 합성 연구를 따라 왔으며, 다양한 매체를 통해 반복되는 패턴과 동향의 변화를 구별할 수 있을 만큼 충분히 지켜보았다. 그러나 이러한 관찰은 경험적이다. 나는 진심으로 arXiv 출판 스트림만으로도 나타나는 방대한 데이터 집합을 이용하여 기계 학습 분석을 통해 숨겨진 통찰력을 얻을 수 있는 시간이 있었으면 좋겠다. 현재로서는 나는 더 사적으로 이전에 고려한 사항 이후에 내가 주목한 것을 보고할 수 있을 뿐이다.

음량 11

2024년에 관찰한 많은 AI 연구 논문 제출 동향은 2025년에 정착된 것으로 나타났으며, 그 중 가장 두드러진 것은 AI와 함께 자극되는 AI 관련 논문의 음량의 지속적인 상승이다. 이는 인식된 위기에 이를 정도이다:

2023년 10월에서 2025년 11월까지의 월간 컴퓨터 과학 Arxiv 제출, 3개월 이동 평균이 겹쳐짐. 출처: https://arxiv.org/stats/monthly_submissions

2023년 10월에서 2025년 11월까지의 월간 컴퓨터 과학 Arxiv 제출, 3개월 이동 평균이 겹쳐짐. 출처

이 성장률은 몇 년 전 AI 논문 제출의 월간 증가가 지수적으로 두 배로 증가한다고 설명되었으며, 최근 AI 투자 열풍으로 인해 자금이 증가하고 내년에도 같은 추세가 지속될 것으로 보인다.

2025年的 전체 통계는 아직 उपलब하지 않으며, 위에 표시된 집계 통계는 모든 범주에서 증가하는 일반적인 숫자를 나타낸다. 아래에서 컴퓨터 과학이 다른 분야보다 훨씬 높은 추세를 보이는 것을 볼 수 있다:

2022-2025 컴퓨터 과학 제출 증가. 출처 - https://info.arxiv.org/about/reports/submission_category_by_year.html

2022-2025 컴퓨터 과학 제출 증가. 출처

쓸모없는 것 분리

10월, 가을 컨퍼런스 시즌의 시작은 새로운 연구의 홍수였지만, 과도한 제출로 인해 연구 동향 분석과 같은 연구 분야에 대한 관심이 높아졌다. 즉, 제출된 논문 자체가 연구의 신호 대 잡음 비를 개선하려고 한다.

최근의 예는 NoveltyRank로, 논문GitHub 저장소가 있으며, 이를 통해 LLMs를 미세 조정하여 제출된 논문의 이진 분류 또는 짝별 신선도 비교를 수행할 수 있다:

NoveltyRank 시스템은 제출된 논문의 제목과 초록을 이전의 유사한 논문과 비교하고, LLM을 사용하여 차이를 요약한 다음 이를 미세 조정된 Qwen3-4B 모델에 전달하여 그 작업이 '개념적으로 새로운' 것으로 간주되는지 결정한다. 출처 - https://arxiv.org/pdf/2512.14738

NoveltyRank 시스템은 제출된 논문의 제목과 초록을 이전의 유사한 논문과 비교하고, LLM을 사용하여 차이를 요약한 다음 이를 미세 조정된 Qwen3-4B 모델에 전달하여 그 작업이 ‘개념적으로 새로운’ 것으로 간주되는지 결정한다. 출처

이러한 ‘분리’ 접근 방식의 문제는 의미 있는 변수를 정의하는 도전이다. NoveltyRank 접근 방식은 논문의 수락을 신선도 지수로 사용하며, 아마도 경시적으로 Arxiv 출판을 부정적인 신선도 지수로 사용한다.

이것은 두 가지 잘못된 전제를 가정한다. 첫째, 모든 컨퍼런스에서 수락된 제출은 새로운 것이거나 중요하다는 것이다. 둘째, 신선도 자체가 무조건적인 가치가 있다는 것이다. 일부 논문이 제출된 이유가 ‘출판하거나 죽어라’ 할당량을 유지하기 위한 것일 수 있으므로, 신선도는 종종 사소하며, 증분 작업은 종종 중요하다는 것을 알 수 있다.

새로운 논문의 가치를 이해하는 것은 현재 AI가 매우 약한 분야이다 – 장기 컨텍스트. 종종 불성실하게 작성된 논문은 중요한 발전으로 보일 수 있지만 자동화된 시스템은 이러한 경우를 직관적으로 개발해야 하며, 여러 거짓 양성 결과를 표시하지 않고, 제출한 저자의 정직성을 의존하지 않도록 해야 한다.

윤리적 추락

나는 이전에 관찰했듯이, Arxiv와 같은 포털은 매우 자유분방한 스크레이핑에 저항적이며, 제공하는 데이터 덤프는 종종 세부 사항이 없다.

따라서 나는 컴퓨터 과학 논문의 대표적인 樣本을 다운로드하여 특징을 추출할 수 있는 자원과 시간이 있다고 하더라도, 많은 미묘한 동향은 대상이 아니거나 분석되지 않을 것이다.

이 중 하나는 제출된 논문의 끝에 포함된 윤리적 진술 부기의 존재 또는 부재이다. 2024년에는 컴퓨터 과학 범주에서 제출된 작업의 윤리적 특성을 기술하는 것이 정점에 달했다.

경험적으로, 나는 이러한 관행이 2025년을 통해 급격히 감소했다고 말할 수 있다. 내 추측은 현재 미국 정부의 AI 개발에 대한 규제 완화 노력이 미국과 해외의 연구 커뮤니티에게 암시적 보호와 법적 노출로부터의 면제를 제공했다는 것이다.

미국 정부는 반 딥페이크 규제를 지지했지만, 현재 미국 정부는 사실상 2021-23년 시대의 ‘와일드 웨스트’ 태도를 다시 회복했으며, 이는 순수한 과학 연구로 정의되었지만 이후 역사적인 수준의 투자로 발전했다.

생성된 비디오 논문은 ‘AI 쓰레기’

지난 겨울 Hunyuan Video와 WAN 생성 비디오 시리즈의 출시로 인해 2025년에 AI 비디오가 완전히 변했다. 완전한 신체 아바타르를 만드는 어려움 또는 인물의 프로필 뷰를 얻는 것은 한밤중에 사라졌다.

중국에서 이러한 종류의 가중치 포함 릴리스는 아마도 이 해의 생성 비디오 릴리스를 위해 일정한 압력을 가했을 것이며, 서양 AI 비디오 아키텍처가 더 검열되고 상업화되고 규정된 경향에 대해 반작용적인 압력을 가했다.

이러한 민주적이고 CCCP가 주도하는 장면에서 모험이不存在한 것은 수백, 아니 수천 개의 회사들이 사용자 친화적인 포털을 제공함으로써 새로운 시장인 추론을 이용하려고 하는데, civit.ai와 RunPod와 같은 다양한 플레이어가 이익을 얻고 있다.

일반적으로 이러한 이니셔티브는 단기적으로 현금을 긁어모으는 것으로, 궁극적으로 시장 통일로 대체될 것으로 예상되지만, 그들의 창립자는 우연히 지배적인 시장 점유율을 얻는 것을 거부하지 않을 것이다.

이와 같은 평범함과 복제는 2025년 Arxiv의 제출에 대한 생성 비디오 스트랜드에 영향을 미쳤으며, 연구자들은 이 해의 돌파구로 인해 방출된巨額의 잠재적 자금을 위해 공개적으로 경쟁한다.

그렇지만, 이러한 종류의 대부분의 제출은 최고의 경우 증분적인 발전이다. 생성 AI에 남아 있는 핵심 문제는今年 많이 나타나지 않았다. 동일성을 유지하는 필요성, LoRA 스타일, 캐릭터 묘사 전체에서; 더 긴 런타임을 위한 출력 비디오의 일관성을 유지하는 필요성(즉, 환경 및 테마 등); 생성 비디오 및 비디오 편집 아키텍처 내에서 오디오 생성 및 조작을 개선하는 필요성 등.

메쉬 열이 감소

나는 지난해에 전통적인 CGI(즉, 1970년대부터 시작된 메쉬 기반 표현)를 활용하는 시스템을 홍보하는 논문이 증가하는 것을 관찰했다. 그러나 2025년 후반에 이러한 메쉬 기반 솔루션에 대한 추진력이 크게 감소했다.

이전의 논문에서 CGI를 통합한 많은 솔루션은 Hunyuan, Kling, WAN과 같은 확산 기반 생성 프레임워크의 새로운 기능에 의해 대체되었다.

Gaussian Splat 접근 방식에 대한 논문도 개발 정체 또는 2025년의 확산 기반 생성 AI 시스템에 의해 가려졌을 수 있다.

한 해 전, 나는 Gaussian Splat의 초기 흥분이 2023년 말에 감소하여 더 좁은 연구 라인으로 들어갔다고 관찰했다. 이번에는 이 접근 방식의重大한 자원 요구와 같은 문제를 해결하려고 하는 논문들이 나타났다.

나는 가우시안 스플래팅이 현재 정체된 것으로 간주하지만, 이 기술은 1990년대 초에 시작되었으며, 부활하는 성향이 있다.

메쉬 기반 접근 방식에서 후퇴하는 일반적인 추세의 예외는 3D 프린팅을 위한 프레임워크에 AI를 통합하는 데 대한 관심이 증가한 것이다.

AI 보안 제출 감소

2025년의 나의 마지막 관찰은 컴퓨터 과학 섹션의 Arxiv에 있는 ‘보안’ 제출 카테고리가 빈번도와 품질에서 현저한 감소를 보였다. 이는 쉽게 이유를 알 수 없다.

암호학 및 보안 아카이브는 개인 분야의 사유 지적 재산에 의해 지배되므로, 학술 저널에 출판되지 않고 Arxiv와 같은 무료 플랫폼에 거의 나타나지 않는다.

Arxiv의 이 카테고리에 대한 제출에는 다른 카테고리보다 ‘gotchas’가 더 많다. 즉, 종종 예상치 못한 곳에 숨겨져 있으며, 논문의 명백한 가치와 신선도를 부정하거나 줄이는 것을 인정한다.

2026년에 기대할 것

미디어는 Gen AI 붐을 초기 2000년대의 닷컴 붐과 붕괴의 반복으로 묘사하고 있지만, 이는 실제로 어떤 종류의 거짓 안정감을 나타낸다. 인프라, 투자, 문화, 연구의 관점에서 볼 때, 이러한 시기와 같은 때는 인류 역사에서 결코 없었다.

따라서 2026년 연구 장면이 어떻게 트렌드할지 예측하기는 어렵다. 그러나 2025년의 관점과 트렌드가 2026년 4월까지 진행되는 장기적인 노력에 영향을 미칠 것이다.

2026년을 위한 하나의 개발은 Arxiv와 다른 포털에서의 제출 볼륨 위기를 도와줄 수 있는 것이며, 이는 AI 생성/보조 논문에 대한 금지 또는 검사를 시행하는 것이다. 그러나 AI의 참여 정도는 정량화하기 어렵다. AI는 연구 문화에 침투했으며, 다른 영역과 마찬가지로 기존의 물을 변화시키지 않고 물에 떨어진墨痕과 같은 방식으로 침투했다.

 

2025년 12월 22일 처음 게시

기계 학습 작가, 인간 이미지 합성 도메인 전문가. Metaphysic.ai의 연구 콘텐츠 책임자 출신.
개인 사이트: martinanderson.ai
연락처: [email protected]
트위터: @manders_ai