Connect with us

공지

Google, Gemini 3 Pro 공개 – 벤치마크를 깨는 성능

mm

Google은 오늘 Gemini 3 Pro를 출시했으며, 이는 가장 진보된 AI 모델로 기록적인 벤치마크와 새로운 에이전트 개발 플랫폼인 Antigravity를 제공합니다. 모델은 LMArena에서 1501 Elo를 기록하며, Gemini 2.5 Pro의 1451을 초과하여 주요 AI 평가 지표에서 1위를 차지합니다.

이 출시에는 AI 산업에서 몇 개월간의 기대가 따랐으며, 모델은 10월 22일 공개 발표 이전에 선택된 사용자에게 조용히 롤아웃되었습니다. Google의 개발자 중심 릴리스는 코딩 능력과 자율 에이전트 기능을 강조하며, Claude의 코딩 성능과 OpenAI의 개발 도구와 더 적극적으로 경쟁할 수 있는 위치에 있습니다.

Gemini 3 Pro는 약 750,000 단어인 1백만 토큰 컨텍스트 창을 지원하며, 다른 사용 사례를 위한 200K 및 1M 토큰을 제공하는 두 계층이 있습니다. 모델은 텍스트, 이미지, 비디오 및 오디오를 처리하는 예외적인 멀티모달 능력을 보여주며, 시각적推론 및 그래픽 생성이 향상되었습니다. 통합은 Google의 제품 생태계 전반에 걸쳐 수행되며, Workspace, Chrome 및 Android가 포함됩니다.

기록적인 벤치마크 성능

Gemini 3 Pro는 MMLU 벤치마크에서 91.8%의 정확도를 달성하며, Gemini 2.5 Pro의 89.5%보다 5점이 향상되었습니다. 모델은 특히 교차 학제적인 질문에서 강점을 보여주며, 여러 지식 도메인을跨越하는 작업에서 92%의 점수를 기록했으며 Gemini 2.5는 유사한 도전에서 65%로 떨어졌습니다.

코딩 관련 벤치마크에서 Gemini 3 Pro는 SWE-bench Verified에서 76.2%의 점수를 기록했으며, 이전 모델을 크게 능가했지만 Claude 4.5의 77.2%에는 미치지 못했습니다. 모델은 WebDev Arena 리더보드에서 1487 Elo를 기록하며, 예외적인 웹 개발 능력을 보여주었습니다. Terminal-Bench 2.0에서, 모델은 54.2%의 점수를 기록했습니다.

모델은 Gemini 2.5 Pro보다 작업 크기에 따라 약 2배 빠른 추론을 제공합니다. 50줄의 Python 스크립트와 같은 작은 작업은 12초 대신 25초로 완료되며, 10,000개의 데이터 행을 포함하는 큰 작업은 이전의 32분 15초 대신 15분 30초로 완료됩니다.

Google은 또한 Gemini 3 Deep Think 모드를 도입했으며, 이는 어려운 벤치마크에서 더 높은 성능을 제공하는 향상된 추론 능력입니다. 이 모드는 GPQA Diamond에서 93.8%의 점수를 기록하며(표준은 91.9%), Humanity’s Last Exam에서 41.0%의 점수를 기록하며(37.5%), 향후 몇 주 내에 AI Ultra 구독자에게 제공될 예정입니다.

Antigravity 플랫폼, 개발자 워크플로우 변革

Google은 Gemini 3을 기반으로 하는 에이전트 개발 플랫폼인 Antigravity를 출시했습니다. 이 플랫폼은 코드 편집기, 터미널 및 브라우저에서 동시에 작동하는 자율 에이전트를 가능하게 합니다. 이 플랫폼은 전통적인 도구 기반 지원에서 협력 모델로의 전환으로, 에이전트가 상당한 개발 책임을 맡습니다.

Antigravity는 Gemini 3 Pro를 주요 추론 엔진으로 사용하며, Gemini 2.5 Computer Use를 브라우저 제어용으로, Nano Banana(Gemini 2.5 Image)를 이미지 편집용으로 사용합니다. 에이전트는 독립적으로 복잡한 개발 작업을 계획 및 실행할 수 있으며, 결과를 제시하기 전에 자신의 코드를 검증할 수 있습니다.

이 플랫폼은 “vibe coding“을 강화하며, 자연어를 주요 구문으로 사용합니다. 개발자는 단일 프롬프트로 완전히 상호작용하는 응용 프로그램으로 높은 수준의 창의적인 아이디어를 번역할 수 있으며, 구현 세부 정보를 지정할 필요가 없습니다. Gemini 3의 예외적인 웹 개발 점수가 이 기능을 지원합니다.

Antigravity의 에이전트는 기능 구축, UI 반복, 버그 수정, 솔루션 연구 및 보고서 생성을 자율적으로 관리합니다. 이 플랫폼은 Mac, Windows 및 Linux에서 무료로 공개 미리 보기로 제공되며, Cursor, GitHub, JetBrains, Manus 및 Cline을 위한 통합 지원을 제공합니다.

기업 통합 및 시장 영향

Gemini 3 Pro는 Google AI Ultra 구독자와 유료 Gemini API 사용자에게 제공됩니다. 모델은 Google Search에 직접 포함되어 있으며, 이는 Google의 20억 명의 월간 AI 요약 사용자에게 도달합니다. 기업 배포는 Google AI Studio 및 Vertex AI를 통해 모델에 액세스할 수 있습니다.

Gemini 앱은 Gemini 3을 위한 새로운 인터페이스와 향상된 에이전트 기능을 특징으로 하는 업데이트를 받았습니다. 이러한 개선 사항은 Google을 경쟁하는 AI 어시스턴트와 대립시키며, 동시에 회사의 우세한 배포 채널을 활용합니다.

Google의 릴리스 전략은 개발자 채택과 기업 배포에 중점을 두고 있으며, 가격과 성능은 기업 고객을 대상으로 합니다. 기록적인 벤치마크, 자율 코딩 기능 및 광범위한 생태계 통합의 조합은 회사의 주요 제공업체 전반에 걸쳐 수렴하는 AI 모델 기능을 유지하기 위한 경쟁적 위치를 나타냅니다.

이 릴리스는 Gemini 2.0 이후 약 11개월 만에 발생하며, 이는 AI 산업에서 경쟁이 심화됨에 따라 Google의 릴리스 타임라인을 크게 압축합니다.

Alex McFarland은 인공 지능의 최신 개발을 탐구하는 AI 저널리스트이자 작가입니다. 그는 전 세계의 수많은 AI 스타트업과 출판물들과 협력했습니다.