인공지능

OpenAI와 Anthropic, 대결하는 모델 출시로 AI 경쟁 격화

Published February 5, 2026

Updated April 25, 2026

Alex McFarland

OpenAI와 Anthropic은 오늘 새 旗艦 모델을 몇 분 간격으로 출시했으며, OpenAI는同時적으로 기업용 에이전트 플랫폼을 출시했고, Perplexity는 멀티 모델 연구 기능을 도입했습니다. 오늘은 대부분의 주에 총합하는 것보다 더 많은 AI 제품 발표가 단 하루의 오후 동안 이루어졌습니다.

여기에는 무엇이 출시되었는지와 그것이 무엇을 의미하는지에 대해 설명합니다.

Anthropic의 Opus 4.6: 에이전트 팀과 1백만 토큰 창

Anthropic Claude Opus 4.6를 출시했으며, 이는 가장 강력한 모델로, 두 가지 주요 기능을 갖추고 있습니다: 1백만 토큰의 컨텍스트 창과 새로운 기능인 에이전트 팀입니다.

컨텍스트 창은 더 큰 기술적 성과입니다. 1백만 토큰의 Opus 4.6는 단일 프롬프트에서 약 3,000 페이지의 텍스트를 처리할 수 있습니다. 이는 이전 버전의 256,000 토큰 제한의 4배입니다. 128,000 토큰 출력 지원과 결합하면 모델은 이제 코드베이스, 규제 제출, 또는 연구 코퍼스 전체를 청크화 또는 요약 없이 처리할 수 있습니다.

에이전트 팀은 Claude Code에서 사용 가능하며, 여러 Claude 인스턴스가 공유 코드베이스에서 병렬로 작동할 수 있습니다. 단일 에이전트가 순차적으로 작업을 수행하는 대신 개발자는 프론트엔드 변경 사항을 처리하는 에이전트, 테스트를 작성하는 에이전트, 백엔드 논리를 리팩토링하는 에이전트를 포함하는 팀을 생성할 수 있습니다. 모두 동일한 프로젝트에서 동시에 협력합니다.

Opus 4.6은 또한 적응적 사고를 도입하여 모델이 주어진 프롬프트에 투자할 사고 노력을 조정할 수 있습니다. 간단한 질문에는 빠른 응답이 주어지며, 복잡한 문제는 더 깊은 확장된 사고를.trigger합니다. 개발자는 4단계의 노력 제어(낮음, 중간, 높음, 최대)를 통해 이를 조정할 수 있습니다.

벤치마크에서 Opus 4.6는 Agentic 코딩에 대한 Terminal-Bench 2.0에서最高 점수를 얻었으며, Humanity’s Last Exam, 복잡한 추론 평가에서 선두를 지키고 있습니다. Anthropic은 GDPval-AA 평가에서 GPT-5.2에 대해 144점의 Elo 우위를 주장하며, Opus 4.5에 비해 190점의 개선을 보였습니다.

API 가격은 1백만 입력 토큰당 $5, 1백만 출력 토큰당 $25로 변경되지 않았습니다. 그러나 200,000 토큰을 초과하는 프롬프트는 $10/$37.50의 프리미엄 요금이 적용됩니다.

기업에서 주목할만한 움직임으로 Anthropic은 Microsoft PowerPoint에서 Claude의 연구 미리 보기를 발표했습니다. 여기서 모델은 기존 슬라이드 레이아웃과 템플릿을 읽고 프레젠테이션을 생성하거나 편집할 수 있으며 브랜드 형식을 유지합니다.

OpenAI의 GPT-5.3-Codex: 자신을 구축한 모델

Anthropic의 발표 후 몇 분 만에 OpenAI GPT-5.3-Codex를 출시했습니다. 이는 가장 강력한 코딩 모델입니다. 이 출시에서는 GPT-5.2-Codex의 최전선 코딩 성능과 GPT-5.2의 추론 및 전문 지식 능력을 단일 시스템으로 통합했으며, 이는 25% 더 빠릅니다.

가장 주목할만한 주장은 GPT-5.3-Codex가 자신을 구축했다는 것입니다. OpenAI의 Codex 팀은 모델의 훈련 과정 중에 초기 버전의 모델을 사용하여 훈련 실행을 디버깅하고, 배포 인프라를 관리하며, 평가 결과를 진단했습니다. 이는 모델이 자신의 개발에 기여했다는 OpenAI의 첫 공식 인정으로, 이는 효율성과 안전성에 대한 질문을 제기합니다.

GPT-5.3-Codex는 SWE-Bench Pro 및 Terminal-Bench에서 새로운 산업 최고치를 설정했습니다. 이는 실제 소프트웨어 엔지니어링 작업을 평가하는 벤치마크입니다. 모델은 연구, 툴 사용, 복잡한 실행을 포함하는 장기 실행 작업을 처리할 수 있으며, 사용자는 작업 중에 모델과 상호 작용할 수 있습니다. 이는 동료와 협력하는 것과 더 像似합니다.

모델은 현재 모든 ChatGPT 유료 플랜 사용자에게 Codex 앱, CLI, IDE 확장 및 웹 인터페이스를 통해 사용할 수 있습니다. API 액세스는 곧 제공될 예정입니다.

개발자가 AI 코드 생성기 사이에서 선택할 때, 경쟁 구도는 이제 뚜렷하게 정의되었습니다. Opus 4.6는 에이전트 조정 및 긴 컨텍스트 작업에서 선두를 지키고 있으며, GPT-5.3-Codex는 속도와 통합 추론을 강조합니다. 두 모델 모두 중복되는 벤치마크에서最高 점수를 주장하며, Cursor와 Apple의 Xcode와 같은 도구는 두 모델을 모두 지원하므로 개발자는 자유롭게 전환할 수 있습니다.

OpenAI Frontier: 기업용 에이전트 플랫폼

모델 출시와 함께 OpenAI Frontier를 소개했습니다. 이는 기업용 에이전트를 구축하고, 배포하고, 관리하기 위한 플랫폼입니다. Frontier는 데이터베이스, CRM 시스템, HR 플랫폼, 티켓팅 도구 및 기타 비즈니스 애플리케이션에 연결된 다음 AI 에이전트가 이러한 애플리케이션 전체에서 프로세스를 실행하도록 허용합니다.

OpenAI는 Frontier를 “기업을 위한 시맨틱 레이어”로 설명했습니다. 여기서 인간 직원과 AI 에이전트가 동일한 플랫폼에서 공유 데이터 액세스 및 보안 제어와 함께 작동합니다. 에이전트는 직원과 같은 ID를 얻으며, 공유 조직 컨텍스트 및 기업급 권한을 받습니다.

플랫폼은 모델과 무관합니다. 기업은 OpenAI의 모델과 함께 Google, Microsoft, Anthropic의 모델을 사용하여 구축된 에이전트를 관리할 수 있습니다. 초기 고객에는 Intuit, State Farm, Thermo Fisher 및 Uber가 있습니다.

Frontier는 OpenAI를 Salesforce의 Agentforce 및 ServiceNow의 AI 에이전트와 같은 기업 플랫폼과 직접 경쟁할 수 있게 합니다. 차이점은 OpenAI가 모델 레이어부터 구축하고 있는 반면, 기존 기업은 기존 워크플로우 툴에 AI를 추가하고 있다는 것입니다. 기업이 에이전트 인프라를 AI 제공업체 또는 소프트웨어 벤더에서 제공받을지 여부는 2026年の 기업 AI 경쟁을 정의할 것입니다.

Perplexity의 모델 협의회: 3개의 모델, 1개의 답변

Perplexity 모델 협의회를 출시했습니다. 이는 동일한 쿼리를 3개의 모델(Claude Opus, GPT, Gemini)에서 동시에 실행한 다음, 하나의 답변으로 통합하는 합성 모델을 사용합니다. 이 답변은 동의와 불일치 영역을 표시합니다.

Image: Perplexity

전제는 단일 모델이 모든 쿼리에서 일관되게 최고라는 것입니다. 3개의 최전선 모델이 동일한 답변으로 수렴하면 신뢰도가 높습니다. 모델이 분기될 때 사용자는 더 자세히 조사해야 합니다. 모델 협의회는 Max 구독자에게 제공되며, 투자 연구, 전략 분석 및 복잡한 의사 결정에 적합합니다.

이 기능은 Perplexity의 다중 모델 오케스트레이션을 통해 차별화를 추구하는 전략을 반영합니다. 최전선 AI 채팅봇 사이의 격차가 개별 벤치마크에서 좁혀짐에 따라, 그들의 출력을 집계하는 것이 단일 제공업체를 선택하는 것보다 더 가치 있을 수 있습니다.

모든 것이 의미하는 바

이러한 출시들은 AI 경쟁이 모델 능력에서 제품 인프라로 이동했음을 확인합니다. OpenAI와 Anthropic은 모두 동일한 벤치마크에서最高 점수를 얻는 모델을 가지고 있습니다. 차별화는 이제 그 위에 구축할 수 있는 것에 있습니다.

한편 Perplexity는 모델 전쟁이 모델을 결합하는 방법보다 중요하지 않을 수 있다는 默示的 인수를 제기하고 있습니다. 모델 협의회가 유용한 것으로 chứng명되면, 이는 미래가 Claude와 GPT 사이에서 선택하는 것이 아니라, 둘 다 사용하는 것임을 시사합니다.

개발자와 기업이 AI 스택을 평가할 때, 이는 결정이 더 어려워졌습니다.

Related Topics:anthropic OpenAI perplexity