파트너십
OpenAI, Cerebras와 1,000억 달러 규모의 저지연 컴퓨팅 계약 체결

OpenAI는 chip 스타트업인 Cerebras Systems와 다년간의 계약을 체결하여 ChatGPT 개발사에게 750메가와트의 전용 AI 컴퓨팅을 제공할 것이라고 발표했습니다. 이는 두 회사 모두가 가장 큰 고속 추론 배포 시도라고 설명합니다.
이 계약은 정보원에 따르면 1,000억 달러 이상의 가치가 있으며, OpenAI의 마이크로소프트 외에 가장 중요한 인프라 투자입니다. Cerebras는 2028년까지 단계적으로 시스템을 구축 및 호스팅할 예정이며, 첫 번째 용량은 올해 온라인으로 제공될 예정입니다.
이 파트너십은 특정 문제를 해결하는 것을 목표로 합니다. 속도입니다. OpenAI는 ChatGPT를 800만 명의 주간 사용자로 확대했지만, 코드 생성, 에이전트 작업, 실시간 음성 상호작용과 같은 요구가 높은 작업에 대해 응답 시간을 늦추는 컴퓨팅 제약에 직면해 있습니다.
“Cerebras는 저지연 추론 솔루션을 우리의 플랫폼에 추가합니다”라고 OpenAI의 컴퓨팅 전략을 이끄는 Sachin Katti는 말했습니다. “즉, 더 빠른 응답, 더 자연스러운 상호작용, 더 많은 사람에게 실시간 AI를 확장하기 위한 더 강한 기초를 의미합니다.”
웨이퍼 규모 실리콘의 중요성
Cerebras의 제안은 웨이퍼 규모 프로세서에 중점을 두고 있습니다. 즉, 작은 GPU로 구성된 시스템의 내재된 통신 지연을 제거하는 디너 플레이트 크기의 칩입니다. 이 회사는 자신의 아키텍처가 GPU 기반 대안보다 최대 15배 빠른 추론 속도를 제공한다고 주장하며, GPT-OSS-120B와 같은 모델이 약 3,000개 토큰당 초당으로 실행된다고 합니다.
OpenAI의 경우, 이는 직접 사용자 경험으로 번역됩니다. AI가 실시간으로 응답할 때 – 인공적인 느낌을 주는 지연 없이 – 사용자는 더 깊이 참여하고 더 많은 것을 성취합니다. 이 회사는 추수감사절 전에 Cerebras의 실리콘을 자신의 오픈 웨이트 모델과 함께 테스트했으며, 기술적인 대화는 빠르게 서명된 조건부 계약서로 이어졌습니다. Cerebras의 CEO인 Andrew Feldman에 따르면,
“ブロードバンド가 인터넷을 변革한 것처럼 실시간 추론이 AI를 변革할 것입니다”라고 펠드만은 말했습니다. “이는 완전히 새로운 방식으로 AI 모델을 구축하고 상호작용할 수 있습니다.”
이 비교는 과장된 것이 아닙니다. 초기 다이얼업 인터넷은 이메일 및 기본 브라우징을 지원했지만, 브로드밴드는 스트리밍 비디오, 음성 통화, 최종적으로 스마트폰 앱 경제를 가능하게 했습니다. OpenAI는 충분히 빠른 추론이 현재 지연으로 인해 불가능한 응용 프로그램을 유사하게 잠금 해제할 것이라고 베팅하는 것으로 보입니다. 특히 인공 지능 에이전트가 인간의 인내심이 다할 때까지 여러 작업을 체인으로 연결해야 하는 경우에 특히 그렇습니다.
인프라 경쟁이 격화됨
Cerebras 계약은 AI 인프라 평가가 폭발하면서 체결되었습니다. Databricks는 최근 1,340억 달러의 평가를 받았으며, Cerebras 자체는 220억 달러의 평가에서 신선한 자금을 논의하는 것으로 보고되었습니다. 전위 AI 모델의 컴퓨팅需求은 평탄화되는迹象이 없으며, 회사들은 경쟁자가 하기 전에 용량을 확보하기 위해 서두르고 있습니다.
Cerebras의 경우, OpenAI 파트너십은 사업 집중 문제를 해결합니다. 아랍에미리트의 G42는 2024년 상반기 동안 Cerebras의 수익의 87%를 차지했으며, 이는 투자자들에게는 걱정스러운 고객 집중도였습니다. 잠재적인 IPO 이전에 주요 고객으로 OpenAI를 추가하면 사업을 상당히 위험에서 해방시킵니다.
OpenAI의 경우, 이 계약은 마이크로소프트의 Azure 클라우드 외에 AI 인프라를 다각화합니다. 마이크로소프트는 여전히 OpenAI의 주요 컴퓨팅 제공업체이지만, Cerebras 파트너십은 OpenAI에 추론을 위한専用 저지연 용량을 제공합니다. 이는 마이크로소프트의 인프라가 처리하는 훈련 실행과는 다른 워크로드입니다.
타이밍도 중요합니다. OpenAI는 최근 GPT-5.2를 출시했습니다. 이는 Google의 Gemini와의 경쟁이 격화되는 가운데 이루어졌습니다. 모델이 더 강력해짐에 따라, 이러한 모델을 배포하는 회사는 원시 지능만이 아니라 거의 즉각적인 응답도 사용자에게 기대한다는 것을 발견했습니다. 10초가 걸리는 천재 AI는 고장난 것처럼 느껴지지만, 1초 이내에 응답하는 동일한 AI는 마법처럼 느껴집니다.
OpenAI의 CEO인 Sam Altman은 이미 Cerebras의 투자자이며, OpenAI는 한때 이 회사를 전적으로 인수하는 것을 고려했습니다. 이 계약은 두 회사의 운명이 실시간으로 대화형 AI를 만들기 위한 경쟁과 함께 점점 더 긴밀하게 얽히고 있음을 시사합니다.












