Quan hệ đối tác
OpenAI mua lại Cerebra với giá 10 tỷ đô la để phát triển công nghệ điện toán độ trễ thấp.

OpenAI đã công bố một thỏa thuận nhiều năm với công ty khởi nghiệp chip Cerebras Systems, theo đó sẽ cung cấp 750 megawatt điện toán AI chuyên dụng cho nhà sản xuất ChatGPT, mà cả hai công ty đều mô tả là... triển khai suy luận tốc độ cao lớn nhất từng thử.
Theo các nguồn tin thân cận với thỏa thuận, thương vụ này trị giá hơn 10 tỷ đô la, đánh dấu khoản đầu tư lớn nhất của OpenAI vào cơ sở hạ tầng ngoài mối quan hệ chính với Microsoft. Cerebras sẽ xây dựng và vận hành các hệ thống theo từng giai đoạn đến năm 2028, với giai đoạn đầu tiên đi vào hoạt động trong năm nay.
Sự hợp tác này nhắm đến một vấn đề cụ thể: tốc độ. Trong khi OpenAI đã mở rộng quy mô ChatGPT để... 800 triệu người dùng hàng tuầnCông ty phải đối mặt với những hạn chế về khả năng tính toán, dẫn đến thời gian phản hồi chậm – đặc biệt là đối với các tác vụ đòi hỏi cao như tạo mã, các tác vụ tự động và tương tác giọng nói thời gian thực.
“Cerebras bổ sung một giải pháp suy luận độ trễ thấp chuyên dụng cho nền tảng của chúng tôi,” Sachin Katti, người đứng đầu chiến lược điện toán của OpenAI, cho biết. “Điều đó có nghĩa là phản hồi nhanh hơn, tương tác tự nhiên hơn và nền tảng vững chắc hơn để mở rộng AI thời gian thực cho nhiều người hơn.”
Tại sao silicon kích thước wafer lại quan trọng?
Điểm mạnh của Cerebras nằm ở bộ xử lý kích thước wafer – những con chip có kích thước bằng đĩa ăn, giúp loại bỏ độ trễ giao tiếp vốn có trong các hệ thống được ghép nối từ nhiều GPU nhỏ hơn. Công ty tuyên bố kiến trúc của họ mang lại tốc độ suy luận nhanh hơn tới 15 lần so với các giải pháp thay thế dựa trên GPU, với các mẫu như GPT-OSS-120B hoạt động ở tốc độ khoảng 3,000 token mỗi giây.
Đối với OpenAI, tốc độ đó trực tiếp ảnh hưởng đến trải nghiệm người dùng. Khi AI phản hồi trong thời gian thực—không có độ trễ khiến các cuộc hội thoại trở nên giả tạo—người dùng sẽ tương tác sâu hơn và hoàn thành được nhiều việc hơn. Công ty đã thử nghiệm chip của Cerebras với các mô hình trọng lượng mở của mình trước Lễ Tạ ơn, và các cuộc thảo luận kỹ thuật giữa các nhóm nhanh chóng leo thang thành một bản thỏa thuận sơ bộ được ký kết, theo Giám đốc điều hành của Cerebras, Andrew Feldman.
“Giống như băng thông rộng đã làm thay đổi internet, suy luận thời gian thực sẽ làm thay đổi trí tuệ nhân tạo,” Feldman nói. “Điều này mở ra những cách thức hoàn toàn mới để xây dựng và tương tác với các mô hình AI.”
Sự so sánh này không hề phóng đại. Internet quay số đời đầu chỉ hỗ trợ email và duyệt web cơ bản; băng thông rộng cho phép phát video trực tuyến, gọi thoại và cuối cùng là nền kinh tế ứng dụng trên điện thoại thông minh. OpenAI dường như đang đặt cược rằng khả năng suy luận đủ nhanh sẽ mở khóa những ứng dụng mà độ trễ hiện tại khiến việc ứng dụng trở nên không khả thi—đặc biệt là đối với các tác nhân AI cần kết hợp nhiều thao tác với nhau mà không làm giảm sự kiên nhẫn của con người.
Cuộc chạy đua vũ trang về cơ sở hạ tầng ngày càng gay gắt
Thỏa thuận với Cerebras diễn ra trong bối cảnh Định giá cơ sở hạ tầng AI Lĩnh vực trí tuệ nhân tạo đã bùng nổ, với việc Databricks gần đây huy động được 134 tỷ đô la và Cerebras được cho là đang đàm phán để nhận thêm vốn với mức định giá 22 tỷ đô la. Nhu cầu tính toán của các mô hình trí tuệ nhân tạo tiên tiến không có dấu hiệu chững lại, và các công ty đang tranh giành để giành lấy năng lực trước khi các đối thủ cạnh tranh làm được điều đó.
Đối với Cerebras, việc hợp tác với OpenAI giải quyết được vấn đề tập trung khách hàng. Nhóm G42 của Các Tiểu vương quốc Ả Rập Thống nhất chiếm 87% doanh thu của Cerebras trong nửa đầu năm 2024 – một sự tập trung khách hàng khiến các nhà đầu tư lo ngại. Việc bổ sung OpenAI làm khách hàng lớn trước thềm IPO tiềm năng sẽ giảm thiểu đáng kể rủi ro cho doanh nghiệp.
Đối với OpenAI, thương vụ này giúp đa dạng hóa hoạt động kinh doanh của họ. Cơ sở hạ tầng AI Ngoài nền tảng điện toán đám mây Azure của Microsoft. Mặc dù Microsoft vẫn là nhà cung cấp điện toán chính cho OpenAI, nhưng sự hợp tác với Cerebras mang đến cho OpenAI dung lượng chuyên dụng có độ trễ thấp được tối ưu hóa đặc biệt cho suy luận—một khối lượng công việc khác với các lần chạy huấn luyện mà cơ sở hạ tầng của Microsoft xử lý.
Thời điểm cũng rất quan trọng. OpenAI vừa mới phát hành GPT-5.2 Trong bối cảnh cạnh tranh ngày càng gay gắt từ Gemini của Google, khi các mô hình ngày càng trở nên mạnh mẽ hơn, các công ty triển khai chúng nhận ra rằng trí thông minh thuần túy là chưa đủ—người dùng cũng mong đợi phản hồi gần như tức thì. Một AI xuất sắc mà mất mười giây để trả lời thì có vẻ bị lỗi; còn cùng một AI đó mà phản hồi trong chưa đầy một giây thì lại có cảm giác kỳ diệu.
Sam Altman, CEO của OpenAI, hiện đã là nhà đầu tư vào Cerebras, và OpenAI từng cân nhắc việc mua lại toàn bộ công ty này. Thỏa thuận này cho thấy mối quan hệ đang phát triển thành một điều gì đó mang tính chiến lược hơn: một mối quan hệ đối tác mà số phận của cả hai công ty gắn bó chặt chẽ với nhau trong cuộc đua làm cho AI thực sự có khả năng đàm thoại.












