Gọi vốn

Người tạo AlphaGo huy động kỷ lục 1 tỷ USD để xây dựng AI không có LLMs

mm

David Silver, người tiên phong trong lĩnh vực học tăng cường, người đã dẫn đầu việc tạo ra học tăng cường tại Google DeepMind, đang huy động 1 tỷ USD trong vòng tài trợ hạt giống cho Ineffable Intelligence, một công ty khởi nghiệp tại London được xây dựng trên cơ sở rằng các mô hình ngôn ngữ lớn là con đường sai lầm để đạt được siêu trí tuệ.

Vòng tài trợ này, do Sequoia Capital dẫn đầu, sẽ là vòng tài trợ hạt giống lớn nhất từng được một công ty khởi nghiệp châu Âu đóng nếu được hoàn thành. Nvidia, Google và Microsoft đang trong quá trình đàm phán để tham gia, mặc dù các cuộc đàm phán vẫn đang tiếp tục và các điều khoản cuối cùng có thể thay đổi. Vòng tài trợ này định giá công ty ở mức 4 tỷ USD trước khi tài trợ.

Silver, người từng là Phó Chủ tịch phụ trách Học tăng cường tại DeepMind, đã thành lập Ineffable Intelligence một cách âm thầm vào tháng 11 năm 2025 và được bổ nhiệm làm giám đốc vào tháng 1 năm 2026. Sứ mệnh của công ty, như Silver đã mô tả, là xây dựng “một siêu trí tuệ học không ngừng tự khám phá nền tảng của tất cả kiến thức.”

Mô tả này chứa một sự khiêu khích có chủ ý. Trong một ngành công nghiệp đang chi hàng trăm tỷ đô la để mở rộng các mô hình ngôn ngữ lớn được đào tạo trên văn bản internet, Silver đang lập luận rằng toàn bộ cách tiếp cận này có một giới hạn.

Trường hợp chống lại Dữ liệu Con người

Luận điểm của Silver được rút ra trực tiếp từ công việc đã làm cho anh trở nên nổi tiếng. Vào năm 2017, CEO DeepMind Demis Hassabis và Silver đã xuất bản AlphaGo Zero, một phiên bản của AlphaGo đã học hoàn toàn thông qua tự chơi với không có dữ liệu trò chơi của con người. Nó đã đánh bại AlphaGo ban đầu, được đào tạo bởi con người, 100 trận không thua.

Kết quả này đã làm choáng ngợp cộng đồng AI. Một hệ thống học từ đầu, thông qua tương tác và phần thưởng alone, không chỉ匹 human kiến thức – nó vượt qua nó một cách toàn diện đến mức phiên bản được đào tạo bởi con người không thể thắng một trận đấu duy nhất.

Silver đã mở rộng cách tiếp cận này thông qua AlphaZero, đã thành thạo cờ vua, shogi và cờ vây từ đầu, và MuZero, đã học cách lập kế hoạch mà không cần biết quy tắc của trò chơi nó đang chơi. Mỗi hệ thống đã củng cố kết luận相同: hiệu suất tốt nhất đến không từ việc bắt chước con người mà từ việc học thông qua kinh nghiệm.

Trong một podcast DeepMind được ghi lại trước khi rời đi, Silver đã mô tả hai kỷ nguyên của AI: kỷ nguyên “dữ liệu con người” hiện tại và kỷ nguyên “kinh nghiệm” sắp tới. Các mô hình ngôn ngữ lớn hiện đại, anh ấy lập luận, phụ thuộc vào dữ liệu và phản hồi của con người, tạo ra các hạn chế vốn có. Con đường đến siêu trí tuệ nhân tạo đòi hỏi phải vượt qua kiến thức của con người hoàn toàn.

Đây là triết lý “Trường Alberta” – được đặt tên theo Đại học Alberta, nơi Silver đã học dưới sự hướng dẫn của người tiên phong trong lĩnh vực học tăng cường Rich Sutton. Bài luận ảnh hưởng năm 2019 của Sutton “Bài học đắng” đã lập luận rằng các phương pháp dựa vào kiến thức của con người sẽ thua các phương pháp mở rộng tính toán và học tập. Silver đang xây dựng một công ty hoàn toàn dựa trên nguyên tắc đó.

Đua khởi nghiệp Siêu trí tuệ

Silver không phải là nhà nghiên cứu hàng đầu đầu tiên rời một phòng thí nghiệm lớn và huy động số tiền kỷ lục cho một công ty khởi nghiệp tập trung vào siêu trí tuệ. Ilya Sutskever, cựu trưởng khoa khoa học tại OpenAI, đã ra mắt Safe Superintelligence vào năm 2024 với một luận điểm tương tự – rằng một nỗ lực tập trung bên ngoài áp lực của một công ty sản phẩm có thể đạt được siêu trí tuệ nhanh hơn. SSI đã huy động được hàng tỷ đô la với mức định giá vượt quá 30 tỷ đô la.

Sự tương đồng này rất bổ ích. Cả hai nhà nghiên cứu đều rời bỏ các tổ chức mà họ đã giúp định hình. Cả hai đều tin rằng mô hình hiện tại – mở rộng các mô hình ngôn ngữ lớn và bán đăng ký trò chuyện – là một sự đi lạc. Và cả hai đều thu hút được số vốn khổng lồ dựa trên danh tiếng của họ alone, trước khi sản xuất bất kỳ sản phẩm nào hoặc xuất bản bất kỳ kết quả nào.

Tuy nhiên, cách tiếp cận của họ lại khác nhau. Sutskever đã nói rất ít về hướng đi kỹ thuật của SSI. Silver, ngược lại, đã rõ ràng: học tăng cường, tự chơi và học từ các nguyên tắc cơ bản – không phải mô hình ngôn ngữ. Trong khi hầu hết các phòng thí nghiệm AI đang tranh luận về cách làm cho các mô hình ngôn ngữ lớn lý luận tốt hơn, Silver đang đặt câu hỏi liệu chúng nên là nền tảng hay không.

Vòng tài trợ 1 tỷ đô la cũng phản ánh sự thay đổi lớn trong phong cảnh tài trợ AI. Anthropic gần đây đã đạt được mức định giá gần 350 tỷ đô la. Áp lực cạnh tranh trong AI tiên phong đã tăng mạnh khi OpenAI, Google và Anthropic tung ra các mô hình mới với tốc độ tăng tốc. Trước bối cảnh đó, mức định giá 4 tỷ đô la trước khi tài trợ cho một công ty chưa có sản phẩm do một nhà nghiên cứu đơn lẻ dẫn đầu là bình thường mới.

Đối với Sequoia, người dẫn đầu vòng tài trợ thông qua đối tác quản lý Alfred Lin và đối tác Sonya Huang, việc đặt cược là rõ ràng: Silver là một trong số ít người có thể tuyên bố đã xây dựng các hệ thống thực sự vượt qua trí tuệ của con người trong các lĩnh vực cụ thể. Nếu học tăng cường là con đường đúng đến siêu trí tuệ tổng quát, anh ấy là người có khả năng tìm ra nó nhất.

Rủi ro cũng rõ ràng như vậy. AlphaGo và AlphaZero đã thành công trong các lĩnh vực có quy tắc rõ ràng, thông tin hoàn hảo và tín hiệu phần thưởng được định nghĩa rõ. Thế giới thực không có những thuộc tính này. Việc mở rộng tự chơi vượt ra ngoài trò chơi vào các lĩnh vực mở – khoa học, kỹ thuật, lý luận – là một vấn đề chưa được giải quyết mà Silver himself đã dành nhiều năm làm việc tại DeepMind mà không có một đột phá quyết định.

Cơ sở của Ineffable Intelligence tại London cũng đặt nó như một điểm neo tiềm năng cho tham vọng AI của châu Âu. Lục địa này đã sản sinh ra các nhà nghiên cứu AI hàng đầu nhưng đã đấu tranh để giữ chân họ khi các phòng thí nghiệm của Mỹ cung cấp mức lương cao hơn và cơ sở hạ tầng mở rộng nhanh hơn. Một vòng tài trợ hạt giống 1 tỷ đô la của châu Âu, được hỗ trợ bởi công ty đầu tư hàng đầu của Thung lũng Silicon, cho thấy rằng địa lý của nghiên cứu AI tiên phong có thể đang mở rộng – mặc dù đáng chú ý là Sequoia, Nvidia, Google và Microsoft đều là nhà đầu tư của Mỹ.

Đặt cược của Silver là rằng sự tập trung của ngành vào các mô hình ngôn ngữ lớn đại diện cho một cực đại địa phương – ấn tượng nhưng cuối cùng bị giới hạn. Câu hỏi là liệu học tăng cường có thể thoát khỏi các môi trường được kiểm soát mà nó đã phát triển mạnh và hoạt động trong thế giới thực phức tạp, mơ hồ. Một tỷ đô la và sự nghiệp được xây dựng trên việc chứng minh những kẻ hoài nghi sai lầm cho thấy Silver nghĩ nó có thể.

Alex McFarland là một nhà báo và nhà văn về trí tuệ nhân tạo, khám phá những phát triển mới nhất trong lĩnh vực trí tuệ nhân tạo. Ông đã hợp tác với nhiều công ty khởi nghiệp và xuất bản về trí tuệ nhân tạo trên toàn thế giới.