Connect with us

Người tạo AlphaGo huy động kỷ lục 1 tỷ đô la để xây dựng AI không có LLMs

Gọi vốn

Người tạo AlphaGo huy động kỷ lục 1 tỷ đô la để xây dựng AI không có LLMs

mm

David Silver, người tiên phong trong học tăng cường quien đã dẫn đầu việc tạo ra học tăng cường tại Google DeepMind, đang huy động 1 tỷ đô la trong vòng hạt giống cho Ineffable Intelligence, một công ty khởi nghiệp có trụ sở tại London được xây dựng trên cơ sở rằng các mô hình ngôn ngữ lớn là con đường sai lầm để đạt được siêu trí tuệ.

Vòng này, được dẫn đầu bởi Sequoia Capital, sẽ là vòng hạt giống lớn nhất từng được một công ty khởi nghiệp châu Âu đóng nếu được hoàn tất. Nvidia, Google và Microsoft đang trong quá trình đàm phán để tham gia, mặc dù các cuộc đàm phán vẫn đang diễn ra và các điều khoản cuối cùng có thể thay đổi. Vòng này định giá công ty ở mức 4 tỷ đô la trước khi tiền.

Silver, người từng là Phó chủ tịch Học tăng cường tại DeepMind, đã thành lập Ineffable Intelligence một cách yên tĩnh vào tháng 11 năm 2025 và được bổ nhiệm làm giám đốc vào tháng 1 năm 2026. Sứ mệnh của công ty, như Silver đã mô tả, là xây dựng “một siêu trí tuệ học không ngừng tự khám phá nền tảng của tất cả kiến thức”.

Mô tả đó chứa một sự khiêu khích có chủ ý. Trong một ngành công nghiệp đang chi hàng trăm tỷ đô la để mở rộng LLMs được đào tạo trên văn bản internet, Silver đang lập luận rằng toàn bộ cách tiếp cận này có một giới hạn.

Trường hợp chống lại dữ liệu con người

Luận điểm của Silver được rút ra trực tiếp từ công việc đã làm cho anh ấy nổi tiếng. Vào năm 2017, CEO DeepMind Demis Hassabis và Silver đã xuất bản AlphaGo Zero, một phiên bản của AlphaGo đã học hoàn toàn thông qua tự chơi với không có dữ liệu trò chơi của con người. Nó đã đánh bại AlphaGo ban đầu, được đào tạo bởi con người, 100 trận không thua.

Kết quả đó đã làm cho cộng đồng AI sửng sốt. Một hệ thống học từ đầu, thông qua tương tác và phần thưởng alone, không chỉ khớp với kiến thức của con người – nó vượt qua nó một cách toàn diện đến mức phiên bản được đào tạo bởi con người không thể thắng một trận đấu nào.

Silver đã mở rộng cách tiếp cận này thông qua AlphaZero, đã thành thạo cờ vua, shogi và Go từ đầu, và MuZero, đã học cách lập kế hoạch mà không cần biết quy tắc của trò chơi nó đang chơi. Mỗi hệ thống đã củng cố lại kết luận相同: hiệu suất tốt nhất đến không từ việc bắt chước con người mà từ việc học thông qua kinh nghiệm.

Trong một podcast DeepMind được ghi lại trước khi rời đi, Silver đã mô tả hai kỷ nguyên của AI: kỷ nguyên “dữ liệu con người” hiện tại và kỷ nguyên “kinh nghiệm” sắp tới. Các LLMs hiện đại, anh ấy lập luận, phụ thuộc vào dữ liệu và phản hồi của con người, tạo ra các hạn chế vốn có. Con đường đến siêu trí tuệ nhân tạo đòi hỏi phải vượt qua kiến thức của con người hoàn toàn.

Đây là triết lý “Trường Alberta” – được đặt tên theo Đại học Alberta, nơi Silver đã học dưới sự hướng dẫn của người tiên phong học tăng cường Rich Sutton. Bài luận năm 2019 có ảnh hưởng của Sutton “Bài học đắng” đã lập luận rằng các phương pháp dựa vào kiến thức của con người cuối cùng sẽ thua các phương pháp mở rộng tính toán và học tập. Silver đang xây dựng một công ty hoàn toàn dựa trên nguyên tắc đó.

Cuộc đua khởi nghiệp siêu trí tuệ

Silver không phải là nhà nghiên cứu hàng đầu đầu tiên rời một phòng thí nghiệm lớn và huy động số tiền vượt thường để tập trung vào một công ty siêu trí tuệ. Ilya Sutskever, cựu nhà khoa học trưởng của OpenAI, đã ra mắt Safe Superintelligence vào năm 2024 với một luận điểm tương tự – rằng một nỗ lực tập trung bên ngoài áp lực của một công ty sản phẩm có thể đạt được siêu trí tuệ nhanh hơn. SSI đã huy động được hàng tỷ đô la với mức định giá vượt quá 30 tỷ đô la.

Sự tương tự là có ý nghĩa. Cả hai nhà nghiên cứu đều rời bỏ các tổ chức mà họ đã giúp định hình. Cả hai đều tin rằng mô hình hiện tại – mở rộng LLMs và bán đăng ký trò chuyện – là một sự đi lạc. Và cả hai đều thu hút được số vốn khổng lồ dựa trên danh tiếng của họ alone, trước khi tạo ra bất kỳ sản phẩm hoặc xuất bản bất kỳ kết quả nào.

Nhưng cách tiếp cận lại khác nhau. Sutskever đã nói rất ít công khai về hướng kỹ thuật của SSI. Silver, ngược lại, đã rõ ràng: học tăng cường, tự chơi, và học từ các nguyên tắc cơ bản – không phải mô hình ngôn ngữ. Trong khi hầu hết các phòng thí nghiệm AI đang tranh luận về cách làm cho LLMs lý luận tốt hơn, Silver đang đặt câu hỏi liệu chúng nên là nền tảng hay không.

Vòng hạt giống 1 tỷ đô la cũng phản ánh sự thay đổi lớn trong phong cảnh tài trợ AI. Anthropic gần đây đã đạt gần mức định giá 350 tỷ đô la. Áp lực cạnh tranh trong AI tiền phong đã tăng mạnh khi OpenAI, Google và Anthropic tung ra các mô hình mới với tốc độ ngày càng nhanh. Trên bối cảnh đó, mức định giá 4 tỷ đô la trước khi tiền cho một công ty chưa có sản phẩm do một nhà nghiên cứu duy nhất dẫn đầu là bình thường mới.

Đối với Sequoia, người đang dẫn đầu vòng này thông qua đối tác quản lý Alfred Lin và đối tác Sonya Huang, đặt cược là rõ ràng: Silver là một trong số ít người có thể tuyên bố đã xây dựng các hệ thống thực sự vượt qua trí tuệ con người trong các lĩnh vực cụ thể. Nếu học tăng cường là con đường đúng đến siêu trí tuệ tổng quát, anh ấy là người có khả năng tìm thấy nó nhất.

Rủi ro cũng rõ ràng. AlphaGo và AlphaZero đã thành công trong các lĩnh vực có quy tắc rõ ràng, thông tin hoàn hảo và tín hiệu phần thưởng được định nghĩa rõ. Thế giới thực không có những thuộc tính đó. Việc mở rộng tự chơi vượt ra ngoài trò chơi vào các lĩnh vực mở – khoa học, kỹ thuật, lý luận – là một vấn đề chưa được giải quyết mà Silver đã dành nhiều năm làm việc tại DeepMind mà không có một đột phá quyết định.

Căn cứ của Ineffable Intelligence tại London cũng đặt nó như một neo cho tham vọng AI của châu Âu. Châu lục này đã sản sinh ra các nhà nghiên cứu AI hàng đầu nhưng đã gặp khó khăn trong việc giữ chân họ khi các phòng thí nghiệm Mỹ cung cấp mức lương cao hơn và cơ sở hạ tầng mở rộng nhanh hơn. Một vòng hạt giống 1 tỷ đô la của châu Âu, được hỗ trợ bởi công ty đầu tư mạo hiểm hàng đầu của Thung lũng Silicon, cho thấy rằng địa lý của nghiên cứu AI tiền phong có thể đang mở rộng – mặc dù đáng chú ý rằng Sequoia, Nvidia, Google và Microsoft đều là nhà đầu tư Mỹ.

Đặt cược của Silver là rằng sự tập trung của ngành vào LLMs đại diện cho một cực đại địa phương – ấn tượng nhưng cuối cùng bị giới hạn. Câu hỏi là liệu học tăng cường có thể thoát khỏi các môi trường được kiểm soát nơi nó đã thịnh hành và hoạt động trong thế giới thực phức tạp và mơ hồ. Một tỷ đô la và một sự nghiệp được xây dựng trên việc chứng minh những kẻ hoài nghi sai lầm cho thấy Silver nghĩ nó có thể.

Alex McFarland là một nhà báo và nhà văn về trí tuệ nhân tạo, khám phá những phát triển mới nhất trong lĩnh vực trí tuệ nhân tạo. Ông đã hợp tác với nhiều công ty khởi nghiệp và xuất bản về trí tuệ nhân tạo trên toàn thế giới.