Lãnh đạo tư tưởng
Vấn đề trị giá nghìn tỷ đô la của Trí tuệ nhân tạo
Khi chúng ta bước vào năm 2025, lĩnh vực trí tuệ nhân tạo đang đứng tại một điểm chuyển đổi quan trọng. Trong khi ngành công nghiệp này vẫn tiếp tục thu hút mức đầu tư và chú ý chưa từng có – đặc biệt là trong lĩnh vực trí tuệ nhân tạo sinh (generative AI) – một số động lực thị trường cơ bản cho thấy chúng ta đang hướng tới một sự thay đổi lớn trong cảnh quan trí tuệ nhân tạo trong năm tới.
Dựa trên kinh nghiệm của tôi trong việc lãnh đạo một công ty khởi nghiệp trí tuệ nhân tạo và quan sát sự tiến hóa nhanh chóng của ngành công nghiệp, tôi tin rằng năm nay sẽ mang lại nhiều thay đổi cơ bản: từ các mô hình khái niệm lớn (LCMs) dự kiến sẽ xuất hiện như những đối thủ nghiêm túc với các mô hình ngôn ngữ lớn (LLMs), sự trỗi dậy của phần cứng trí tuệ nhân tạo chuyên dụng, đến các công ty công nghệ lớn bắt đầu xây dựng cơ sở hạ tầng trí tuệ nhân tạo lớn mà cuối cùng sẽ giúp họ có thể cạnh tranh với các công ty khởi nghiệp như OpenAI và Anthropic – và, ai biết, có thể thậm chí đảm bảo độc quyền trí tuệ nhân tạo sau tất cả.
Thử thách duy nhất của các công ty trí tuệ nhân tạo: Không phải là phần mềm hay phần cứng
Vấn đề cơ bản nằm ở cách các công ty trí tuệ nhân tạo hoạt động trong một vùng đất trung gian chưa từng thấy giữa các doanh nghiệp phần mềm truyền thống và phần cứng. Không giống như các công ty phần mềm thuần túy chủ yếu đầu tư vào vốn nhân lực với chi phí vận hành tương đối thấp, hoặc các công ty phần cứng thực hiện đầu tư vốn dài hạn với con đường rõ ràng để thu hồi vốn, các công ty trí tuệ nhân tạo phải đối mặt với sự kết hợp độc đáo của các thách thức làm cho các mô hình tài trợ hiện tại của họ trở nên mong manh.
Những công ty này yêu cầu chi tiêu vốn lớn ban đầu cho các cụm GPU và cơ sở hạ tầng, chi tiêu 100-200 triệu đô la mỗi năm chỉ cho tài nguyên tính toán. Tuy nhiên, không giống như các công ty phần cứng, họ không thể phân bổ những khoản đầu tư này trong thời gian dài. Thay vào đó, họ hoạt động trong chu kỳ hai năm nén giữa các vòng tài trợ, mỗi lần cần phải chứng minh sự tăng trưởng theo cấp số nhân và hiệu suất tiên tiến để chứng minh cho việc đánh giá lại giá trị tiếp theo của họ.
Vấn đề phân biệt LLM
Thêm vào thách thức cấu trúc này là một xu hướng đáng lo ngại: sự hội tụ nhanh chóng của khả năng mô hình ngôn ngữ lớn (LLM). Các công ty khởi nghiệp, như unicorn Mistral AI và các công ty khác, đã chứng minh rằng các mô hình mã nguồn mở có thể đạt được hiệu suất tương đương với các mô hình đối ứng mã nguồn đóng, nhưng sự khác biệt kỹ thuật mà trước đây đã chứng minh cho việc định giá cao vút đang trở nên ngày càng khó duy trì.
Nói cách khác, trong khi mỗi mô hình LLM mới tự hào về hiệu suất dựa trên các tiêu chuẩn đánh giá chuẩn, một sự thay đổi thực sự đáng kể trong kiến trúc mô hình cơ bản không xảy ra.
Giới hạn hiện tại trong lĩnh vực này bắt nguồn từ ba khu vực quan trọng: sự sẵn có của dữ liệu, vì chúng tôi đang cạn kiệt tài liệu đào tạo chất lượng cao (như được xác nhận bởi Elon Musk gần đây); phương pháp thu thập, vì chúng đều áp dụng các phương pháp phản hồi của con người tương tự được OpenAI tiên phong; và kiến trúc tính toán, vì chúng phụ thuộc vào cùng một nhóm phần cứng GPU chuyên dụng hạn chế.
Điều đang nổi lên là một mẫu trong đó lợi ích ngày càng đến từ hiệu quả hơn là quy mô. Các công ty đang tập trung vào việc nén nhiều kiến thức vào ít token hơn và phát triển các sản phẩm kỹ thuật tốt hơn, như hệ thống thu hồi như graph RAGs (retrieval-augmented generation). Về cơ bản, chúng tôi đang tiếp cận một cao nguyên tự nhiên nơi ném nhiều tài nguyên hơn vào vấn đề mang lại lợi nhuận giảm dần.
Do tốc độ đổi mới chưa từng có trong hai năm qua, sự hội tụ của khả năng LLM này đang xảy ra nhanh hơn bất kỳ ai dự đoán, tạo ra một cuộc đua chống lại thời gian cho các công ty đã huy động vốn.
Dựa trên các xu hướng nghiên cứu mới nhất, tiền tuyến tiếp theo để giải quyết vấn đề này là sự xuất hiện của các mô hình khái niệm lớn (LCMs) như một kiến trúc mới, đột phá cạnh tranh với LLM trong lĩnh vực cốt lõi của chúng, đó là hiểu ngôn ngữ tự nhiên (NLP).
Về mặt kỹ thuật, LCMs sẽ sở hữu một số lợi thế, bao gồm khả năng đạt được hiệu suất tốt hơn với ít lần lặp lại và khả năng đạt được kết quả tương tự với các đội nhỏ hơn. Tôi tin rằng những LCM thế hệ tiếp theo này sẽ được phát triển và thương mại hóa bởi các đội spin-off, những ‘người nổi tiếng cũ của công nghệ lớn’ thành lập các công ty khởi nghiệp mới để dẫn đầu cuộc cách mạng này.
Sự không khớp về thời gian tiền hóa
Sự nén của các chu kỳ đổi mới đã tạo ra một vấn đề quan trọng khác: sự không khớp giữa thời gian đưa ra thị trường và tiền hóa bền vững. Trong khi chúng ta đang chứng kiến sự nhanh chóng chưa từng có trong việc dọc hóa các ứng dụng trí tuệ nhân tạo – với các đại lý giọng nói trí tuệ nhân tạo, ví dụ, đi từ khái niệm đến sản phẩm tạo doanh thu trong vài tháng – sự thương mại hóa nhanh chóng này che giấu một vấn đề sâu sắc hơn.
Hãy xem xét điều này: một công ty khởi nghiệp trí tuệ nhân tạo được định giá 20 tỷ đô la ngày nay sẽ cần phải tạo ra khoảng 1 tỷ đô la doanh thu hàng năm trong 4-5 năm để chứng minh việc IPO ở mức hợp lý. Điều này đòi hỏi không chỉ sự xuất sắc về công nghệ mà còn là sự chuyển đổi đáng kể của toàn bộ mô hình kinh doanh, từ tập trung vào nghiên cứu và phát triển sang bán hàng – tất cả trong khi duy trì tốc độ đổi mới và quản lý chi phí cơ sở hạ tầng khổng lồ.
Trong ý nghĩa đó, các công ty khởi nghiệp tập trung vào LCM mới sẽ xuất hiện trong năm 2025 sẽ ở vị trí tốt hơn để huy động vốn, với định giá ban đầu thấp hơn làm cho chúng trở thành mục tiêu tài trợ hấp dẫn hơn cho các nhà đầu tư.
Thiếu hụt phần cứng và các giải pháp thay thế mới
Hãy để chúng ta xem xét kỹ lưỡng về cơ sở hạ tầng. Ngày nay, mỗi cụm GPU mới được mua ngay cả trước khi nó được xây dựng bởi các cầu thủ lớn, buộc các cầu thủ nhỏ hơn phải cam kết với các hợp đồng dài hạn với các nhà cung cấp dịch vụ đám mây hoặc rủi ro bị loại khỏi thị trường hoàn toàn.
Nhưng điều thực sự thú vị là: trong khi mọi người đang chiến đấu vì GPU, đã có một sự thay đổi hấp dẫn trong cảnh quan phần cứng mà vẫn còn bị bỏ qua. Kiến trúc GPU hiện tại, được gọi là GPGPU (GPU mục đích chung), vô cùng không hiệu quả cho những gì hầu hết các công ty thực sự cần trong sản xuất. Nó giống như sử dụng một siêu máy tính để chạy một ứng dụng máy tính.
Đây là lý do tại sao tôi tin rằng phần cứng trí tuệ nhân tạo chuyên dụng sẽ là sự thay đổi lớn tiếp theo trong ngành công nghiệp của chúng tôi. Các công ty như Groq và Cerebras đang xây dựng phần cứng suy luận chuyên dụng có chi phí vận hành thấp hơn 4-5 lần so với GPU truyền thống. Vâng, có chi phí kỹ thuật cao hơn ban đầu để tối ưu hóa các mô hình của bạn cho các nền tảng này, nhưng đối với các công ty chạy các khối lượng công việc suy luận lớn, lợi ích hiệu quả là rõ ràng.
Mật độ dữ liệu và sự trỗi dậy của các mô hình nhỏ hơn, thông minh hơn
Di chuyển đến tiền tuyến đổi mới tiếp theo trong trí tuệ nhân tạo có thể sẽ đòi hỏi không chỉ sức mạnh tính toán lớn hơn – đặc biệt là cho các mô hình lớn như LCM – mà còn đòi hỏi các tập dữ liệu phong phú và toàn diện hơn.
Thú vị là, các mô hình nhỏ hơn, hiệu quả hơn đang bắt đầu thách thức các mô hình lớn hơn bằng cách tận dụng cách chúng được đào tạo dày đặc trên dữ liệu có sẵn. Ví dụ, các mô hình như Microsoft’s FeeFree hoặc Google’s Gema2B, hoạt động với ít tham số hơn – thường khoảng 2 đến 3 tỷ – nhưng đạt được mức hiệu suất tương đương với các mô hình lớn hơn có 8 tỷ tham số.
Những mô hình nhỏ hơn này ngày càng cạnh tranh vì mật độ dữ liệu cao của chúng, làm cho chúng mạnh mẽ mặc dù kích thước của chúng. Sự thay đổi này hướng tới các mô hình nhỏ gọn nhưng mạnh mẽ phù hợp với lợi thế chiến lược mà các công ty như Microsoft và Google nắm giữ: khả năng tiếp cận các tập dữ liệu đa dạng và lớn thông qua các nền tảng như Bing và Tìm kiếm Google.
Động lực này tiết lộ hai “cuộc chiến” quan trọng đang diễn ra trong việc phát triển trí tuệ nhân tạo: một cuộc chiến về sức mạnh tính toán và một cuộc chiến về dữ liệu. Trong khi tài nguyên tính toán là điều cần thiết để thúc đẩy các ranh giới, mật độ dữ liệu đang trở nên quan trọng không kém – nếu không muốn nói là quan trọng hơn. Các công ty có quyền truy cập vào các tập dữ liệu lớn là duy nhất để đào tạo các mô hình nhỏ với hiệu quả và độ mạnh không thể sánh được, củng cố sự thống trị của họ trong cảnh quan trí tuệ nhân tạo đang phát triển.
Ai sẽ thắng trong cuộc chiến trí tuệ nhân tạo?
Trong bối cảnh này, mọi người đều thắc mắc ai trong cảnh quan trí tuệ nhân tạo hiện tại được đặt ở vị trí tốt nhất để thắng. Dưới đây là một số suy nghĩ.
Các công ty công nghệ lớn đã mua trước toàn bộ cụm GPU ngay trước khi xây dựng, tạo ra một môi trường khan hiếm cho các cầu thủ nhỏ hơn. Đơn đặt hàng 100.000+ GPU của Oracle và các động thái tương tự của Meta và Microsoft thể hiện xu hướng này.
Sau khi đầu tư hàng trăm tỷ đô la vào các sáng kiến trí tuệ nhân tạo, những công ty này cần hàng nghìn kỹ sư và nhà nghiên cứu trí tuệ nhân tạo chuyên dụng. Điều này tạo ra nhu cầu chưa từng có về tài năng mà chỉ có thể được đáp ứng thông qua việc mua lại chiến lược – có khả năng dẫn đến nhiều công ty khởi nghiệp bị hấp thụ trong những tháng tới.
Trong khi năm 2025 sẽ được dành cho nghiên cứu và phát triển quy mô lớn và xây dựng cơ sở hạ tầng cho những diễn viên này, thì vào năm 2026, họ sẽ ở vị trí để tấn công như chưa bao giờ có, nhờ vào nguồn lực không thể sánh được.
Điều này không có nghĩa là các công ty trí tuệ nhân tạo nhỏ hơn đang bị nguyền rủa – xa khỏi điều đó. Ngành công nghiệp sẽ tiếp tục đổi mới và tạo ra giá trị. Một số đổi mới chính trong ngành, như LCM, có khả năng sẽ được dẫn dắt bởi các diễn viên nhỏ mới nổi trong năm tới, cùng với Meta, Google/Alphabet và OpenAI với Anthropic, tất cả đều đang làm việc trên các dự án thú vị vào lúc này.
Tuy nhiên, chúng ta có khả năng sẽ chứng kiến một sự thay đổi cơ bản về cách các công ty trí tuệ nhân tạo được tài trợ và định giá. Khi vốn đầu tư mạo hiểm trở nên phân biệt hơn, các công ty sẽ cần phải chứng minh con đường rõ ràng đến kinh tế đơn vị bền vững – một thách thức cụ thể đối với các doanh nghiệp mã nguồn mở cạnh tranh với các giải pháp độc quyền được tài trợ tốt.
Đối với các công ty trí tuệ nhân tạo mã nguồn mở cụ thể, con đường phía trước có thể đòi hỏi tập trung vào các ứng dụng dọc cụ thể nơi khả năng minh bạch và tùy chỉnh của họ cung cấp lợi thế rõ ràng so với các giải pháp độc quyền.












