Lãnh đạo tư tưởng
DeepSeek có thể dạy chúng ta điều gì về chi phí và hiệu quả của AI

Với logo cá voi dễ thương, bản phát hành gần đây của DeepSeek có thể chẳng khác gì một bản sao ChatGPT khác. Điều khiến nó trở nên đáng đưa tin - và khiến cổ phiếu của các đối thủ cạnh tranh lao dốc - là chi phí tạo ra nó quá thấp. Nó thực sự đã phá vỡ khái niệm của Hoa Kỳ về khoản đầu tư cần thiết để đào tạo một Mô hình ngôn ngữ lớn (LLM) hoạt động hiệu quả.
DeepSeek được cho là chỉ chi 6 triệu đô la để đào tạo mô hình AI của mình. So sánh với số tiền được báo cáo là 80–100 triệu đô la mà OpenAI đã chi cho Chat GPT-4 hoặc 1 tỷ đô la mà họ đã dành riêng cho GPT-5. DeepSeek đặt câu hỏi về mức đầu tư đó và khiến những công ty lớn như Nvidia - công ty có giá trị cổ phiếu giảm 600 tỷ đô la chỉ trong một ngày - TSMC và Microsoft lo lắng về khả năng tài chính lâu dài của AI. Nếu có thể đào tạo các mô hình AI với chi phí thấp hơn đáng kể so với trước đây, thì điều này báo hiệu điều gì cho chi tiêu cho AI nói chung?
Mặc dù sự gián đoạn của DeepSeek đã dẫn đến các cuộc thảo luận quan trọng, một số điểm chính dường như bị bỏ qua trong quá trình xáo trộn. Tuy nhiên, những gì tin tức đưa ra là sự tập trung lớn hơn vào chi phí đổi mới và tác động kinh tế có thể có của AI. Sau đây là ba hiểu biết quan trọng phát sinh từ tin tức này:
1. Mức giá 6 triệu đô la của DeepSeek là sai lệch
Các công ty cần nắm được tổng chi phí sở hữu (TCO) của cơ sở hạ tầng của họ. Mặc dù mức giá 6 triệu đô la của DeepSeek đã được đưa ra rất nhiều, nhưng đó có lẽ chỉ là chi phí cho quá trình chạy thử trước chứ không phải toàn bộ khoản đầu tư. Tổng chi phí - không chỉ để chạy mà còn để xây dựng và đào tạo DeepSeek - có thể cao hơn nhiều. Công ty phân tích ngành Bán phân tích tiết lộ rằng công ty đứng sau DeepSeek đã chi 1.6 tỷ đô la cho phần cứng để biến LLM của mình thành hiện thực. Vì vậy, chi phí có thể nằm ở đâu đó ở giữa.
Bất kể chi phí thực sự là bao nhiêu, sự ra đời của DeepSeek đã tạo ra sự tập trung vào đổi mới tiết kiệm chi phí có thể mang tính chuyển đổi. Đổi mới thường được thúc đẩy bởi những hạn chế và thành công của DeepSeek nhấn mạnh cách đổi mới có thể diễn ra khi các nhóm kỹ sư tối ưu hóa nguồn lực của họ trước những hạn chế trong thế giới thực.
2. Suy luận là thứ làm cho AI có giá trị, không phải đào tạo
Điều quan trọng là phải chú ý đến chi phí đào tạo mô hình AI, nhưng đào tạo chỉ chiếm một phần nhỏ trong tổng chi phí để xây dựng và chạy một mô hình AI. Sự suy luận — nhiều cách mà AI thay đổi cách con người làm việc, tương tác và sống — là nơi AI thực sự trở nên có giá trị.
Điều này đưa ra nghịch lý Jevons, một lý thuyết kinh tế cho rằng khi những tiến bộ công nghệ làm cho việc sử dụng một nguồn lực hiệu quả hơn, thì tổng mức tiêu thụ của nguồn lực đó thực sự có thể tăng lên. Nói cách khác, khi chi phí đào tạo giảm xuống, suy luận và mức tiêu thụ của tác nhân sẽ tăng lên, và tổng chi tiêu sẽ theo sau.
Trên thực tế, hiệu quả AI có thể dẫn đến làn sóng chi tiêu AI tăng cao, điều này sẽ nâng cao tất cả các con thuyền, không chỉ riêng Trung Quốc. Giả sử họ đi theo làn sóng hiệu quả, các công ty như OpenAI và Nvidia cũng sẽ được hưởng lợi.
3. Điều vẫn đúng là Kinh tế đơn vị quan trọng nhất
Việc làm cho AI hiệu quả hơn không chỉ là về việc giảm chi phí; mà còn là về việc tối ưu hóa kinh tế đơn vị. Motley Fool dự báo rằng năm nay sẽ năm của hiệu quả AI. Nếu họ đúng, các công ty nên chú ý đến việc giảm chi phí đào tạo AI cũng như chi phí sử dụng AI.
Các tổ chức xây dựng hoặc sử dụng AI cần biết kinh tế đơn vị của họ thay vì chỉ nêu ra những con số ấn tượng như chi phí đào tạo 6 triệu đô la của DeepSeek. Hiệu quả thực sự đòi hỏi phải phân bổ tất cả các chi phí, theo dõi nhu cầu do AI thúc đẩy và liên tục theo dõi chi phí trên giá trị.
Kinh tế đơn vị đám mây (CUE) liên quan đến việc đo lường và tối đa hóa lợi nhuận do đám mây thúc đẩy. CUE so sánh chi phí đám mây của bạn với số liệu doanh thu và nhu cầu, cho biết mức độ hiệu quả chi tiêu đám mây của bạn, cách thức chi tiêu này thay đổi theo thời gian và (nếu bạn có nền tảng phù hợp) cách tốt nhất để tăng hiệu quả đó.
Hiểu được CUE thậm chí còn hữu ích hơn trong bối cảnh AI, vì về bản chất, nó đắt hơn nhiều so với các dịch vụ đám mây truyền thống do các công ty siêu quy mô bán ra. Các công ty xây dựng ứng dụng đại lý có thể tính toán chi phí cho mỗi giao dịch (ví dụ: chi phí cho mỗi hóa đơn, chi phí cho mỗi lần giao hàng, chi phí cho mỗi giao dịch, v.v.) và sử dụng thông tin này để đánh giá lợi tức đầu tư của các dịch vụ, sản phẩm và tính năng cụ thể do AI thúc đẩy. Khi chi tiêu cho AI tăng lên, các công ty sẽ buộc phải làm như vậy; không công ty nào có thể chi vô số đô la cho đổi mới thử nghiệm mãi mãi. Cuối cùng, nó phải có ý nghĩa kinh doanh.
Hướng tới hiệu quả cao hơn
Mặc dù con số 6 triệu đô la có ý nghĩa như thế nào, DeepSeek có thể đã tạo ra một bước ngoặt đánh thức ngành công nghệ về tầm quan trọng tất yếu của hiệu quả. Chúng ta hãy hy vọng điều này sẽ mở ra cánh cổng cho các ứng dụng đào tạo, suy luận và tác nhân tiết kiệm chi phí, mở ra tiềm năng thực sự và ROI của AI.