Lãnh đạo tư tưởng
Để Cắt Giảm Chi Phí AI, Bắt Đầu Từ Chi Phí Đám Mây

“Messy middle” của AI có thể đã đạt đến mức độ lộn xộn nhất.
Khi sự khan hiếm phần cứng toàn cầu va chạm với nhu cầu lớn, chi phí AI đã tăng vọt. Trong cuộc đua để có thêm khả năng tính toán, các công ty dịch vụ AI đã không có lựa chọn nào khác ngoài việc tăng giá và sửa đổi mô hình hóa đơn, khiến ngân sách bị mất cân bằng và làm gián đoạn sự đổi mới chỉ khi nhiều tổ chức cuối cùng đã đạt được tiến bộ.
Kết quả không chỉ là sốc về giá cả: đó là một cuộc khủng hoảng tồn tại đối với thế giới kinh doanh đã thực sự chỉ có một. Các công ty đã thay đổi đường lối của họ để thích nghi với tác động của AI. Các đội đã sắp xếp lại quy trình làm việc của họ theo khả năng của AI. Việc kích hoạt AI đã trở thành yếu tố cạnh tranh chính của các tổ chức. AI đã tham gia vào lĩnh vực này, khởi đầu một sự biến đổi lớn, và bây giờ các đội đang được yêu cầu phải thu hẹp lại khi họ chỉ mới bắt đầu vận hành nó.
Các công ty như Uber đã làm nên những tiêu đề về việc đặt giới hạn sử dụng AI một cách hung hãn để ngăn chặn dòng chảy. Nhưng trong khi giới hạn sử dụng có thể là một biện pháp cắt giảm chi phí hiệu quả, đó không phải là cách duy nhất mà các doanh nghiệp có thể cắt giảm chi tiêu cho khả năng tính toán.
Nơi đầu tiên họ nên tìm kiếm là hóa đơn đám mây của họ.
Có vẻ như điều này trái ngược với trực giác. Trong khi công thức luôn là càng nhiều khả năng tính toán thì càng nhiều tác động của AI, điều đó không nhất thiết làm cho nó hiệu quả hơn. Các doanh nghiệp đang mất máu từ ngân sách của họ cho các dịch vụ AI trong khi vẫn phụ thuộc vào cơ sở hạ tầng quá lớn, quá đắt; chi phí AI tăng cao chỉ đơn giản là đang暴露 một vấn đề sâu sắc mà các doanh nghiệp không thể bỏ qua được.
Làm Thế Nào Để Chi Phí Đám Mây Tích Tụ
Chi tiêu cho cơ sở hạ tầng CNTT thường là mục thứ hai lớn nhất của một tổ chức sau chi phí nhân sự, chiếm trung bình 10% doanh thu hàng năm của một doanh nghiệp – một con số mà nhu cầu AI đã đẩy lên cao trong vài năm qua. Nhưng nhiều doanh nghiệp đang thêm khối lượng vào một khuôn khổ CNTT đã quá phình to.
Các CTO và những người ra quyết định công nghệ khác bị thu hút bởi những gì quen thuộc và đáng tin cậy. Thật không may, điều này cũng là nguyên nhân làm tăng hóa đơn đám mây của họ. Bằng cách chấp nhận những gì đã được thử và kiểm nghiệm, họ đang bị khóa vào các thỏa thuận một kích cỡ phù hợp với tất cả các nhà cung cấp dịch vụ lớn, nơi họ phải trả tiền cho các giải pháp không tạo ra giá trị.
Theo thời gian, họ phát hiện ra rằng họ đang trả tiền cho các dịch vụ không hoạt động hoặc không sử dụng, phần cứng không được tối ưu hóa và lưu trữ trống, khi họ có thể đầu tư số tiền đó vào sự đổi mới của AI. Với AI ngày càng trở nên đắt hơn, họ sẽ cần mọi đồng tiền họ có thể có.
Đổi Mới Cơ Sở Hạ Tầng Để Hiệu Quả Hóa AI
Để kiểm soát sự lan rộng của đám mây đòi hỏi sự kết hợp của hành động ngắn hạn sắc nét và sự tiến hóa dài hạn. Xử lý những gì có thể giải quyết được ngày hôm nay sẽ mang lại cho các doanh nghiệp không gian thở để lên kế hoạch cho những điều chỉnh lớn hơn trong năm tới.
Quá trình chuyển đổi sang cơ sở hạ tầng mới đòi hỏi thời gian, và các tổ chức cần có giải pháp ngay bây giờ để các đội của họ có thể tiếp tục làm việc với AI. Dưới đây là ba bước mà các doanh nghiệp có thể thực hiện ngay lập tức để điều chỉnh chi tiêu đám mây của họ:
1 – Phân Tích Sử Dụng CPU và Bộ Nhớ
Có một thứ gọi là “quá nhiều” hiệu suất. Các đội CNTT nên thực hiện một chẩn đoán彻底 về việc sử dụng dịch vụ đám mây, sau đó降 cấp các trường hợp vượt quá yêu cầu hiệu suất. Một cuộc điều tra sâu về việc sử dụng đám mây cũng giúp các đội phát hiện ra các tính năng và cơ sở hạ tầng không được sử dụng; nếu hợp đồng hiện tại của họ cho phép, họ có thể loại bỏ các dịch vụ này hoặc thương lượng một khoản thanh toán thấp hơn trong suốt thời gian còn lại của hợp đồng. Nếu không, việc xác định các tính năng không sử dụng cung cấp một khuôn khổ quý giá để xác định các thông số của cách tiếp cận đám mây được cấu hình lại.
Khi các doanh nghiệp thay đổi chiến lược cơ sở hạ tầng, họ sẽ muốn chọn các dịch vụ đám mây tiết kiệm bộ nhớ. Ví dụ, cơ sở hạ tầng tối ưu hóa bộ nhớ và vCPUs cung cấp hỗ trợ giá cả phải chăng hơn cho hỗ trợ cấp doanh nghiệp so với các tối ưu hóa dựa trên Arm thường được các nhà cung cấp dịch vụ lớn cung cấp. Điều này giảm bớt một phần gánh nặng giám sát từ các đội CNTT đồng thời giảm chi tiêu đám mây tổng thể.
2 – Thiết Lập Giới Hạn Chi Tiêu Ngặt Ngèo
Giới hạn chi tiêu và sử dụng đã trở thành phản ứng miễn dịch của ngành công nghệ đối với việc tăng giá AI, nhưng điều quan trọng không chỉ là thiết lập các giới hạn đó mà còn là cách chúng được định nghĩa, truyền đạt và thực thi.
Trước hết, giới hạn chi tiêu nên được chỉ định cho từng trường hợp sử dụng. Các nhà lãnh đạo nên có thể sử dụng chúng làm hướng dẫn cho việc lập kế hoạch dự án và phân bổ nguồn lực, cho phép họ cấu trúc ngân sách, thời gian và các đội dự án cá nhân với tư duy hướng tới hiệu quả.
Về việc truyền đạt, điều quan trọng là toàn bộ lực lượng lao động phải hiểu tại sao lại có những giới hạn đó. Chúng ta đã quen với việc nhìn thấy sự số hóa như vô tận, nhưng trong giai đoạn bùng nổ AI này, chúng ta đang đối mặt với các định luật vật lý. Khi sự khan hiếm và thay đổi hóa đơn ảnh hưởng đến quy trình làm việc hàng ngày của nhân viên, giới hạn chi tiêu nên được định vị như một cách bền vững để duy trì sự phụ thuộc mới của họ vào các công cụ AI, chứ không phải là một hạn chế.
3 – Thực Thi Giao Thức Gán Thẻ
Giao thức gán thẻ ngăn chặn việc sử dụng CNTT không được quản lý mà bí mật làm tăng chi phí tính toán. Với một mã gán thẻ mạnh mẽ, các nhà lãnh đạo CNTT có thể hiểu rõ hơn về lưu lượng dịch vụ đám mây, cho phép các đội nhắm vào nguồn gốc của việc sử dụng quá mức và thực hiện các điều chỉnh chiến lược để cắt giảm tài nguyên nơi xảy ra tình trạng phình to. Đồng thời, giao thức gán thẻ cũng có thể chỉ ra nơi các đội có thể cần nâng cấp.
Khi các hợp đồng đám mây hiện tại của họ hết hạn, các doanh nghiệp có cơ hội tái cấu trúc hệ sinh thái tính toán của mình với một cách tiếp cận đám mây có thể cấu hình lại. Điều này không nhất thiết có nghĩa là từ bỏ các đối tác hyperscaler lâu năm của họ, mà là giảm kích thước hợp đồng của họ để hòa hợp với cơ sở hạ tầng hiệu quả hơn ở nơi khác trong ngăn xếp. Các giải pháp đám mây thay thế, giải pháp cạnh mà offload gánh nặng trên cơ sở hạ tầng dựa trên GPU, và các giải pháp phần mềm mã nguồn mở đều tạo thành một chiến lược đa nhà cung cấp linh hoạt không chỉ giúp tiết kiệm chi phí mà còn tăng ROI của mọi sáng kiến AI bằng cách tối đa hóa giá cho hiệu suất, cho phép các doanh nghiệp sau đó đầu tư tiền tiết kiệm vào sự đổi mới của AI.
Đổi Mới Tâm Trí Hiệu Quả
Quản lý chi tiêu AI cũng là một vấn đề văn hóa. Các lực lượng lao động được kích hoạt bởi AI đặc biệt quan tâm đến hiệu quả. Đó là lý do tại sao họ xây dựng các đại lý, tự động hóa các cuộc trò chuyện của họ và để AI thực hiện công việc nặng nhọc trong khi họ mở rộng khả năng sáng tạo và đổi mới của mình. Nhưng việc sử dụng không có trách nhiệm các công cụ này có tác động ngược lại.
“Tokenmaxxing” và các xu hướng khác khuyến khích việc sử dụng AI lãng phí không tương thích với thiên hướng về hiệu quả. Nếu các đội muốn thực sự làm được nhiều hơn với ít hơn, tương tác của họ với AI nên phản ánh nguyên tắc đó.
Điều đó đòi hỏi phải thay đổi văn hóa và công nghệ cùng lúc. Khuyến khích việc sử dụng các lời nhắc tốt hơn để giảm tải suy luận, nhưng cũng áp dụng cơ sở hạ tầng tự động tiết kiệm suy luận. Áp dụng các mô hình AI nhỏ hơn với các trường hợp sử dụng chính xác. Áp dụng các mô hình và phần mềm mã nguồn mở để giảm tải công việc đào tạo. trao quyền cho các nhà phát triển giải quyết vấn đề một cách hiệu quả và giáo dục người dùng AI không chuyên môn. Các công ty muốn khuyến khích nhân viên của họ sử dụng AI phải làm như vậy một cách có trách nhiệm.
Mặc dù giá cả tăng cao, chúng tôi vẫn chưa nhấn phanh lại sự chuyển đổi của AI. Việc vận hành AI ở quy mô lớn luôn là một việc tốn kém, đòi hỏi phải lập kế hoạch cẩn thận và phân bổ vốn chiến lược để duy trì tính bền vững. Ở nơi chúng ta đang đứng, đó là một điểm thắt: những động thái mà các nhà lãnh đạo CNTT thực hiện bây giờ sẽ quyết định ai sẽ vượt qua và ai sẽ bị bỏ lại phía sau.
Khi ngành công nghiệp động viên để giải quyết cuộc khủng hoảng tính toán đang hình thành, các doanh nghiệp cần tìm cách tận dụng những gì họ có. Các công ty có thể tự bảo vệ mình khỏi chi tiêu AI thiên văn bằng cách giải quyết việc chi tiêu quá mức cho các giải pháp đám mây, tiết kiệm suy luận trên đám mây phân tán và đầu tư vào cơ sở hạ tầng thúc đẩy ROI thực sự.












