Лідери думок
Чого DeepSeek може навчити нас про вартість і ефективність ШІ

Нещодавній випуск DeepSeek із симпатичним логотипом у вигляді кита міг би бути нічим іншим, як черговою підробкою ChatGPT. Що зробило його настільки заслуговуючим уваги в новинах – і що призвело до штопору акцій конкурентів – це те, як мало коштувало його створення. Це фактично кинуло гайковий ключ в уявлення США про інвестиції, необхідні для навчання високофункціональної моделі великої мови (LLM).
DeepSeek нібито витратив лише 6 мільйонів доларів на навчання своєї моделі ШІ. Порівняйте це з 80–100 мільйонами доларів США, які OpenAI витратив на Chat GPT-4, або 1 мільярдом доларів, виділених на GPT-5. DeepSeek ставить під сумнів такий рівень інвестицій і залишає таких великих гравців, як Nvidia, вартість акцій якої за один день впала на 600 мільярдів доларів, TSMC і Microsoft, які хвилюються щодо довгострокової фінансової життєздатності ШІ. Якщо можна навчити моделі штучного інтелекту за значно менші кошти, ніж передбачалося раніше, що це означає для загальних витрат на штучний інтелект?
Хоча порушення роботи DeepSeek призвело до важливих дискусій, деякі ключові моменти, схоже, губляться в перемішуванні. Однак у новинах йдеться про більшу увагу до того, скільки коштують інновації та можливого економічного впливу ШІ. Ось три важливі ідеї, які випливають із цієї новини:
1. Ціна DeepSeek у 6 мільйонів доларів вводить в оману
Компанії повинні зрозуміти загальну вартість володіння (TCO) своєї інфраструктури. Незважаючи на те, що ціна DeepSeek у 6 мільйонів доларів була сильно завищена, це, ймовірно, вартість лише його попереднього навчання, а не всіх інвестицій. Загальна вартість – не лише запуску, але й створення та навчання DeepSeek – ймовірно, набагато вища. Галузева аналітична фірма Напіваналіз показало, що компанія, яка стоїть за DeepSeek, витратила 1.6 мільярда доларів на апаратне забезпечення, щоб втілити свій LLM у реальність. Отже, ймовірна вартість десь посередині.
Якою б не була справжня вартість, поява DeepSeek зосередила увагу на економічно ефективних інноваціях, які могли б трансформуватись. Інновації часто стимулюються обмеженнями, і успіх DeepSeek підкреслює те, як інновації можуть відбуватися, коли команди інженерів оптимізують свої ресурси всупереч обмеженням реального світу.
2. Висновок робить ШІ цінним, а не навчання
Важливо звернути увагу на те, скільки коштує навчання моделі ШІ, але навчання становить невелику частину загальних витрат на створення та запуск моделі ШІ. Висновок — різноманітні способи ШІ змінює те, як люди працюють, взаємодіють і живуть — саме тут ШІ стає справді цінним.
Це призводить до парадоксу Джевонса, економічної теорії, згідно з якою технологічний прогрес робить використання ресурсу більш ефективним, загальне споживання цього ресурсу може фактично зрости. Іншими словами, у міру того, як витрати на навчання зменшаться, логічні умовиводи та агентське споживання зростуть, а загальні витрати підуть тим самим.
Ефективність штучного інтелекту може фактично призвести до зростання витрат на штучний інтелект, що має підняти всі човни, а не лише китайські. Якщо припустити, що вони їдуть на хвилі ефективності, такі компанії, як OpenAI і Nvidia, також виграють.
3. Залишається правдою те, що одиниця економіки має найбільше значення
Підвищення ефективності штучного інтелекту означає не лише зниження витрат; це також оптимізація економіки одиниці. The Motley Fool прогнозує, що цього року буде рік ефективності ШІ. Якщо вони праві, компаніям слід звернути увагу на зниження витрат на навчання ШІ, а також витрат на споживання ШІ.
Організаціям, які створюють або використовують штучний інтелект, потрібно знати економіку своїх підрозділів, а не виділяти вражаючі цифри, як-от вартість навчання DeepSeek у 6 мільйонів доларів. Справжня ефективність передбачає розподіл усіх витрат, відстеження попиту, керованого штучним інтелектом, і постійний контроль співвідношення вартості та вартості.
Економіка хмарних одиниць (CUE) пов’язана з вимірюванням і максимізацією прибутку за рахунок хмари. CUE порівнює ваші витрати на хмару з показниками доходу та попиту, показуючи, наскільки ефективні ваші витрати на хмару, як це змінилося з часом і (якщо у вас є правильна платформа) найкращі способи підвищення ефективності.
Розуміння CUE має ще більшу користь у контексті штучного інтелекту, враховуючи, що споживання його за своєю суттю дорожче, ніж традиційні хмарні сервіси, які продають гіперскейлери. Компанії, які створюють агентські програми, можуть розрахувати вартість транзакції (наприклад, вартість рахунку, вартість доставки, вартість операції тощо) і використовувати це для оцінки рентабельності інвестицій у конкретні послуги, продукти та функції, керовані ШІ. Оскільки витрати на ШІ збільшаться, компанії будуть змушені це робити; жодна компанія не може вічно витрачати гроші на експериментальні інновації. Зрештою, це має мати сенс для бізнесу.
До більшої ефективності
Якою б важливою не була цифра в 6 мільйонів доларів, DeepSeek, можливо, став переломним моментом, який пробудив індустрію технологій до неминучої важливості ефективності. Будемо сподіватися, що це відкриє шлюзи для економічно ефективного навчання, висновків і агентських програм, які розкриють справжній потенціал і рентабельність інвестицій ШІ.