Лідери думок
Що DeepSeek може нам розповісти про вартість та ефективність штучного інтелекту
З його милим логотипом у вигляді кита, недавній реліз DeepSeek міг би обмежитися ще однією копією ChatGPT. Що зробило його новинним – і що змусило акції конкурентів впасти – було те, як мало воно коштувало для створення. Це ефективно кинуло монету в механізм уявлення США про інвестиції, необхідні для навчання високофункціональної великомасштабної мови (LLM).
DeepSeek, як повідомляється, витратив лише 6 мільйонів доларів на навчання своєї моделі штучного інтелекту. Порівняйте це з 80-100 мільйонами доларів, які OpenAI витратили на Chat GPT-4, або 1 мільярдом доларів, які вони виділили для GPT-5. DeepSeek поставив під сумнів рівень інвестицій і залишив великих гравців, таких як Nvidia – чия вартість акцій впала на 600 мільярдів доларів за один день – TSMC і Microsoft, занепокоєними щодо довгострокової фінансової життєздатності штучного інтелекту. Якщо можливо тренувати моделі штучного інтелекту за значно нижчу ціну, ніж раніше припускалося, то що це означає для витрат на штучний інтелект в цілому?
Хоча порушення DeepSeek призвело до важливих дискусій, деякі ключові моменти, здається, втрачаються в хаосі. Однак те, що піднімає новина, – це більша увага до того, скільки коштує інновація, і можливий економічний вплив штучного інтелекту. Ось три важливих висновки, які випливають із цієї новини:
1. Ціна DeepSeek у 6 мільйонів доларів є оманливою
Компанії повинні розуміти загальну вартість володіння інфраструктурою (TCO). Хоча ціна DeepSeek у 6 мільйонів доларів часто згадується, це, ймовірно, вартість лише його попереднього тренування, а не всієї інвестиції. Загальна вартість – не тільки експлуатації, але й будівництва та навчання DeepSeek – ймовірно, значно вища. Аналітична фірма SemiAnalysis показала, що компанія, яка стоїть за DeepSeek, витратила 1,6 мільярда доларів на апаратне забезпечення, щоб зробити свою LLM реальністю. Тому ймовірна вартість знаходиться десь посередині.
Хоч би яка була справжня вартість, появу DeepSeek створила фокус на ефективних інноваціях, який міг би бути трансформаційним. Інновації часто спонукаються обмеженнями, і успіх DeepSeek підкреслює спосіб, у який інновації можуть відбуватися, коли інженерні команди оптимізують свої ресурси перед лицем реальних обмежень.
2. Висновок – це те, що робить штучний інтелект цінним, а не тренування
Важливо звернути увагу на те, скільки коштує тренування моделі штучного інтелекту, але тренування представляє лише невелику частку загальної вартості створення та експлуатації моделі штучного інтелекту. Висновок — різноманітні способи, у яких штучний інтелект змінює спосіб життя людей, їх взаємодію та життя — саме тут штучний інтелект стає дійсно цінним.
Це піднімає парадокс Джевонса, економічну теорію, яка припускає, що по мірі того, як технологічні досягнення роблять використання ресурсу більш ефективним, загальне споживання цього ресурсу може фактично збільшитися. Інакше кажучи, коли витрати на тренування знижуються, висновок і агентське споживання збільшаться, а загальні витрати будуть слідувати за цим.
Ефективність штучного інтелекту може насправді привести до зростання витрат на штучний інтелект, що повинно підвищити рівень усіх компаній, а не лише китайських. Припускаючи, що вони будуть кататися на хвилі ефективності, компанії, такі як OpenAI і Nvidia, також будуть вигравати.
3. Що залишається правдою, так це те, що економіка одиниць має найбільше значення
Зробити штучний інтелект більш ефективним – це не лише зниження витрат; це також оптимізація економіки одиниць. The Motley Fool прогнозує, що цей рік буде роком ефективності штучного інтелекту. Якщо вони праві, компанії повинні звернути увагу на зниження витрат на тренування штучного інтелекту, а також на витрати на споживання штучного інтелекту.
Організації, які будують або використовують штучний інтелект, повинні знати свою економіку одиниць, а не виділяти лише вражаючі цифри, такі як витрати DeepSeek на тренування у 6 мільйонів доларів. Реальна ефективність полягає в розподілі всіх витрат, відстежуванні попиту, створеного штучним інтелектом, та постійному моніторингу витрат до вартості.
Економіка одиниць хмарних обчислень (CUE) пов’язана з вимірюванням та максимізацією прибутку, створеного хмарними обчисленнями. CUE порівнює ваші хмарні витрати з метриками доходу та попиту, показуючи, наскільки ефективні ваші хмарні витрати, як це змінилося з часом, і (якщо у вас є правильна платформа) найкращі способи підвищити цю ефективність.
Поняття CUE має ще більшу користь у контексті штучного інтелекту, оскільки воно є суттєво дорожчим для споживання, ніж традиційні хмарні послуги, продавані гіперскалерами. Компанії, які будують агентські додатки, можуть розрахувати свою вартість за транзакцію (наприклад, вартість за рахунок, вартість за доставку, вартість за торгівлю тощо) та використовувати це для оцінки повернення інвестицій у конкретні послуги, продукти та функції, створені штучним інтелектом. Коли витрати на штучний інтелект зростатимуть, компанії будуть змушені робити це; жодна компанія не може нескінченно кидати нескінченні долари на експериментальні інновації. Зрештою, це повинно мати бізнес-сенс.
До більшої ефективності
Хоч би як важлива була цифра у 6 мільйонів доларів, DeepSeek міг створити момент, який пробудить технологічну галузь до неминучої важливості ефективності. Давайте сподіваємося, що це відкриє ворота для ефективного тренування, висновку та агентських додатків, які розблокують справжній потенціал та повернення інвестицій у штучний інтелект.












