Лідери думок
Проблема всюди: чому “Дані всюди” стають визначальною інфраструктурною проблемою епохи штучного інтелекту

Найбільш суттєве питання в галузі штучного інтелекту сьогодні не полягає в тому, який модель є найрозумнішою. Це питання про те, де живуть дані, і чи може інтелект до них дістатися.
Більшу частину десятиліття галузь штучного інтелекту працювала під впевненістю в тому, що централізовані дані, централізовані обчислення та геніальність будуть слідувати. Модель гіперсเกลера — централізація великих навчальних наборів даних у великих кластерах хмарних обчислень та застосування масивних обчислень GPU для стиснення їх у параметри моделі — дала надзвичайні результати, але також створила архітектуру, яка тепер страждає під вагою свого успіху.
Назовімо це “проблемою даних всюди”. Коли штучний інтелект виходить з лабораторій досліджень і входить у функціональну тканину лікарень, заводів, фінансових установ та урядів, дані, які повинні інформувати ці системи, є внутрішньо розподіленими, обмеженими юрисдикцією та операційно нерухомими. Регулятори в Європі наполягають на тому, щоб фінансові записи громадян не залишали континент. Клінічні дані фармацевтичної компанії в Базелі не можуть законно співіснувати з геномними даними з Сеула в хмарному бакеті.
Хай би що було, інтелект мусить йти до даних. Дані, підкреслюємо, не прийдуть до інтелекту.
Економіка зсуву
Ця структурна напруженість посилюється одночасною революцією в економіці штучного інтелекту. Галузь переживає тектонічну перебалансування від витрат на навчання до витрат на висновок, і наслідки для архітектури даних є глибокими.
Deloitte оцінив, що витрати на висновок становили половину всіх обчислень штучного інтелекту в 2025 році, а ця цифра зросте до двох третин у 2026 році. Відношення інвертується з дивовижною швидкістю. Аналітики оцінюють, що до 2026 року витрати на висновок перевищать витрати на навчання в 118 разів. До 2030 року витрати на висновок можуть становити 75% усіх обчислень штучного інтелекту, що призведе до інвестицій у розмірі 7 трильйонів доларів у інфраструктуру.
Математика витрат є рівною. За кожен 1 мільярд доларів, витрачених на навчання моделі штучного інтелекту, організації стикаються з витратами на висновок у розмірі 15-20 мільярдів доларів протягом терміну служби моделі: відношення, яке ілюструється різко моделлю GPT-4, витрати на навчання якої становили приблизно 150 мільйонів доларів, але загальні витрати на висновок досягли 2,3 мільярда доларів до кінця 2024 року. Навчання, яке раніше було головною темою інвесторів і працівників закупівель штучного інтелекту, переформульовується як одноразова плата за навчання. Витрати на висновок є постійними операційними витратами на інтелект, і тепер вони є домінуючою статтею.
Але ось парадокс: витрати на висновок для системи рівня GPT-3.5 впали більш ніж у 280 разів між листопадом 2022 року та жовтнем 2024 року, при цьому витрати на апаратне забезпечення знижувалися приблизно на 30% щороку, а енергетична ефективність покращувалася на 40% щороку. Ціни знижуються; споживання прискорюється швидше. Витрати на висновок на одиницю впали у 100 разів, тоді як Microsoft і Google повідомили про зростання обсягів штучного інтелекту у 31 раз за половину цього періоду.
The парадокс Джевонса, де підвищення ефективності призводить до збільшення використання ресурсів, знайшов сучасне вираження в кластерах GPU.
Там, де живуть дані, інтелект мусить слідувати
Економіка висновку фундаментально змінює вимоги до інфраструктури, і ніде більше, ніж навколо гравітації даних. Витяг, на відміну від навчання, не є пакетною роботою, яку можна виконувати в центрі даних. Це безперервна, чутлива до затримки, географічно розподілена служба, і вона є такою ж хорошою, як дані, до яких вона може дістатися в момент запиту.
Це є ядром проблеми даних всюди.
Наприклад, модель мови, яка приймає рішення над живими даними пацієнта в реанімації, не може собі дозволити 200-мілісекундну затримку до кластеру хмарних обчислень на східному узбережжі. Модель фінансових послуг, яка працює з висновком на місці транзакції, не може вивести дані про рахунок до юрисдикції, де це буде порушувати GDPR. Розгортання штучного інтелекту не може бути засноване на інфраструктурі, володієм і експлуатованим іноземною комерційною організацією.
Фронтова лабораторія гостро усвідомлює це. Угода Anthropic з Google Cloud на мільйон ТПУ, яка забезпечує понад гігават обчислювальної потужності до 2026 року, свідчить про те, як провідні лабораторії інвестують у масштабі, щоб сформувати глобальну інфраструктурну основу висновку.
Таксономія інтенсивності даних
Не всі системи штучного інтелекту стикаються з цією проблемою однаково, і корисно розглянути приблизну таксономію, оскільки існують різні типи моделей штучного інтелекту та складності. Давайте розберемо це на трьох основних прикладах: великі мовні моделі, зображення та фізичні моделі.
Великі мовні моделі — сім’ї Claude, GPT і Gemini — працюють переважно з мовними токенами: відносно легкими, стискуваними та придатними для технік збереження приватності, таких як диференціальна приватність або федеративне навчання. Їхня проблема даних всюди дуже складна.
Генеративні візуальні моделі представляють ще складніший випадок. Системи, такі як Black Forest Labs’ FLUX.2, можуть генерувати високоякісні, фотореалістичні зображення за менш ніж секунду на потужному апаратному забезпеченні, але генерація одного зображення вимагає значно більше даних і обчислень, ніж генерація тексту. Коли візуальний штучний інтелект переходить за межі творчих інструментів у промисловий огляд, медичну візуалізацію та аналіз супутників, підлеглий дані часто великі, чутливі та важко переміщувані, що збільшує потребу запуску штучного інтелекту там, де дані вже мешкають.
Більш складна категорія — фізичний штучний інтелект. Дженсен Хуанг з NVIDIA заявив, що “фізичний штучний інтелект прийшов, і кожна промислова компанія стане робототехнічною компанією”. Нові моделі, такі як NVIDIA’s Cosmos 3, мають надати машинам узагальнене розуміння фізичного світу шляхом поєднання симуляції, зору та висновку, тоді як компанії, такі як Physical Intelligence, тренують роботів на реальних даних сенсорів — включаючи силу, рух та візуальні входи — для забезпечення більш пристосовуваної, автономної поведінки.
Ті самі динаміки масштабування, які покращили великі моделі висновку, тепер застосовуються до реальних даних, таких як вібрація, звук та дані сенсорів. Але ця інформація є внутрішньо локальною. Робот на заводському поверсі не може надіслати дані про зображення та дотику в віддалений хмарний кластер для обробки без введення затримок, які могли б створити ризики безпеки, що означає, що штучний інтелект мусить все частіше запускатися на краю, близько до місця генерації даних.
Довіра, пояснюваність та результати
Це місце, де проблема даних всюди переходить за межі інфраструктури та стає питаннями управління. Коли штучний інтелект застосовується до високих ставок рішень — від медичних діагнозів до фінансових ризикових моделей та фізичних систем контролю — питання про те, де мешкають дані, все частіше пов’язані з тим, хто відповідає за результати.
У сучасному регуляторному середовищі пояснюваність не є необов’язковою. Закон ЄС про штучний інтелект, наприклад, вимагає, щоб високоризикові системи демонстрували підстави для своїх висновків, що є складним, якщо дані, які інформують ці рішення, розподілені по декількох системах, юрисдикціях та регуляторних рамках.
Довіра, тому, стає передумовою для прийняття у масштабі. Контроль над середовищем даних стає таким же важливим, як і контроль над самими моделями.
Наступне покоління інфраструктури штучного інтелекту
Рішення проблеми даних всюди визначить конкурентну карту штучного інтелекту на наступне десятиліття. Федеративний висновок, безпечні середовища обробки даних, моделі, оптимізовані для краю, та оркестровні системи, які враховують, де дані можуть мешкати, не є нішевими технічними особливостями, а передумовами для розширення штучного інтелекту за межі випадків, де дані можуть бути вільно централізовані.
Компанії та уряди, які будують інфраструктуру, здатну забезпечити довірчу, пояснювану, суверенну інференцію — інтелект, який досягає даних, а не вимагає, щоб дані подорожували до нього, — будуть командувати найбільш тривалим ровом епохи штучного інтелекту. Навчання розумнішої моделі все частіше стає розв’язаною та комодифікованою проблемою. Розгортання її відповідально, на краю, через юрисдикційні кордони, проти даних, які не можуть рухатися, є проблемою, яка залишається.
Дані всюди не є гаслом. Це є найскладнішою нерозв’язаною проблемою в корпоративному штучному інтелекті. І це визначить, чи перекладуться надзвичайні можливості, відкриті за рахунок десятилітніх інвестицій у навчання, у результати, яким можна довіряти.












