Штучний Інтелект
Beyond Retrieval: NVIDIA Charts Course for the Generative Computing Era

NVIDIA Генеральний директор Дженсен Хуанг оголосив про серію новаторських досягнень у сфері обчислювальних можливостей штучного інтелекту в офісі компанії. Основна доповідь GTC березня 2025 р, описуючи те, що він назвав «точкою перелому обчислень в 1 трильйон доларів». У доповіді було розкрито виробничу готовність Архітектура GPU Blackwell, багаторічна дорожня карта для майбутніх архітектур, серйозні прориви в мережах ШІ, нові корпоративні рішення ШІ та значні розробки в робототехніці та фізичному ШІ.
«Економіка токенів» і фабрики ШІ
Центральним елементом бачення Хуанга є концепція «токенів» як фундаментальних будівельних блоків штучного інтелекту та поява «фабрик штучного інтелекту» як спеціалізованих центрів обробки даних, призначених для генеративних обчислень.
"Ось як створюється інтелект, новий вид заводського генератора токенів, будівельних блоків штучного інтелекту. Токени відкрили нові межі", - сказав Хуан аудиторії. Він підкреслив, що токени можуть «перетворювати зображення в наукові дані, що описують інопланетні атмосфери», «розшифровувати закони фізики» і «бачити хворобу, перш ніж вона закріпиться».
Це бачення являє собою перехід від традиційних «пошукових обчислень» до «генеративних обчислень», де ШІ розуміє контекст і генерує відповіді, а не просто отримує попередньо збережені дані. За словами Хуанга, цей перехід вимагає нового типу архітектури центру обробки даних, де «комп’ютер став генератором токенів, а не пошуком файлів».
Архітектура Blackwell забезпечує величезний приріст продуктивності
Архітектура графічного процесора NVIDIA Blackwell, яка зараз знаходиться в «повному виробництві», забезпечує, як стверджує компанія, «у 40 разів більшу продуктивність, ніж Hopper» для аналізу моделей за ідентичних умов живлення. Архітектура включає підтримку точності FP4, що призводить до значного підвищення енергоефективності.
«Потужність ISO, Blackwell — у 25 разів», — заявив Хуанг, підкреслюючи значне підвищення ефективності нової платформи.
Архітектура Blackwell також підтримує екстремальне масштабування завдяки таким технологіям, як NVLink 72, що дозволяє створювати масивні, уніфіковані системи графічних процесорів. Хуанг передбачив, що продуктивність Blackwell зробить графічні процесори попереднього покоління значно менш бажаними для вимогливих робочих навантажень штучного інтелекту.

(Джерело: NVIDIA)
Передбачувана дорожня карта для інфраструктури ШІ
NVIDIA окреслила регулярний щорічний курс інноваційної інфраструктури ШІ, що дозволяє клієнтам планувати свої інвестиції з більшою точністю:
- Blackwell Ultra (друга половина 2025 року): Оновлення до платформи Blackwell із збільшенням FLOP, пам’яті та пропускної здатності.
- Віра Рубін (друга половина 2026): Нова архітектура з центральним процесором із подвоєною продуктивністю, новим графічним процесором і технологіями NVLink і пам’яті нового покоління.
- Рубін Ультра (друга половина 2027): Надзвичайно розширена архітектура, націлена на 15 екзафлопс обчислень на одну стійку.
Демократизація ШІ: від мереж до моделей
Щоб реалізувати бачення широкого впровадження штучного інтелекту, NVIDIA оголосила про комплексні рішення, що охоплюють мережеве, апаратне та програмне забезпечення. На рівні інфраструктури компанія вирішує проблему підключення сотень тисяч або навіть мільйонів графічних процесорів на заводах ШІ шляхом значних інвестицій у технологію кремнієвої фотоніки. Їхня перша кремнієва фотонна система з комбінованою оптичною оптикою (CPO), CPO 1.6 терабіт/с на основі технології мікрокільцевого резонаторного модулятора (MRM), обіцяє значну економію електроенергії та підвищену щільність порівняно з традиційними трансиверами, забезпечуючи ефективніші з’єднання між величезною кількістю графічних процесорів на різних сайтах.
Створюючи основу для великомасштабних фабрик штучного інтелекту, NVIDIA одночасно надає обчислювальну потужність штучного інтелекту окремим особам і невеликим командам. Компанія представила нову лінійку Персональні суперкомп’ютери зі штучним інтелектом DGX на платформі Grace Blackwell, спрямований на розширення можливостей розробників штучного інтелекту, дослідників і спеціалістів із обробки даних. Модельний ряд включає DGX Spark, компактну платформу розробки, і DGX Station, високопродуктивну настільну робочу станцію з рідинним охолодженням і вражаючою обчислювальною потужністю 20 петафлопс.

NVIDIA DGX Spark (Джерело: NVIDIA)
Доповнюючи ці апаратні досягнення, NVIDIA оголосила про відкриття Сімейство моделей Llama Nemotron з можливостями аргументації, розроблені, щоб бути готовими до створення розширених підприємств Агенти ІІ. Ці моделі інтегровані в NVIDIA NIM (NVIDIA Inference Microservices), що дозволяє розробникам розгортати їх на різних платформах від локальних робочих станцій до хмари. Цей підхід представляє повне рішення для впровадження ШІ на підприємствах.
Хуанг підкреслив, що ці ініціативи вдосконалюються завдяки широкій співпраці з великими компаніями в багатьох галузях, які інтегрують моделі NVIDIA, NIM і бібліотеки у свої стратегії ШІ. Цей екосистемний підхід спрямований на прискорення впровадження, одночасно забезпечуючи гнучкість для різних потреб підприємства та випадків використання.
Фізичний штучний інтелект і робототехніка: можливість отримати 50 трильйонів доларів
NVIDIA розглядає фізичний штучний інтелект і робототехніку як «можливість у 50 трильйонів доларів», за словами Хуанга. Компанія анонсувала NVIDIA Isaac GR00T N1 з відкритим вихідним кодом, описану як «загальна базова модель для гуманоїдних роботів».
Значні оновлення базових моделей світу NVIDIA Cosmos забезпечують безпрецедентний контроль над генерацією синтетичних даних для навчання роботів за допомогою NVIDIA Omniverse. Як пояснив Хуанг, «використання Omniverse для кондиціонування Cosmos і Cosmos для створення нескінченної кількості середовищ дозволяє нам створювати дані, які обґрунтовані, контрольовані нами і водночас систематично нескінченні».
Компанія також представила новий фізичний движок з відкритим кодом під назвою «Newton», розроблений у співпраці з Google DeepMind і Disney Research. Двигун розроблено для високоточного моделювання робототехніки, включаючи тверді та м’які тіла, тактильний зворотний зв’язок і прискорення GPU.

Isaac GR00T N1 (Джерело: NVIDIA)
Агентський ШІ та трансформація галузі
Хуанг визначив «агентний ШІ» як ШІ з «агентством», який може «сприймати та розуміти контекст», «обґрунтовувати» та «планувати та вживати заходів», навіть використовуючи інструменти та навчаючись на основі мультимодальної інформації.
"Агентний ШІ в основному означає, що у вас є ШІ, який має право власності. Він може сприймати та розуміти контекст обставин. Він може міркувати, що дуже важливо, може міркувати про те, як відповісти або як вирішити проблему, і він може планувати та діяти. Він може планувати та вживати заходів. Він може використовувати інструменти", - пояснив Хуан.
Ця здатність викликає сплеск обчислювальних вимог: "Обсяг обчислень, закон масштабування штучного інтелекту є більш стійким і фактично гіперприскореним. Обсяг обчислень, який нам на даний момент потрібен завдяки агентському штучному інтелекту, як результат міркування, легко в сто разів більший, ніж ми думали, що нам потрібно в цей час минулого року", - додав він.
Bottom Line
У своїй основній доповіді на GTC 2025 Дженсен Хуанг представив комплексне бачення майбутнього, керованого штучним інтелектом, яке характеризується інтелектуальними агентами, автономними роботами та спеціально побудованими заводами штучного інтелекту. Оголошення NVIDIA щодо апаратної архітектури, мереж, програмного забезпечення та моделей з відкритим кодом свідчать про рішучість компанії підтримувати та пришвидшувати наступну еру обчислювальної техніки.
Оскільки обчислювальна техніка продовжує перехід від моделей, заснованих на пошуку даних, до генеративних, зосередження NVIDIA на токенах як основній валюті штучного інтелекту та на можливостях масштабування на хмарних, корпоративних та робототехнічних платформах забезпечує дорожню карту майбутнього технологій з далекосяжними наслідками для галузей промисловості в усьому світі.