Connect with us

Umělá inteligence

Za hranice vyhledávání: NVIDIA stanovuje směr pro éru generativního počítačového zpracování

mm

NVIDIA CEO Jensen Huang oznámil řadu průlomových pokroků v oblasti výpočetních schopností umělé inteligence na konferenci GTC March 2025 keynote, popisující to, co nazval “$1 bilionovým výpočetním inflexním bodem.” Keynote odhalil výrobní připravenost Blackwell GPU architektury, víceletý roadmap pro budoucí architektury, významné průlomy v síťovém zpracování umělé inteligence, nové podnikové řešení umělé inteligence a významný vývoj v oblasti robotiky a fyzické umělé inteligence.

“Token ekonomika” a “AI továrny”

Centrálním bodem Huangova vize je koncept “tokenů” jako základních stavebních bloků umělé inteligence a vznik “AI továren” jako specializovaných datových center navržených pro generativní zpracování.

“Toto je způsob, jak se vytváří inteligence, nový druh továrny generátoru tokenů, stavebních bloků umělé inteligence. Tokeny otevřely novou hranici,” řekl Huang publiku. Zdůraznil, že tokeny mohou “převést obrázky na vědecká data mapující atmosféry cizích planet,” “dekódovat zákony fyziky” a “vidět onemocnění předtím, než se rozvine.”

Tato vize představuje posun od tradičního “retrieval computingu” k “generativnímu computingu”, kde umělé inteligence rozumí kontextu a generuje odpovědi místo toho, aby pouze načítala předem uložená data. Podle Huangova tohoto přechodu vyžaduje novou architekturu datových center, kde “počítač se stal generátorem tokenů, nikoli načítáním souborů.”

https://www.youtube.com/watch?v=_waPvOwL9Z8

Blackwell architektura nabízí masivní zvýšení výkonu

NVIDIA Blackwell GPU architektura, nyní v “plné produkci”, nabízí podle společnosti “40x výkon Hopperu” pro modely rozumu za stejných podmínek spotřeby energie. Architektura zahrnuje podporu pro FP4 přesnost, což vede k významnému zlepšení energetické efektivity.

“ISO výkon, Blackwell je 25krát,” uvedl Huang, zdůrazňující dramatické zlepšení efektivity nové platformy.

Blackwell architektura také podporuje extrémní navýšení kapacity prostřednictvím technologií jako NVLink 72, umožňující vytvářet masivní, sjednocené systémy GPU. Huang předpověděl, že výkon Blackwellu učiní předchozí generace GPU méně žádoucí pro náročné úkoly umělé inteligence.

Předvídatelný roadmap pro AI infrastrukturu

NVIDIA představila pravidelný roční cyklus inovací AI infrastruktury, umožňující zákazníkům plánovat své investice s větší jistotou:

  • Blackwell Ultra (druhá polovina roku 2025): Upgrade platformy Blackwell s zvýšeným počtem FLOPs, pamětí a šířkou pásma.
  • Vera Rubin (druhá polovina roku 2026): Nová architektura s procesorem s dvojnásobným výkonem, novým GPU a budoucími technologiemi NVLink a paměti.
  • Rubin Ultra (druhá polovina roku 2027): Extrémní navýšení kapacity s cílem 15 exaflops výpočtu na rack.

Demokratizace umělé inteligence: od sítí po modely

Aby se realizovala vize širokého přijetí umělé inteligence, NVIDIA oznámila komplexní řešení zahrnující síť, hardware a software. Na úrovni infrastruktury společnost řeší výzvu spojení stovek tisíc nebo dokonce milionů GPU v “AI továrnách” prostřednictvím významných investic do technologie siliconových fotonik. Jejich první systém s integrovanou optikou (CPO) s rychlostí 1,6 terabit za sekundu, založený na technologii mikro kruhového rezonátoru (MRM), slibuje podstatné úspory energie a zvýšení hustoty ve srovnání s tradičními transceivery, umožňující efektivnější spojení mezi obrovským množstvím GPU napříč různými lokalitami.

Zatímco se buduje základna pro velké “AI továrny”, NVIDIA současně přináší výpočetní sílu umělé inteligence jednotlivcům a menším týmům. Společnost představila novou řadu DGX osobních superpočítačů umělé inteligence poháněných platformou Grace Blackwell, zaměřenou na podporu vývojářů umělé inteligence, výzkumníků a datových vědců. Řada zahrnuje DGX Spark, kompaktní platformu pro vývoj, a DGX Station, vysokovýkonnou desktopovou pracovní stanici s kapalinovým chlazením a ohromujících 20 petaflops výpočtu.

NVIDIA DGX Spark (Source: NVIDIA)


Doplňující tyto hardwarové pokroky, NVIDIA oznámila otevřenou Llama Nemotron rodinu modelů s možnostmi rozumu, určenou pro podnikové použití při budování pokročilých agentů umělé inteligence. Tyto modely jsou integrovány do NVIDIA NIM (NVIDIA Inference Microservices), umožňující vývojářům nasazovat je na různých platformách od místních pracovních stanic až po cloud. Tento přístup představuje komplexní řešení pro podnikové přijetí umělé inteligence.

Huang zdůraznil, že tyto iniciativy jsou posilovány rozsáhlou spoluprací s významnými společnostmi napříč různými odvětvími, které integrují modely NVIDIA, NIM a knihovny do svých strategií umělé inteligence. Tento ekosystémový přístup má za cíl urychlit přijetí a současně poskytovat flexibilitu pro různé podnikové potřeby a použití.

Fyzická umělé inteligence a robotika: 50bilionová příležitost

NVIDIA považuje fyzickou umělé inteligenci a robotiku za “$50 bilionovou příležitost”, podle Huangova. Společnost oznámila otevřený zdroj NVIDIA Isaac GR00T N1, popsáný jako “generalistický základový model pro humanoidní roboty”.

Významné aktualizace NVIDIA Cosmos světových základních modelů poskytují bezprecedentní kontrolu nad generací syntetických dat pro trénink robotů pomocí NVIDIA Omniverse. Jak Huang vysvětlil, “Používání Omniverse ke kondicionování Cosmos a Cosmos ke generování nekonečného počtu prostředí umožňuje nám vytvořit data, která jsou zakořeněna, ovládaná námi a současně systematicky nekonečná.”

Společnost také představila nový otevřený fyzikální engine nazvaný “Newton”, vyvinutý ve spolupráci s Google DeepMind a Disney Research. Engine je navržen pro vysoce věrnou simulaci robotiky, včetně tuhých a měkkých těl, taktilní zpětné vazby a urychlení GPU.

Isaac GR00T N1 (Source: NVIDIA)

Agentní umělé inteligence a transformace odvětví

Huang definoval “agentní umělé inteligence” jako umělé inteligence s “agenturou”, která může “vnímat a rozumět kontextu”, “rozumět” a “plánovat a jednat”, dokonce i používat nástroje a učit se z multimodálních informací.

“Agentní umělé inteligence基本ně znamená, že máte umělou inteligenci, která má agenturu. Může vnímat a rozumět kontextu okolností. Může rozumět, velmi důležitě může rozumět tomu, jak odpovědět nebo jak vyřešit problém, a může plánovat a jednat. Může plánovat a jednat. Může používat nástroje,” vysvětlil Huang.

Tato schopnost pohání prudký nárůst výpočetních požadavků: “Požadavek na výpočetní výkon, škálovací zákon umělé inteligence je více odolný a ve skutečnosti hyper urychlený. Výpočetní výkon, který potřebujeme v tomto okamžiku jako výsledek agentní umělé inteligence, jako výsledek rozumu, je snadno stovekkrát více, než jsme si mysleli, že potřebujeme tento čas minulý rok,” dodal.

Závěrečné shrnutí

Jensen Huangova keynote na GTC 2025 představila komplexní vizi budoucnosti poháněné umělou inteligencí, charakterizované inteligentními agenty, autonomními roboty a specializovanými “AI továrnami”. Oznámení NVIDIA napříč hardwarovou architekturou, sítěmi, softwarem a otevřenými modely signalizují odhodlání společnosti pohánět a urychlit další éru počítačového zpracování.

Jak se počítačové zpracování posouvá od vyhledávacího na generativní modely, zaměření NVIDIA na tokeny jako základní měnu umělé inteligence a na navýšení kapacity napříč cloudovými, podnikovými a robotickými platformami poskytuje roadmapu pro budoucnost technologií, s dalekosáhlými důsledky pro odvětví celosvětově.

Alex McFarland je novinář a spisovatel zaměřený na umělou inteligenci, který zkoumá nejnovější vývoj v tomto oboru. Spolupracoval s četnými startupy zabývajícími se AI a publikacemi po celém světě.