Umjetna inteligencija
Beyond Retrieval: NVIDIA Charts Course for the Generative Computing Era

NVIDIA Izvršni direktor Jensen Huang najavio je niz revolucionarnih napredaka u mogućnostima umjetne inteligencije u tvrtki. GTC uvodna riječ za ožujak 2025, opisujući ono što je nazvao "točkom infleksije računalstva vrijednom 1 bilijun dolara". Uvodna riječ otkrila je spremnost za proizvodnju Blackwell GPU arhitektura, višegodišnji plan za buduće arhitekture, velika otkrića u umrežavanju umjetne inteligencije, nova rješenja umjetne inteligencije za poduzeća i značajan napredak u robotici i fizičkoj umjetnoj inteligenciji.
“Ekonomija žetona” i AI tvornice
Središnji dio Huangove vizije je koncept „tokena“ kao temeljnih gradivnih blokova umjetne inteligencije i pojava „tvornica umjetne inteligencije“ kao specijaliziranih podatkovnih centara dizajniranih za generativno računalstvo.
"Ovako nastaje inteligencija, nova vrsta tvorničkog generatora tokena, građevnih blokova umjetne inteligencije. Tokeni su otvorili novu granicu", rekao je Huang publici. Naglasio je da tokeni mogu "transformirati slike u znanstvene podatke koji prikazuju vanzemaljske atmosfere", "dekodirati zakone fizike" i "vidjeti bolest prije nego što uzme maha".
Ova vizija predstavlja pomak od tradicionalnog "računalstva dohvata" na "generativno računalstvo", gdje umjetna inteligencija razumije kontekst i generira odgovore umjesto da samo dohvaća unaprijed pohranjene podatke. Prema Huangu, ovaj prijelaz zahtijeva novu vrstu arhitekture podatkovnog centra gdje je "računalo postalo generator tokena, a ne dohvaćanje datoteka."
Blackwell arhitektura donosi ogromne dobitke u performansama
NVIDIA Blackwell GPU arhitektura, sada u "punoj proizvodnji", isporučuje ono što kompanija tvrdi da je "40 puta bolja izvedba od Hoppera" za rezoniranje modela pod identičnim uvjetima napajanja. Arhitektura uključuje podršku za FP4 preciznost, što dovodi do značajnih poboljšanja energetske učinkovitosti.
"ISO snaga, Blackwell je 25 puta", izjavio je Huang, ističući dramatične dobitke učinkovitosti nove platforme.
Blackwellova arhitektura također podržava ekstremno skaliranje putem tehnologija poput NVLink 72, omogućujući stvaranje masivnih, ujedinjenih GPU sustava. Huang je predvidio da će Blackwellove performanse učiniti GPU-ove prethodne generacije znatno manje poželjnima za zahtjevna AI opterećenja.

(Izvor: NVIDIA)
Predvidljivi plan za AI infrastrukturu
NVIDIA je zacrtala redoviti godišnji tempo za svoje inovacije AI infrastrukture, omogućujući korisnicima da planiraju svoja ulaganja s većom sigurnošću:
- Blackwell Ultra (druga polovica 2025.): Nadogradnja na platformu Blackwell s povećanim FLOP-ovima, memorijom i propusnošću.
- Vera Rubin (druga polovica 2026.): Nova arhitektura koja sadrži CPU s udvostručenim performansama, novi GPU i NVLink i memorijske tehnologije sljedeće generacije.
- Rubin Ultra (druga polovica 2027.): Ekstremna skalirana arhitektura koja cilja na 15 exaflopsa računanja po stalku.
Demokratizacija umjetne inteligencije: od umrežavanja do modela
Kako bi ostvarila viziju širokog usvajanja umjetne inteligencije, NVIDIA je najavila sveobuhvatna rješenja koja obuhvaćaju umrežavanje, hardver i softver. Na razini infrastrukture, tvrtka se bavi izazovom povezivanja stotina tisuća ili čak milijuna GPU-a u tvornicama umjetne inteligencije kroz značajna ulaganja u tehnologiju silicijske fotonike. Njihov prvi silicijski fotonski sustav s zajedničkom optikom (CPO), CPO od 1.6 terabita u sekundi koji se temelji na tehnologiji mikro prstenastog rezonatorskog modulatora (MRM), obećava znatnu uštedu energije i povećanu gustoću u usporedbi s tradicionalnim primopredajnicima, omogućujući učinkovitije veze između ogromnog broja GPU-a na različitim mjestima.
Dok gradi temelje za velike AI tvornice, NVIDIA istovremeno donosi AI računalnu snagu pojedincima i manjim timovima. Tvrtka je predstavila novu liniju DGX osobna AI superračunala koja pokreće platforma Grace Blackwell, s ciljem osnaživanja AI programera, istraživača i podatkovnih znanstvenika. Linija uključuje DGX Spark, kompaktnu razvojnu platformu i DGX Station, stolnu radnu stanicu visokih performansi s tekućim hlađenjem i impresivnih 20 petaflopa računala.

NVIDIA DGX Spark (Izvor: NVIDIA)
Nadopunjujući ovaj hardverski napredak, NVIDIA je najavila otvaranje Llama Nemotron obitelj modela sa sposobnostima razmišljanja, dizajniran da bude spreman za poduzeća za naprednu izgradnju AI agenti. Ovi su modeli integrirani u NVIDIA NIM (NVIDIA Inference Microservices), omogućujući programerima da ih implementiraju na različitim platformama od lokalnih radnih stanica do oblaka. Pristup predstavlja kompletno rješenje za usvajanje umjetne inteligencije u poduzećima.
Huang je naglasio da se ove inicijative poboljšavaju opsežnom suradnjom s velikim tvrtkama u više industrija koje integriraju NVIDIA modele, NIM i biblioteke u svoje AI strategije. Ovaj pristup ekosustava ima za cilj ubrzati usvajanje uz pružanje fleksibilnosti za različite potrebe poduzeća i slučajeve korištenja.
Fizička umjetna inteligencija i robotika: prilika od 50 trilijuna dolara
NVIDIA vidi fizičku umjetnu inteligenciju i robotiku kao "priliku od 50 trilijuna dolara", prema Huangu. Tvrtka je najavila NVIDIA Isaac GR00T N1 otvorenog koda, opisanu kao "generalistički temeljni model za humanoidne robote".
Značajna ažuriranja NVIDIA Cosmos svjetskih temeljnih modela pružaju neviđenu kontrolu nad generiranjem sintetičkih podataka za obuku robota pomoću NVIDIA Omniverse. Kao što je Huang objasnio, "Korištenje Omniversea za uvjetovanje Cosmosa i Cosmosa za generiranje beskonačnog broja okruženja, omogućuje nam stvaranje podataka koji su utemeljeni, kontrolirani od nas, a opet sustavno beskonačni u isto vrijeme."
Tvrtka je također predstavila novi fizički motor otvorenog koda nazvan "Newton", razvijen u suradnji s Google DeepMind i Disney Research. Motor je dizajniran za robotsku simulaciju visoke vjernosti, uključujući kruta i meka tijela, taktilnu povratnu informaciju i GPU ubrzanje.

Isaac GR00T N1 (Izvor: NVIDIA)
Agentska umjetna inteligencija i transformacija industrije
Huang je definirao "agentsku umjetnu inteligenciju" kao umjetnu inteligenciju s "agencijom" koja može "percipirati i razumjeti kontekst", "razumjeti" i "planirati i poduzeti akciju", čak i koristeći alate i učeći iz multimodalnih informacija.
"Agentska umjetna inteligencija u osnovi znači da imate umjetnu inteligenciju koja djeluje. Može percipirati i razumjeti kontekst okolnosti. Može razmišljati, što je vrlo važno, može razmišljati o tome kako odgovoriti ili kako riješiti problem, i može planirati i djelovati. Može planirati i poduzeti akciju. Može koristiti alate", objasnio je Huang.
Ova sposobnost pokreće porast računalnih zahtjeva: "Količina računalnih zahtjeva, zakon skaliranja umjetne inteligencije je otporniji i zapravo hiper ubrzan. Količina izračuna koja nam je potrebna u ovom trenutku kao rezultat agentske umjetne inteligencije, kao rezultat rasuđivanja, lako je stotinu puta veća nego što smo mislili da nam je potrebna u ovo vrijeme prošle godine," dodao je.
Bottom Line
Jensen Huang je u svom glavnom govoru na GTC 2025 predstavio sveobuhvatnu viziju budućnosti vođene umjetnom inteligencijom, koju karakteriziraju inteligentni agenti, autonomni roboti i namjenski izgrađene tvornice umjetne inteligencije. NVIDIA-ine najave u području hardverske arhitekture, umrežavanja, softvera i modela otvorenog koda signaliziraju odlučnost tvrtke da pokrene i ubrza sljedeću eru računarstva.
Kako računarstvo nastavlja svoj prelazak s modela temeljenih na pronalaženju podataka na generativne modele, NVIDIA-in fokus na tokene kao osnovnu valutu umjetne inteligencije i na mogućnosti skaliranja na platformama u oblaku, poduzećima i robotici pruža putokaz za budućnost tehnologije, s dalekosežnim implikacijama za industrije diljem svijeta.