Inteligența artificială

Dincolo de recuperare: curs NVIDIA Charts pentru era generativă de calcul

Publicat Martie 19, 2025

Alex McFarland

NVIDIA CEO-ul Jensen Huang a anunțat o serie de progrese inovatoare în domeniul capacităților de calcul bazate pe inteligență artificială la conferința companiei. GTC martie 2025 keynote, descriind ceea ce el a numit un „punct de inflexiune de calcul de 1 trilion de dolari”. Keynote-ul a dezvăluit gradul de pregătire a producției Arhitectura GPU Blackwell, o foaie de parcurs pe mai mulți ani pentru arhitecturile viitoare, descoperiri majore în rețelele AI, noi soluții AI pentru întreprinderi și dezvoltări semnificative în robotică și IA fizică.

„Economia de jetoane” și fabricile AI

Viziunea lui Huang se bazează pe conceptul de „token-uri” ca elemente fundamentale ale inteligenței artificiale și pe apariția „fabricilor de inteligență artificială” ca centre de date specializate, concepute pentru calcul generativ.

"Așa se face inteligența, un nou tip de generator de fabrici de jetoane, blocurile de bază ale AI. Jetoanele au deschis o nouă frontieră", a spus Huang audienței. El a subliniat că jetoanele pot „transforma imaginile în date științifice care prezintă atmosfere extraterestre”, „decodifică legile fizicii” și „văd boala înainte ca aceasta să se instaleze”.

Această viziune reprezintă o trecere de la „calcul de recuperare” tradițional la „calculatul generativ”, în care AI înțelege contextul și generează răspunsuri, mai degrabă decât să preia date pre-stocate. Potrivit lui Huang, această tranziție necesită un nou tip de arhitectură de centru de date în care „calculatorul a devenit un generator de jetoane, nu o recuperare de fișiere”.

GTC martie 2025 Keynote cu CEO-ul NVIDIA Jensen Huang

GTC March 2025 Keynote with NVIDIA CEO Jensen Huang

Watch this video on YouTube

Blackwell Architecture oferă câștiguri masive de performanță

Arhitectura GPU-ului NVIDIA Blackwell, acum în „producție completă”, oferă ceea ce compania susține că este „performanță de 40 ori mai mare decât Hopper” pentru modele de raționament în condiții de putere identice. Arhitectura include suport pentru precizia FP4, ceea ce duce la îmbunătățiri semnificative ale eficienței energetice.

„Puterea ISO, Blackwell este de 25 de ori”, a declarat Huang, subliniind câștigurile dramatice ale eficienței noii platforme.

Arhitectura Blackwell permite, de asemenea, scalarea extremă prin tehnologii precum NVLink 72, permițând crearea unor sisteme GPU masive și unificate. Huang a prezis că performanța Blackwell va face ca GPU-urile din generațiile anterioare să fie semnificativ mai puțin atractive pentru sarcinile de lucru solicitante legate de inteligența artificială.

(Sursa: NVIDIA)

Foaia de parcurs previzibilă pentru infrastructura AI

NVIDIA a subliniat o cadență anuală regulată pentru inovațiile sale în infrastructura AI, permițând clienților să-și planifice investițiile cu o mai mare siguranță:

Blackwell Ultra (a doua jumătate a anului 2025): O actualizare la platforma Blackwell cu FLOP, memorie și lățime de bandă crescute.
Vera Rubin (a doua jumătate a anului 2026): O nouă arhitectură cu un procesor cu performanță dublată, un nou GPU și tehnologii de memorie și NVLink de ultimă generație.
Rubin Ultra (a doua jumătate a anului 2027): O arhitectură de extindere extremă care vizează 15 exaflopi de calcul per rack.

Democratizarea inteligenței artificiale: de la rețea la modele

Pentru a realiza viziunea adoptării pe scară largă a AI, NVIDIA a anunțat soluții cuprinzătoare care acoperă rețele, hardware și software. La nivel de infrastructură, compania abordează provocarea de a conecta sute de mii sau chiar milioane de GPU-uri în fabrici de inteligență artificială prin investiții semnificative în tehnologia fotonică a siliciului. Primul lor sistem fotonic de siliciu cu optică co-ambalată (CPO), un CPO de 1.6 terabit pe secundă bazat pe tehnologia MRM (microring resonator modulator), promite economii substanțiale de energie și densitate crescută în comparație cu transceiver-urile tradiționale, permițând conexiuni mai eficiente între un număr masiv de GPU-uri pe diferite site-uri.

În timp ce construiește baza pentru fabricile de AI la scară largă, NVIDIA oferă simultan putere de calcul AI indivizilor și echipelor mai mici. Compania a introdus o nouă linie de Supercalculatoare personale DGX AI alimentate de platforma Grace Blackwell, care vizează împuternicirea dezvoltatorilor, cercetătorilor și oamenilor de știință de date AI. Gama include DGX Spark, o platformă de dezvoltare compactă și DGX Station, o stație de lucru desktop de înaltă performanță, cu răcire lichidă și o impresionantă 20 de petaflopi de calcul.

NVIDIA DGX Spark (Sursa: NVIDIA)

Completând aceste progrese hardware, NVIDIA a anunțat deschiderea Familia de modele Llama Nemotron cu capacități de raționament, concepute pentru a fi pregătite pentru întreprindere pentru construirea avansată Agenți AI. Aceste modele sunt integrate în NVIDIA NIM (NVIDIA Inference Microservices), permițând dezvoltatorilor să le implementeze pe diverse platforme, de la stațiile de lucru locale la cloud. Abordarea reprezintă o soluție completă pentru adoptarea AI al întreprinderii.

Huang a subliniat că aceste inițiative sunt îmbunătățite prin colaborări extinse cu companii importante din mai multe industrii care integrează modele NVIDIA, NIM și biblioteci în strategiile lor AI. Această abordare ecosistemică își propune să accelereze adoptarea, oferind în același timp flexibilitate pentru diferite nevoi ale întreprinderii și cazuri de utilizare.

AI fizică și robotică: O oportunitate de 50 de trilioane de dolari

NVIDIA vede inteligența artificială fizică și robotica ca o „oportunitate de 50 de trilioane de dolari”, potrivit lui Huang. Compania a anunțat open-source NVIDIA Isaac GR00T N1, descris ca un „model de bază generalist pentru roboții umanoizi”.

Actualizări semnificative ale modelelor de bază ale lumii NVIDIA Cosmos oferă un control fără precedent asupra generării de date sintetice pentru antrenamentul roboților folosind NVIDIA Omniverse. După cum a explicat Huang, „Folosind Omniverse pentru a condiționa Cosmos și Cosmos pentru a genera un număr infinit de medii, ne permite să creăm date care sunt bazate, controlate de noi și totuși sistematic infinite în același timp.”

Compania a dezvăluit, de asemenea, un nou motor de fizică open-source numit „Newton”, dezvoltat în colaborare cu Google DeepMind și Disney Research. Motorul este proiectat pentru simularea robotică de înaltă fidelitate, inclusiv corpuri rigide și moi, feedback tactil și accelerare GPU.

Isaac GR00T N1 (Sursa: NVIDIA)

AI agentic și transformarea industriei

Huang a definit „AI agentic” ca fiind AI cu „agenție” care poate „percepe și înțelege contextul”, „raționa” și „planifica și acționa”, chiar folosind instrumente și învățând din informații multimodale.

"Agentic AI înseamnă, practic, că ai o IA care are acțiune. Poate percepe și înțelege contextul circumstanței. Poate raționa, foarte important, poate raționa despre cum să răspunzi sau cum să rezolvi o problemă și poate să planifice și să acționeze. Poate să planifice și să ia măsuri. Poate folosi instrumente", a explicat Huang.

Această capacitate determină o creștere a cerințelor de calcul: "Cința de calcul, legea de scalare a AI este mai rezistentă și, de fapt, hiperaccelerată. Cantitatea de calcul de care avem nevoie în acest moment ca urmare a AI agentică, ca rezultat al raționamentului, este cu ușurință de o sută de ori mai mare decât am crezut că avem nevoie în această perioadă anul trecut", a adăugat el.

Linia de jos

Discursul principal susținut de Jensen Huang la GTC 2025 a prezentat o viziune cuprinzătoare asupra unui viitor bazat pe inteligență artificială, caracterizat de agenți inteligenți, roboți autonomi și fabrici de inteligență artificială construite special. Anunțurile NVIDIA privind arhitectura hardware, rețelele, software-ul și modelele open-source semnalează hotărârea companiei de a alimenta și accelera următoarea eră a informaticii.

Pe măsură ce tehnologia de calcul continuă să treacă de la modelele bazate pe recuperare de date la modelele generative, concentrarea NVIDIA asupra token-urilor ca monedă de bază a inteligenței artificiale și asupra scalarii capacităților pe platformele cloud, enterprise și robotică oferă o foaie de parcurs pentru viitorul tehnologiei, cu implicații de anvergură pentru industriile din întreaga lume.

Subiecte asemănătoare:tehnica de calcul nvidia

Urmeaza

De ce Web-ul deschis este în pericol în epoca crawlerelor AI

Nu ratați

De la cuvinte la concepte: cât de mari modelele conceptuale redefinesc înțelegerea și generarea limbajului

Alex McFarland

Alex McFarland este jurnalist și scriitor AI care explorează cele mai recente evoluții în inteligența artificială. A colaborat cu numeroase startup-uri și publicații AI din întreaga lume.