Kunstig intelligens
Beyond Retrieval: NVIDIA Charts Course for the Generative Computing Era

NVIDIA Administrerende direktør Jensen Huang annonserte en rekke banebrytende fremskritt innen AI-databehandlingsmuligheter på selskapets GTC mars 2025 keynote, og beskrev det han kalte et "$1 billioner databøyningspunkt." Keynoten avslørte produksjonsberedskapen til Blackwell GPU-arkitektur, et flerårig veikart for fremtidige arkitekturer, store gjennombrudd innen AI-nettverk, nye enterprise AI-løsninger og betydelig utvikling innen robotikk og fysisk AI.
"Token Economy" og AI-fabrikkene
Sentralt i Huangs visjon er konseptet med «tokens» som de grunnleggende byggesteinene i AI og fremveksten av «AI-fabrikker» som spesialiserte datasentre designet for generativ databehandling.
"Dette er hvordan intelligens er laget, en ny type fabrikkgenerator av tokens, byggeklossene til AI-tokens har åpnet en ny grense," sa Huang til publikum. Han understreket at tokens kan "forvandle bilder til vitenskapelige data som kartlegger fremmede atmosfærer", "dekode fysikkens lover" og "se sykdom før den tar tak."
Denne visjonen representerer et skifte fra tradisjonell "hentingsdatabehandling" til "generativ databehandling", der AI forstår kontekst og genererer svar i stedet for bare å hente forhåndslagrede data. I følge Huang, krever denne overgangen en ny type datasenterarkitektur der "datamaskinen har blitt en generator av tokens, ikke en henting av filer."
Blackwell Architecture gir enorme ytelsesgevinster
NVIDIA Blackwell GPU-arkitekturen, nå i "full produksjon", leverer det selskapet hevder er "40 ganger ytelsen til Hopper" for resonnerende modeller under identiske strømforhold. Arkitekturen inkluderer støtte for FP4-presisjon, noe som fører til betydelige energieffektiviseringsforbedringer.
"ISO-kraft, Blackwell er 25 ganger," uttalte Huang, og fremhevet de dramatiske effektivitetsgevinstene til den nye plattformen.
Blackwell-arkitekturen støtter også ekstrem oppskalering gjennom teknologier som NVLink 72, noe som muliggjør etableringen av massive, enhetlige GPU-systemer. Huang spådde at Blackwells ytelse vil gjøre tidligere generasjons GPU-er betydelig mindre attraktive for krevende AI-arbeidsbelastninger.

(Kilde: NVIDIA)
Forutsigbart veikart for AI-infrastruktur
NVIDIA skisserte en vanlig årlig tråkkfrekvens for sine AI-infrastrukturinnovasjoner, slik at kundene kan planlegge investeringene sine med større sikkerhet:
- Blackwell Ultra (andre halvdel av 2025): En oppgradering til Blackwell-plattformen med økte FLOP-er, minne og båndbredde.
- Vera Rubin (andre halvdel av 2026): En ny arkitektur med en CPU med doblet ytelse, en ny GPU og neste generasjons NVLink og minneteknologi.
- Rubin Ultra (andre halvdel av 2027): En ekstrem oppskaleringsarkitektur som tar sikte på 15 eksaflops med beregning per stativ.
Demokratisering av kunstig intelligens: Fra nettverk til modeller
For å realisere visjonen om utbredt AI-adopsjon, annonserte NVIDIA omfattende løsninger som spenner over nettverk, maskinvare og programvare. På infrastrukturnivå tar selskapet opp utfordringen med å koble hundretusenvis eller til og med millioner av GPUer i AI-fabrikker gjennom betydelige investeringer i silisiumfotonikteknologi. Deres første co-packaged optikk (CPO) silisium fotonisk system, en 1.6 terabit per sekund CPO basert på mikroring resonator modulator (MRM) teknologi, lover betydelige strømbesparelser og økt tetthet sammenlignet med tradisjonelle transceivere, noe som muliggjør mer effektive tilkoblinger mellom massive antall GPUer på tvers av forskjellige steder.
Mens NVIDIA bygger grunnlaget for storskala AI-fabrikker, bringer NVIDIA samtidig AI-datakraft til enkeltpersoner og mindre team. Selskapet introduserte en ny linje av DGX personlige AI-superdatamaskiner drevet av Grace Blackwell-plattformen, rettet mot å styrke AI-utviklere, forskere og dataforskere. Serien inkluderer DGX Spark, en kompakt utviklingsplattform, og DGX Station, en stasjonær arbeidsstasjon med høy ytelse med væskekjøling og imponerende 20 petaflops med databehandling.

NVIDIA DGX Spark (Kilde: NVIDIA)
Som et supplement til disse maskinvarefremskrittene kunngjorde NVIDIA åpningen Llama Nemotron familie av modeller med resonneringsevner, designet for å være bedriftsklare for avansert bygging AI-agenter. Disse modellene er integrert i NVIDIA NIM (NVIDIA Inference Microservices), slik at utviklere kan distribuere dem på tvers av ulike plattformer fra lokale arbeidsstasjoner til skyen. Tilnærmingen representerer en fullstackløsning for AI-adopsjon for bedrifter.
Huang understreket at disse initiativene blir forbedret gjennom omfattende samarbeid med store selskaper på tvers av flere bransjer som integrerer NVIDIA-modeller, NIM og biblioteker i sine AI-strategier. Denne økosystemtilnærmingen tar sikte på å akselerere adopsjon samtidig som den gir fleksibilitet for ulike bedriftsbehov og brukstilfeller.
Fysisk kunstig intelligens og robotikk: En mulighet på 50 billioner dollar
NVIDIA ser fysisk kunstig intelligens og robotikk som en "$50 billioner mulighet," ifølge Huang. Selskapet kunngjorde åpen kildekode NVIDIA Isaac GR00T N1, beskrevet som en "generalistisk grunnmodell for humanoide roboter."
Betydelige oppdateringer til NVIDIA Cosmos verdensmodeller gir enestående kontroll over syntetisk datagenerering for robottrening ved bruk av NVIDIA Omniverse. Som Huang forklarte, "Å bruke Omniverse til å kondisjonere Cosmos, og Cosmos til å generere et uendelig antall miljøer, lar oss lage data som er jordet, kontrollert av oss og likevel systematisk uendelig på samme tid."
Selskapet avduket også en ny åpen kildekode-fysikkmotor kalt "Newton", utviklet i samarbeid med Google DeepMind og Disney Research. Motoren er designet for simulering av høykvalitetsrobotikk, inkludert stive og myke kropper, taktil tilbakemelding og GPU-akselerasjon.

Isaac GR00T N1 (Kilde: NVIDIA)
Agentisk AI og industritransformasjon
Huang definerte «agent AI» som AI med «byrå» som kan «oppfatte og forstå konteksten», «fornuft» og «planlegge og iverksette tiltak», selv ved å bruke verktøy og lære av multimodal informasjon.
"Agentisk AI betyr i utgangspunktet at du har en AI som kan oppfatte og forstå konteksten til omstendighetene, den kan resonnere om hvordan du skal svare eller hvordan du løser et problem, og den kan planlegge og ta handling," forklarte Huang.
Denne evnen driver frem en økning i beregningskrav: "Mengden av beregningskrav, skaleringsloven til AI er mer spenstig og faktisk hyperakselerert Mengden av beregninger vi trenger på dette tidspunktet som et resultat av resonnement, er lett hundre ganger mer enn vi trodde vi trengte denne tiden i fjor," la han til.
Bunnlinjen
Jensen Huangs hovedtale for GTC 2025 presenterte en omfattende visjon om en AI-drevet fremtid preget av intelligente agenter, autonome roboter og spesialbygde AI-fabrikker. NVIDIAs kunngjøringer på tvers av maskinvarearkitektur, nettverk, programvare og åpen kildekode-modeller signaliserer selskapets besluttsomhet om å drive og akselerere neste æra innen databehandling.
Etter hvert som databehandling fortsetter å gå fra hentebaserte til generative modeller, gir NVIDIAs fokus på tokens som kjernevalutaen til AI og på skaleringsmuligheter på tvers av sky-, bedrifts- og robotplattformer en veikart for fremtidens teknologi, med vidtrekkende implikasjoner for bransjer over hele verden.