Artificiell intelligens
Bortom sökning: NVIDIA kartlägger kursen för den generativa datoreran

NVIDIA VD Jensen Huang tillkännagav en rad banbrytande framsteg inom AI-beräkningsförmåga på företagets GTC mars 2025 keynote, där han beskrev vad han kallade en “$1 biljoner beräkningsinflektionspunkt.” Keynoten avslöjade produktionsberedskapen för Blackwell GPU-arkitekturen, en flerårig vägkarta för framtida arkitekturer, stora genombrott inom AI-nätverk, nya företagslösningar för AI och betydande utveckling inom robotik och fysisk AI.
“Token-ekonomin” och AI-fabriker
Central för Huangs vision är begreppet “token” som de grundläggande byggstenarna för AI och uppkomsten av “AI-fabriker” som specialiserade datacenter utformade för generativ databehandling.
“Detta är hur intelligens skapas, en ny typ av fabriksgenerator för token, byggstenarna för AI. Token har öppnat en ny gräns,” sa Huang till publiken. Han betonade att token kan “omvandla bilder till vetenskapliga data som kartlägger främmande atmosfärer”, “avkoda fysikens lagar” och “se sjukdom innan den tar fart.”
Denna vision representerar en skiftning från traditionell “sökningsdatabehandling” till “generativ databehandling”, där AI förstår sammanhang och genererar svar snarare än att bara hämta förinställda data. Enligt Huang kräver denna övergång en ny typ av datacenterarkitektur där “datorn har blivit en generator för token, inte en sökning av filer.”
https://www.youtube.com/watch?v=_waPvOwL9Z8
Blackwell-arkitekturen levererar massiva prestandavinster
NVIDIA Blackwell GPU-arkitekturen, nu i “full produktion”, levererar vad företaget hävdar är “40 gånger prestandan för Hopper” för resonemodeller under identiska effektförhållanden. Arkitekturen innehåller stöd för FP4 precision, vilket leder till betydande förbättringar av energieffektivitet.
“ISO effekt, Blackwell är 25 gånger”, sa Huang, och betonade de dramatiska effektivitetsvinster som den nya plattformen medför.
Blackwell-arkitekturen stöder också extrem skalförstoring genom tekniker som NVLink 72, vilket möjliggör skapandet av massiva, enhetliga GPU-system. Huang förutsåg att Blackwells prestanda kommer att göra tidigare generationers GPU betydligt mindre önskvärda för krävande AI-arbetsbelastningar.
Förutsägbar vägkarta för AI-infrastruktur
NVIDIA presenterade en regelbunden årlig takt för sina AI-infrastrukturinnovationer, vilket möjliggör för kunder att planera sina investeringar med större säkerhet:
- Blackwell Ultra (Andra halvåret 2025): En uppgradering av Blackwell-plattformen med ökad FLOPs, minne och bandbredd.
- Vera Rubin (Andra halvåret 2026): En ny arkitektur med en CPU med dubblad prestanda, en ny GPU och nästa generations NVLink- och minnesteknologier.
- Rubin Ultra (Andra halvåret 2027): En extrem skalförstoring av arkitekturen som syftar till 15 exaflops beräkning per hylla.
Demokratisering av AI: Från nätverk till modeller
För att förverkliga visionen om omfattande AI-användning tillkännagav NVIDIA omfattande lösningar som omfattar nätverk, hårdvara och programvara. På infrastrukturnivå adresserar företaget utmaningen att ansluta hundratusentals eller till och med miljoner GPU:er i AI-fabriker genom betydande investeringar i silikonfotonteknologi. Deras första co-packade optik (CPO) silikonfotonsystem, ett 1,6 terabit per sekund CPO baserat på mikroringresonatormodulator (MRM) teknologi, lovar betydande effektsbesparingar och ökad densitet jämfört med traditionella transceivrar, vilket möjliggör mer effektiva anslutningar mellan massor av GPU:er på olika platser.
Medan man bygger grunden för storskaliga AI-fabriker, bringar NVIDIA samtidigt AI-beräkningskraft till individer och mindre team. Företaget introducerade en ny linje av DGX personliga AI-superdatorer som drivs av Grace Blackwell-plattformen, i syfte att ge AI-utvecklare, forskare och dataforskare makt. Sortimentet inkluderar DGX Spark, en kompakt utvecklingsplattform, och DGX Station, en högpresterande skrivbordsarbetsstation med vätskekylnings- och imponerande 20 petaflops beräkning.

NVIDIA DGX Spark (Source: NVIDIA)










