Liity verkostomme!

Tekoäly

Beyond Retrieval: NVIDIA Charts Course for the Generative Computing Era

mm

NVIDIA Toimitusjohtaja Jensen Huang ilmoitti uraauurtavista tekoälylaskentaominaisuuksien parannuksista yhtiön kokouksessa. GTC maaliskuu 2025 -puheenvuoro, kuvailee sitä, mitä hän kutsui "1 biljoonan dollarin laskennalliseksi käännepisteeksi". Pääpuhe paljasti tuotantovalmiuden Blackwell GPU-arkkitehtuuri, monivuotinen etenemissuunnitelma tulevaisuuden arkkitehtuureille, suurille läpimurroille tekoälyverkotuksessa, uusille yritystekoälyratkaisuille sekä merkittävälle kehitykselle robotiikassa ja fyysisessä tekoälyssä.

"Token Economy" ja AI Factories

Huangin vision keskiössä on "tokenien" käsite tekoälyn peruspilareina ja "tekoälytehtaiden" syntyminen erikoistuneina datakeskuksina, jotka on suunniteltu generatiivista laskentaa varten.

"Näin syntyy älykkyyttä, uudenlaista tehdasgeneraattoria rahakkeita, tekoälyn rakennuspalikoita. Tokenit ovat avanneet uuden rajan", Huang kertoi yleisölle. Hän korosti, että rahakkeet voivat "muuttaa kuvia tieteellisiksi tiedoiksi, jotka kartoittavat vieraita ilmapiiriä", "dekoodata fysiikan lakeja" ja "nähdä sairauden ennen kuin se tarttuu".

Tämä visio edustaa siirtymistä perinteisestä "hakulaskennasta" "generatiiviseen tietojenkäsittelyyn", jossa tekoäly ymmärtää kontekstin ja tuottaa vastauksia sen sijaan, että se noutaisi esitallennettua dataa. Huangin mukaan tämä siirtymä edellyttää uudenlaista datakeskusarkkitehtuuria, jossa "tietokoneesta on tullut tokenien generaattori, ei tiedostojen haku".

GTC maaliskuu 2025 Keynote NVIDIAn toimitusjohtajan Jensen Huangin kanssa

Blackwell Architecture tarjoaa valtavan suorituskyvyn

NVIDIA Blackwell -grafiikkasuoritinarkkitehtuuri, joka on nyt "täystuotannossa", tarjoaa yrityksen väittämän "40x Hopperin suorituskyvyn" päättelymalleille identtisissä tehoolosuhteissa. Arkkitehtuuri sisältää tuen FP4:n tarkkuudelle, mikä johtaa merkittäviin energiatehokkuuden parannuksiin.

"ISO-teho, Blackwell on 25-kertainen", Huang totesi korostaen uuden alustan dramaattisia tehokkuusetuja.

Blackwellin arkkitehtuuri tukee myös äärimmäistä skaalautuvuutta teknologioiden, kuten NVLink 72:n, avulla, mikä mahdollistaa massiivisten, yhtenäisten GPU-järjestelmien luomisen. Huang ennusti, että Blackwellin suorituskyky tekee edellisen sukupolven GPU:ista huomattavasti vähemmän toivottavia vaativille tekoälytyökuormille.

(Lähde: NVIDIA)

Ennustettava etenemissuunnitelma tekoäly-infrastruktuurille

NVIDIA hahmotteli säännöllisen vuosittaisen tahdin tekoäly-infrastruktuuriinnovaatioilleen, jolloin asiakkaat voivat suunnitella investointejaan varmemmin:

  • Blackwell Ultra (vuoden 2025 toinen puolisko): Päivitys Blackwell-alustalle lisääntyneellä FLOPilla, muistilla ja kaistanleveydellä.
  • Vera Rubin (vuoden 2026 toinen puolisko): Uusi arkkitehtuuri, jossa on prosessori kaksinkertaisella suorituskyvyllä, uusi GPU ja seuraavan sukupolven NVLink- ja muistiteknologiat.
  • Rubin Ultra (vuoden 2027 toinen puolisko): Äärimmäisen skaalautuva arkkitehtuuri, jonka tavoitteena on 15 exaflops laskentaa telinettä kohti.

Demokratisoiva tekoäly: verkottumisesta malleihin

Toteuttaakseen vision laajasta tekoälyn käyttöönotosta NVIDIA julkisti kattavat ratkaisut, jotka kattavat verkottumisen, laitteiston ja ohjelmiston. Infrastruktuuritasolla yritys vastaa haasteeseen yhdistää satoja tuhansia tai jopa miljoonia grafiikkasuorituksia tekoälytehtaissa investoimalla merkittäviin piifotoniikkateknologiaan. Heidän ensimmäinen copacked optics (CPO) piifotonijärjestelmä, 1.6 terabitin sekunnissa CPO, joka perustuu micro ring resonator modulator (MRM) -tekniikkaan, lupaa huomattavia virransäästöjä ja suurempi tiheys verrattuna perinteisiin lähetin-vastaanottimiin, mikä mahdollistaa tehokkaammat yhteydet suurten GPU-määrien välillä eri paikoissa.

Samalla kun NVIDIA rakentaa perustaa suurille tekoälytehtaille, se tuo samalla tekoälyn laskentatehoa yksilöille ja pienemmille ryhmille. Yhtiö esitteli uuden tuotelinjan DGX:n henkilökohtaiset tekoälysupertietokoneet, jotka toimivat Grace Blackwell -alustalla, jonka tarkoituksena on antaa tekoälykehittäjille, tutkijoille ja datatieteilijöille mahdollisuus. Mallistoon kuuluvat DGX Spark, kompakti kehitysalusta, ja DGX Station, korkean suorituskyvyn pöytätietokone, jossa on nestejäähdytys ja vaikuttava 20 petaflopsin laskentaa.

NVIDIA DGX Spark (Lähde: NVIDIA)

Täydentäen näitä laitteiston kehitystä NVIDIA ilmoitti avoimesta Llama Nemotron malliperhe päättelyominaisuuksilla, jotka on suunniteltu yritysvalmiiksi kehittyneiden rakentamiseen AI-agentit. Nämä mallit on integroitu NVIDIA NIM:iin (NVIDIA Inference Microservices), jolloin kehittäjät voivat ottaa ne käyttöön eri alustoilla paikallisista työasemista pilveen. Lähestymistapa edustaa täyden pinon ratkaisua yritysten tekoälyn käyttöönottoon.

Huang korosti, että näitä aloitteita tehostetaan laajalla yhteistyöllä useiden toimialojen suurten yritysten kanssa, jotka integroivat NVIDIA-malleja, NIM:ää ja kirjastoja tekoälystrategioihinsa. Tämän ekosysteemilähestymistavan tavoitteena on nopeuttaa käyttöönottoa ja tarjota samalla joustavuutta eri yritysten tarpeisiin ja käyttötapauksiin.

Fyysinen tekoäly ja robotiikka: 50 biljoonan dollarin mahdollisuus

NVIDIA näkee fyysisen tekoälyn ja robotiikan "50 biljoonan dollarin mahdollisuutena", Huangin mukaan. Yhtiö julkisti avoimen lähdekoodin NVIDIA Isaac GR00T N1:n, jota kuvataan "yleiseksi perusmalliksi humanoidiroboteille".

Merkittävät päivitykset NVIDIA Cosmos World Foundation -malleihin tarjoavat ennennäkemättömän hallinnan synteettisen datan luomiseen robottikoulutukseen NVIDIA Omniversea käyttämällä. Kuten Huang selitti, "Omniversen käyttäminen Cosmoksen ehdoin ja Cosmosin äärettömän määrän ympäristöjen luomiseen antaa meille mahdollisuuden luoda dataa, joka on maadoitettua, meidän hallitsemaamme ja silti systemaattisesti ääretöntä samaan aikaan."

Yhtiö esitteli myös uuden avoimen lähdekoodin fysiikan moottorin nimeltä "Newton", joka on kehitetty yhteistyössä Google DeepMindin ja Disney Researchin kanssa. Moottori on suunniteltu korkealaatuiseen robotiikan simulointiin, mukaan lukien jäykät ja pehmeät rungot, kosketuspalaute ja GPU-kiihdytys.

Isaac GR00T N1 (Lähde: NVIDIA)

Agentin tekoäly ja teollisuuden muutos

Huang määritteli "agentin tekoälyn" tekoälyksi, jossa on "virasto", joka pystyy "näkemään ja ymmärtämään kontekstin", "syyn" ja "suunnittelemaan ja ryhtymään toimiin" jopa käyttämällä työkaluja ja oppimaan multimodaalista tietoa.

"Agentti tekoäly tarkoittaa pohjimmiltaan sitä, että sinulla on tekoäly, jolla on tahdonvoimaa. Se voi havaita ja ymmärtää tilanteen kontekstin. Se voi järkeillä, mikä on erittäin tärkeää, pohtia, miten vastata tai ratkaista ongelma, ja se voi suunnitella ja toimia. Se voi suunnitella ja ryhtyä toimiin. Se voi käyttää työkaluja", Huang selitti.

Tämä kyky kasvattaa laskentavaatimuksia: "Laskentavaatimuksen määrä, tekoälyn skaalauslaki on joustavampi ja itse asiassa hyperkiihdytetty. Laskentamäärä, jota tarvitsemme tässä vaiheessa agentti-AI:n seurauksena, päättelyn seurauksena on helposti sata kertaa enemmän kuin luulimme tarvitsevamme viime vuonna", hän lisäsi.

Bottom Line

Jensen Huangin GTC 2025 -tapahtuman avauspuheenvuoro esitteli kattavan vision tekoälypohjaisesta tulevaisuudesta, jolle ovat ominaisia ​​älykkäät agentit, autonomiset robotit ja tarkoitukseen rakennetut tekoälytehtaat. NVIDIAn laitteistoarkkitehtuuriin, verkottumiseen, ohjelmistoihin ja avoimen lähdekoodin malleihin liittyvät tiedotteet viestivät yhtiön päättäväisyydestä vauhdittaa ja kiihdyttää laskennan seuraavaa aikakautta.

Laskennan siirtyessä edelleen hakupohjaisista generatiivisiin malleihin, NVIDIAn keskittyminen tokeneihin tekoälyn ydinvaluuttana ja skaalausominaisuuksiin pilvi-, yritys- ja robotiikka-alustoilla tarjoaa tiekartan teknologian tulevaisuudelle, jolla on kauaskantoisia vaikutuksia eri toimialoille maailmanlaajuisesti.

Alex McFarland on tekoälytoimittaja ja kirjailija, joka tutkii tekoälyn viimeisintä kehitystä. Hän on tehnyt yhteistyötä lukuisten AI-startup-yritysten ja -julkaisujen kanssa maailmanlaajuisesti.