Liity verkostomme!

Kirja-arvostelut

Kirja-arvostelu: Ajattelukone: Jensen Huang, NVIDIA ja maailman halutuin mikrosiru, kirjoittanut Stephen Witt

mm

Ajatteleva kone: Jensen Huang, NVIDIA ja maailman halutuin mikrosiru erottuu useimmista tekoälyä käsittelevistä kirjoista, koska se lähestyy aihetta suunnasta, jota monet teknisesti taitavat lukijat, minä mukaan lukien, ovat historiallisesti alipainottaneet.

Kuten monien tekoälyä vuosia seuranneiden ihmisten tavoin, myös minun ymmärrystäni alasta ovat muokanneet tutut virstanpylväät. Tarina alkaa yleensä 1956 Dartmouthin työpajan kanssa, kulkee läpi varhaisten symbolisten järjestelmien ja hyppää sitten eteenpäin merkittäviin hetkiin, kuten IBM:n Deep Blue voitti Garri Kasparovin, DeepMind-masterointi Goja viime aikoina OpenAI on osoittanut, että suuret kielimallit voivat koordinoida strategiaa monimutkaisissa moninpeliympäristöissä. Nämä hetket ovat älyllisesti tyydyttäviä ja helppoja muistaa, koska ne keskittyvät näkyviin voittoihin.

Stephen Wittin kirja onnistuu poikkeuksellisen hyvin kyseenalaistamaan tuon rajauksen. Sen sijaan, että keskityttäisiin hetkiin, jolloin tekoäly teki vaikutuksen maailmaan, Ajattelukone keskittyy näiden saavutusten alla olevaan vähemmän näkyvään kerrokseen. Se väittää vakuuttavasti, että nykyaikaista tekoälyaikakautta eivät avanneet ensisijaisesti pelkästään nerokkaat ideat, vaan perustavanlaatuinen muutos laskennan suorittamistavassa.

Keskittämällä tarinan NVIDIAan (NVDA + 0.47%) ja sen perustajajäsen Jensen Huangin kanssa Witt muotoilee tekoälyvallankumouksen uudelleen tarinaksi laskenta-arkkitehtuurista, kehittäjäekosysteemeistä ja pitkäaikaisesta vakaumuksesta. Tuloksena ei ole vain yrityksen elämäkerta, vaan puuttuva luku tekoälyn laajemmasta historiasta.

Videopeleistä uuteen tietotekniikan paradigmaan

NVIDIAn alku on kaukana niistä ylevistä tavoitteista, joita tekoälyyn nykyään liitetään. Yhtiö syntyi vuonna 1993 grafiikkasirujen valmistajana, joka keskittyi yhä realistisempien videopelimaailmojen renderöintiin. Haasteena ei tuolloin ollut älykkyys, vaan nopeus. Pelit vaativat valtavan määrän laskelmia suoritettavaksi välittömästi valon, liikkeen ja syvyyden simuloimiseksi.

NVIDIAn käyttämä ratkaisu oli rinnakkaislaskenta. Rinnakkaislaskenta tarkoittaa useiden laskutoimitusten suorittamista samanaikaisesti peräkkäisen suorittamisen sijaan. Sen sijaan, että näytönohjaimet luottaisivat yhteen tehokkaaseen ytimeen, joka käsittelee käskyjä toisensa jälkeen, ne käyttävät tuhansia pienempiä ytimiä, jotka työskentelevät samanaikaisesti samanlaisten matemaattisten operaatioiden parissa. Tämä lähestymistapa on erityisen tehokas työkuormissa, joissa samoja laskutoimituksia toistetaan suurissa tietojoukoissa.

Alun perin tämä arkkitehtuuri rakennettiin grafiikkaa varten. Witt kuitenkin osoittaa, kuinka tämä päätös loi hiljaisesti ihanteellisen perustan neuroverkoille vuosikymmeniä myöhemmin. Nykyaikaisten tekoälymallien kouluttaminen sisältää valtavan määrän identtisiä matemaattisia operaatioita, joita sovelletaan valtaviin tietomääriin. Näytönohjaimet oli jo optimoitu juuri tällaiseen työhön.

Kirjan tämän osan tekee kiehtovaksi se, miten selkeästi Witt yhdistää tekniset suunnitteluvalinnat selviytymiseen. NVIDIA ei valinnut rinnakkaislaskentaa siksi, että se ennakoi tekoälyn. Se valitsi sen, koska se oli ainoa tapa kilpailla reaaliaikaisessa grafiikassa. Tämä pakko pakotti yrityksen hallitsemaan laskentamallin, joka myöhemmin osoittautuisi mullistavaksi paljon pelaamista pidemmälle.

Jensen Huang ja ajattelu systeemeissä, ei tuotteissa

Tämän tarinan keskiössä on Jensen Huang, jota ei kuvata perinteisenä johtajana, vaan henkilönä, joka johdonmukaisesti ajatteli systeemeissä yksittäisten tuotteiden sijaan. Witt esittää Huangin vaativana, intensiivisenä ja usein vaikeana, mutta myös huomattavan johdonmukaisena siinä, miten hän suhtautui teknologiaan pitkien ajanjaksojen aikana.

Vaikka kilpailijat pitivät näytönohjaimia kertakäyttöisinä, pelisykleihin sidottuina komponentteina, Huang piti niitä laajemman laskenta-alustan perustana. Tästä erosta tulee ratkaiseva. Tuotteet korvataan. Alustat yhdistyvät.

Sisäisesti NVIDIA heijasteli tätä ajattelutapaa. Insinöörejä kannustettiin ajattelemaan vuosia eteenpäin. Ohjelmistoja pidettiin strategisesti yhtä tärkeinä kuin piisiruja. Työkaluihin ja kehittäjätukeen investoitiin kauan ennen kuin selkeää kysyntää oli. Monet näistä valinnoista vaikuttivat tuolloin liialliselta tai tarpeettomilta. Jälkikäteen ajateltuna ne loivat vallihaudan, jota kilpailijoiden oli vaikea ylittää.

Witt tekee selväksi, että NVIDIAn nousu ei ollut väistämätön. Yhtiö oli lähellä epäonnistumista useammin kuin kerran. Sitä eteenpäin vei ei yksittäinen läpimurto, vaan jatkuva usko siihen, että kiihdytetyllä laskennalla olisi lopulta merkitystä paljon alkuperäistä käyttötarkoitustaan ​​laajemmalle.

CUDA ja tekoälyn alkuperätarina, joka monilta jäi huomaamatta

Yksi tärkeimmistä panoksista Ajattelukone on se, miten se muotoilee uudelleen CUDAn roolin tekoälyn historiassa.

Ennen tämän kirjan lukemista on helppo ajatella CUDA yksinkertaisesti onnistuneena kehitystyökaluna. Witt osoittaa, miksi se ansaitsee paljon enemmän huomiota. CUDA luotiin mahdollistamaan rinnakkaislaskennan käyttö grafiikan ulkopuolella. Ennen CUDAa näytönohjainten käyttö yleiseen laskentaan edellytti ongelmien pakottamista grafiikkakohtaisten käyttöliittymien kautta. Tämä oli haurasta, tehotonta ja rajoittunut asiantuntijoille.

CUDA muutti tilanteen sallimalla kehittäjien ohjelmoida näytönohjaimia tutuilla ohjelmointimalleilla. Tuhansista laskentaytimistä tuli yleisen resurssin saataville. Tämä madalsi suurteholaskennan markkinoille tulon kynnystä tavalla, jota harvat ihmiset tuolloin täysin ymmärsivät.

Tässä kohtaa kirja resonoi vahvasti omien kokemuksieni kanssa tekoälyn historian oppimisesta. Sisällyttämäni kertomus keskittyi vahvasti malleihin ja algoritmeihin. Mitä Ajattelukone tekee selväksi, että monet näistä ideoista tulivat käytännöllisiksi vasta, kun tutkijat pystyivät todella kouluttamaan niitä mittakaavassa.

Tekoälytutkijat ymmärsivät nopeasti, että neuroverkot sopivat lähes täydellisesti rinnakkaislaskentaan. Koulutus tarkoittaa samojen operaatioiden toistamista suurissa tietojoukoissa, miljoonien tai miljardien parametrien säätämistä ajan kuluessa. CUDA mahdollisti tämän prosessin nopeamman, halvemman ja luotettavamman suorittamisen kuin mitä suorittimet koskaan kykenisivät tekemään.

Tästä tuli erityisen tärkeää syväoppimisen kiihtyessä ja myöhemmin transformer-pohjaisten mallien syntyessä. Transformers menestyvät skaalautuvasti. Ilman GPU-kiihdytystä monet nykyistä tekoälymaisemaa määrittelevistä malleista olisivat jääneet teoreettisiksi tai kohtuuttoman kalliiksi. CUDA ei keksinyt näitä arkkitehtuureja, mutta se mahdollisti niiden nopean kehityksen.

Witt kiteyttää erityisen hyvin sen, ettei tätä lopputulosta ollut täysin suunniteltu. CUDA rakennettiin tieteellistä laskentaa varten. Tekoälytutkijat löysivät sen tehon ja nostivat NVIDIAn tekoälykilpailun keskiöön.

Infrastruktuuri algoritmien yli

Yksi kirjan arvokkaimmista oivalluksista on, että tekoälyn kehitystä rajoittavat yhtä lailla infrastruktuuri kuin ideatkin. Monet suositut teokset keskittyvät algoritmeihin, koulutuskikkoihin ja datajoukkoihin. Ajattelukone muistuttaa lukijaa, ettei mikään näistä ole merkityksellinen ilman riittävää laskentaa.

Tästä näkökulmasta katsottuna moderni tekoälybuumi vaikuttaa vähemmän äkilliseltä ja viivästyneemmältä. Neuroverkot olivat olemassa vuosikymmeniä. Se, mikä muuttui, oli laitteiston saatavuus, joka kykeni kouluttamaan niitä mielekkäässä mittakaavassa.

NVIDIA ei ainoastaan ​​tarjonnut nopeampia siruja. Se rakensi ekosysteemin laitteistoista, ohjelmistokirjastoista ja kehitystyökaluista, jotka vahvistivat toisiaan ajan myötä. Tutkijoiden optimoidessa työtään NVIDIA-alustoille, NVIDIA jalosti tuotteitaan palvelemaan paremmin tekoälykuormia. Tämä takaisinkytkentäsilmukka loi kestävän edun, joka ulottui paljon raakaa suorituskykyä pidemmälle.

Kirja hiljaa korostaa todellisuutta, joka on nykyään yhä ilmeisempi: tekoälyn johtajuutta muokkaavat toimitusketjut, valmistuskapasiteetti, ohjelmistoekosysteemit ja alustanhallinta, eivätkä pelkästään tutkimuksen nerokkuus.

Visio, riski ja kasautuvat seuraukset

Witt ei kaihda NVIDIAn valta-aseman seurauksia. Yrityksen muodostuessa globaalin tekoälyinfrastruktuurin perustaksi sen vaikutusvalta kasvaa vastaavasti. Jensen Huangin uskomus siitä, että kiihtyvä laskenta määrittelee teknologisen kehityksen seuraavan vaiheen, kulkee läpi kirjan.

Moralisoinnin sijaan, Ajattelukone keskittyy siihen, miten johdonmukaiset suunnittelu- ja strategiset päätökset kasaantuivat ajan myötä. NVIDIA ei voittanut jahtaamalla trendejä. Se voitti sitoutumalla varhaisessa vaiheessa rinnakkaislaskentaan, kestämällä toistuvia markkinasyklejä ja investoimalla väsymättä työkaluihin, jotka tekivät sen laitteistosta korvaamattoman.

Lukijoille, jotka haluavat ymmärtää, miten tekoäly todella skaalautuu

Lukijoille, jotka jo tuntevat otsikon hetket Tekoälyn historiaTämä kirja täyttää niiden alla olevan puuttuvan kerroksen. Se selittää, miksi nuo läpimurrot saattoivat skaalautua juuri silloin, kun ne skaalautuivat, ja miksi NVIDIAsta tuli niin keskeinen voima tässä prosessissa.

Tämä kirja on tarkoitettu lukijoille, jotka haluavat ymmärtää tekoälyn teollisena järjestelmänä pikemminkin kuin kokoelmana älykkäitä malleja. Se vetoaa voimakkaasti niihin, jotka ovat kiinnostuneita siruista, datakeskuksista ja usein näkymättömistä teknisistä päätöksistä, jotka hiljaa muokkaavat teknologista valtaa.

Ajattelukone onnistuu, koska se muotoilee tekoälyn tarinan uudelleen perusasioista alkaen ja osoittaa, kuinka rinnakkaislaskenta, kehittäjäalustat ja pitkän aikavälin visio rakensivat perustan, jolle moderni tekoäly nyt seisoo.

Antoine on Unite.AI:n visionäärinen johtaja ja perustajakumppani, jota ohjaa horjumaton intohimo tekoälyn ja robotiikan tulevaisuuden muotoiluun ja edistämiseen. Sarjayrittäjänä hän uskoo, että tekoäly on yhtä tuhoisa yhteiskunnalle kuin sähkö, ja hänet jää usein raivoamaan häiritsevien teknologioiden ja AGI:n mahdollisuuksista.

Kuten futurist, hän on omistautunut tutkimaan, kuinka nämä innovaatiot muokkaavat maailmaamme. Lisäksi hän on perustaja Securities.io, foorumi, joka keskittyy investoimaan huipputeknologiaan, joka määrittelee uudelleen tulevaisuuden ja muokkaa kokonaisia ​​toimialoja.