Recenzii de cărți
Recenzie de carte: The Thinking Machine: Jensen Huang, NVIDIA și cel mai râvnit microchip din lume de Stephen Witt

The Thinking Machine: Jensen Huang, NVIDIA, și cel mai râvnit microchip din lume se diferențiază de majoritatea cărților scrise despre inteligență artificială, deoarece abordează subiectul dintr-o direcție pe care mulți cititori tehnici, inclusiv eu, am subestimat-o istoric.
La fel ca mulți oameni care au urmărit inteligența artificială de-a lungul anilor, înțelegerea mea despre domeniu a fost modelată de repere familiare. Povestea începe de obicei în 1956, cu workshop-ul de la Dartmouth, trece prin sisteme simbolice timpurii, apoi sare înainte la momente de referință, cum ar fi IBM’s Deep Blue învingându-l pe Garry Kasparov, DeepMind stăpânind jocul Go și, mai recent, OpenAI demonstrând că modelele de limbaj mari pot coordona strategia în medii complexe de jocuri multiplayer. Aceste momente sunt intelectual satisfăcătoare și ușor de reținut, deoarece se concentrează pe victorii vizibile.
Ceea ce face cartea lui Stephen Witt excepțional de bine este să conteste această abordare. În loc de a se concentra pe momentele în care inteligența artificială a impresionat lumea, The Thinking Machine se concentrează pe stratul mai puțin vizibil de sub aceste realizări. El argumentează, convingător, că era modernă a inteligenței artificiale nu a fost deblocată în primul rând de idei inteligente, ci de o schimbare fundamentală în modul în care computarea însăși a fost realizată.
Prin centrarea narativului pe NVIDIA (NVDA -0.92%) și co-fondatorul său Jensen Huang, Witt reframează revoluția inteligenței artificiale ca o poveste despre arhitectura calculatoarelor, ecosistemele dezvoltatorilor și viziunea pe termen lung. Rezultatul nu este doar o biografie corporativă, ci un capitol lipsă în istoria mai largă a inteligenței artificiale.
De la jocuri video la un nou paradigma de calcul
Începuturile NVIDIA sunt departe de ambițiile înalte asociate acum cu inteligența artificială. Compania a apărut în 1993 ca producător de cipuri grafice, concentrat pe renderizarea lumilor de joc video din ce în ce mai realiste. Provocarea de atunci nu era inteligența, ci viteza. Jocurile necesitau o cantitate uriașă de calcule pentru a fi efectuate instantaneu, pentru a simula lumina, mișcarea și adâncimea.
Soluția pe care NVIDIA a urmat-o a fost calculul paralel. Calculul paralel înseamnă efectuarea mai multor calcule în același timp, în loc de a le executa secvențial. În loc de a se baza pe un singur nucleu puternic care procesează o instrucțiune după alta, GPU-urile folosesc mii de nuclee mai mici care lucrează simultan la operații matematice similare. Acest abordare este deosebit de puternică pentru sarcinile de lucru care implică repetarea acelorași calcule pe seturi de date mari.
Inițial, această arhitectură a fost construită pentru grafică. Cu toate acestea, Witt arată cum această decizie a creat, în mod tacit, fundația ideală pentru rețelele neuronale, cu zeci de ani înainte. Antrenarea modelelor moderne de inteligență artificială implică un număr imens de operații matematice identice, aplicate pe cantități uriașe de date. GPU-urile erau deja optimizate pentru exact acest tip de lucru.
Ceea ce face această parte a cărții convingătoare este modul în care Witt conectează clar deciziile de design tehnic cu supraviețuirea. NVIDIA nu a ales calculul paralel pentru că a prevăzut inteligența artificială. A ales-o pentru că a fost singurul mod de a concura în grafică în timp real. Această necesitate a forțat compania să stăpânească un model de calcul care avea să se dovedească transformațional, mult dincolo de jocuri.
Jensen Huang și gândirea în sisteme, nu în produse
În centrul acestei povești se află Jensen Huang, prezentat nu ca un executiv convențional, ci ca cineva care a gândit întotdeauna în sisteme, nu în produse individuale. Witt îl prezintă pe Huang ca fiind exigent, intens și adesea dificil, dar și remarcabil de consecvent în modul în care a privit tehnologia pe perioade lungi de timp.
În timp ce competitorii tratau GPU-urile ca componente de aruncat, legate de ciclurile de jocuri, Huang le-a tratat ca fundația unei platforme de calcul mai largi. Această distincție devine critică. Produsele sunt înlocuite. Platformele se acumulează.
În interior, NVIDIA a reflectat această mentalitate. Inginerii erau încurajați să gândească cu ani înainte. Software-ul a fost tratat ca fiind la fel de important strategic ca și siliciul. Investițiile au fost făcute în instrumente și suport pentru dezvoltatori, cu mult înainte de a exista o cerere clară. Multe dintre aceste alegeri păreau excesive sau inutile la momentul respectiv. În retrospectivă, ele au creat un avantaj durabil care s-a extins mult dincolo de performanța brută.
Witt face clar că ascensiunea NVIDIA nu a fost inevitabilă. Compania a fost aproape de eșec de mai multe ori. Ceea ce a dus-o mai departe nu a fost o singură descoperire, ci o credință susținută că calculul accelerat va conta, în cele din urmă, mult dincolo de cazul său de utilizare inițial.
CUDA și povestea originii inteligenței artificiale pe care mulți au pierdut-o
Una dintre cele mai importante contribuții ale The Thinking Machine este modul în care reframează rolul CUDA în istoria inteligenței artificiale.
Înainte de a citi această carte, este ușor să consideri CUDA ca fiind doar un instrument de dezvoltator de succes. Witt arată de ce merită mult mai multă atenție. CUDA a fost creat pentru a face calculul paralel utilizabil în afara graficii. Înainte de CUDA, utilizarea GPU-urilor pentru calcul general a necesitat forțarea problemelor prin interfețe specifice graficii. Acest lucru a fost fragil, ineficient și limitat la specialiști.
CUDA a schimbat acest lucru, permițând dezvoltatorilor să programeze GPU-urile folosind modele de programare familiare. Mii de nuclee de calcul au devenit accesibile ca resursă generală. Acest lucru a redus bariera de intrare pentru calculul de înaltă performanță într-un mod pe care puțini oameni l-au apreciat pe deplin la momentul respectiv.
Acesta este punctul în care cartea a rezonat puternic cu propria mea experiență de învățare a istoriei inteligenței artificiale. Narativa pe care am absorbit-o s-a concentrat puternic pe modele și algoritmi. Ceea ce The Thinking Machine face clar este că multe dintre aceste idei nu au devenit practice decât atunci când cercetătorii au putut, într-adevăr, să le antreneze la scară.
Cercetătorii în inteligență artificială au recunoscut rapid că rețelele neuronale erau un mecanism aproape perfect pentru calculul paralel. Antrenarea implică repetarea acelorași operații pe seturi de date mari, ajustând milioane sau miliarde de parametri pe parcursul timpului. CUDA a permis acest proces să aibă loc mai rapid, mai ieftin și mai fiabil decât procesoarele CPU ar fi putut vreodată.
Acest lucru a devenit mai important pe măsură ce învățarea profundă s-a accelerat și, ulterior, pe măsură ce modelele bazate pe transformatori au apărut. Transformatorii prosperă pe scară. Fără accelerarea GPU, multe dintre modelele care definesc peisajul actual al inteligenței artificiale ar fi rămas teoretice sau prohibitiv de scumpe. CUDA nu a inventat aceste arhitecturi, dar a făcut posibilă evoluția lor rapidă.
Ceea ce Witt captează deosebit de bine este că acest rezultat nu a fost pe deplin planificat. CUDA a fost construit pentru calcul științific. Cercetătorii în inteligență artificială au descoperit puterea sa și au tras NVIDIA în centrul cursei inteligenței artificiale.
Infrastructură peste algoritmi
Una dintre cele mai valoroase perspective ale cărții este că progresul inteligenței artificiale este limitat la fel de mult de infrastructură, cât și de idei. Multe relatări populare se concentrează pe algoritmi, trucuri de antrenament și seturi de date. The Thinking Machine amintește cititorului că niciuna dintre acestea nu contează fără suficientă putere de calcul.
Din această perspectivă, boom-ul modern de inteligență artificială pare mai puțin brusc și mai întârziat. Rețelele neuronale au existat timp de decenii. Ceea ce s-a schimbat a fost disponibilitatea hardware-ului capabil să le antreneze la o scară semnificativă.
NVIDIA nu a furnizat doar cipuri mai rapide. A construit un ecosistem de hardware, biblioteci de software și instrumente pentru dezvoltatori care s-au întărit reciproc în timp. Pe măsură ce cercetătorii și-au optimizat lucrul pentru platformele NVIDIA, NVIDIA a rafinat produsele sale pentru a servi mai bine sarcinile de inteligență artificială. Acest buclă de feedback a creat un avantaj durabil care s-a extins mult dincolo de performanța brută.
Cartea subliniază, în mod tacit, o realitate care devine din ce în ce mai evidentă astăzi: conducerea în inteligență artificială este modelată de lanțuri de aprovizionare, capacități de producție, ecosisteme de software și controlul platformei, nu doar de geniul în cercetare.
Viziune, risc și consecințe cumulative
Witt nu evită implicațiile dominanței NVIDIA. Pe măsură ce compania devine fundamentală pentru infrastructura globală de inteligență artificială, influența sa crește în mod corespunzător. Credința lui Jensen Huang că calculul accelerat va defini următoarea fază a progresului tehnologic se regăsește pe tot parcursul cărții.
În loc de a moraliza, The Thinking Machine se concentrează pe modul în care deciziile inginerești și strategice consecvente au cumulat efecte în timp. NVIDIA nu a câștigat urmând tendințele. A câștigat prin angajamentul său timpuriu față de calculul paralel, prin supraviețuirea repetată a ciclurilor de piață și prin investiții neîncetate în instrumentele care au făcut hardware-ul său indispensabil.
Pentru cititorii care doresc să înțeleagă cum a evoluat, în realitate, inteligența artificială
Pentru cititorii care deja cunosc momentele cheie ale istoriei inteligenței artificiale, această carte umple stratul lipsă de sub acestea. Ea explică de ce acele descoperiri au putut fi scalează atunci când au făcut-o și de ce NVIDIA a apărut ca o forță atât de centrală în acest proces.
Acesta este un volum pentru cititorii care doresc să înțeleagă inteligența artificială ca un sistem industrial, mai degrabă decât o colecție de modele inteligente. Va rezona puternic cu cei interesați de cipuri, centre de date și deciziile inginerești invizibile care modelează, în mod tacit, puterea tehnologică.
The Thinking Machine reușește pentru că reframează povestea inteligenței artificiale de la bază, arătând cum calculul paralel, platformele dezvoltatorilor și viziunea pe termen lung au construit fundația pe care se sprijină inteligența artificială modernă.












