Ulasan buku

Ulasan Buku: The Thinking Machine: Jensen Huang, NVIDIA, dan Mikrochip Paling Diburu di Dunia oleh Stephen Witt

mm

The Thinking Machine: Jensen Huang, NVIDIA, dan Mikrochip Paling Diburu di Dunia berbeda dari kebanyakan buku tentang kecerdasan buatan karena pendekatannya yang unik, yaitu dari sudut pandang yang banyak dibaca oleh pembaca yang memiliki latar belakang teknis, termasuk saya.

Bagi banyak orang yang telah mengikuti perkembangan kecerdasan buatan selama bertahun-tahun, pemahaman saya tentang bidang ini dibentuk oleh tonggak-tonggak yang familiar. Cerita biasanya dimulai pada 1956 dengan workshop Dartmouth, kemudian melalui sistem simbolik awal, lalu melompat ke momen-momen penting seperti Deep Blue mengalahkan Garry Kasparov, DeepMind menguasai Go, dan baru-baru ini OpenAI menunjukkan bahwa model bahasa besar dapat mengkoordinasikan strategi dalam lingkungan multipemain yang kompleks. Momen-momen ini secara intelektual memuaskan dan mudah diingat karena mereka berfokus pada kemenangan yang terlihat.

Apa yang dilakukan oleh buku Stephen Witt sangat baik adalah menantang kerangka itu. Alih-alih fokus pada saat-saat ketika kecerdasan buatan mengesankan dunia, The Thinking Machine fokus pada lapisan yang kurang terlihat di bawah prestasi tersebut. Buku ini berargumen, secara persuasif, bahwa era kecerdasan buatan modern tidak dibuka terutama oleh ide-ide cerdas saja, tetapi oleh perubahan mendasar dalam cara komputasi itu sendiri dilakukan.

Dengan memfokuskan narasi pada NVIDIA (NVDA +1.3%) dan co-founder Jensen Huang, Witt merangkum revolusi kecerdasan buatan sebagai cerita tentang arsitektur komputasi, ekosistem pengembang, dan visi jangka panjang. Hasilnya bukan hanya biografi perusahaan, tetapi bab yang hilang dalam sejarah kecerdasan buatan yang lebih luas.

Dari Permainan Video ke Paradigma Komputasi Baru

Awal mula NVIDIA sangat jauh dari ambisi tinggi yang sekarang dikaitkan dengan kecerdasan buatan. Perusahaan muncul pada 1993 sebagai pembuat chip grafis, fokus pada rendering dunia permainan video yang semakin realistis. Tantangan pada saat itu bukanlah kecerdasan, tetapi kecepatan. Permainan memerlukan jumlah perhitungan yang sangat besar untuk dilakukan secara instan untuk mensimulasikan cahaya, gerakan, dan kedalaman.

Solusi yang dikejar oleh NVIDIA adalah komputasi paralel. Komputasi paralel berarti melakukan banyak perhitungan secara bersamaan, bukan secara berurutan. Alih-alih mengandalkan inti prosesor yang kuat yang memproses satu instruksi setelah instruksi lain, GPU menggunakan ribuan inti yang lebih kecil yang bekerja secara bersamaan pada operasi matematika yang sama. Pendekatan ini sangat kuat untuk beban kerja yang melibatkan pengulangan perhitungan yang sama di seluruh dataset yang besar.

Semula, arsitektur ini dibangun untuk grafis. Namun, Witt menunjukkan bagaimana keputusan ini secara diam-diam menciptakan fondasi ideal untuk jaringan saraf beberapa dekade kemudian. Pelatihan model kecerdasan buatan modern melibatkan jumlah perhitungan yang sangat besar yang identik yang diterapkan di seluruh dataset yang sangat besar. GPU sudah dioptimalkan untuk jenis pekerjaan tersebut.

Apa yang membuat bagian buku ini menarik adalah bagaimana Witt dengan jelas menghubungkan pilihan desain teknis dengan kelangsungan hidup. NVIDIA tidak memilih komputasi paralel karena mereka meramalkan kecerdasan buatan. Mereka memilihnya karena itu adalah satu-satunya cara untuk bersaing dalam grafis waktu nyata.

Jensen Huang dan Berpikir dalam Sistem, Bukan Produk

Di pusat cerita ini adalah Jensen Huang, digambarkan tidak sebagai eksekutif konvensional, tetapi sebagai seseorang yang konsisten berpikir dalam sistem, bukan produk individual. Witt menggambarkan Huang sebagai orang yang menuntut, intens, dan sering sulit, tetapi juga luar biasa konsisten dalam cara dia memandang teknologi selama periode waktu yang lama.

Sementara kompetitor memperlakukan GPU sebagai komponen yang dapat dibuang yang terkait dengan siklus permainan, Huang memperlakukan mereka sebagai fondasi platform komputasi yang lebih luas. Perbedaan ini menjadi kritis. Produk digantikan. Platform berkompoun.

Secara internal, NVIDIA mencerminkan pola pikir ini. Insinyur didorong untuk berpikir ke depan beberapa tahun. Perangkat lunak diperlakukan sebagai strategis penting seperti silikon. Investasi dilakukan dalam tooling dan dukungan pengembang jauh sebelum ada permintaan yang jelas. Banyak dari pilihan ini tampak berlebihan atau tidak perlu pada saat itu. Dalam retrospeksi, mereka menciptakan parit yang kompetitor lain sulit untuk menyeberangi.

Witt menjelaskan bahwa kenaikan NVIDIA tidaklah tak terhindarkan. Perusahaan ini hampir gagal lebih dari satu kali. Apa yang membawa mereka maju bukanlah satu temuan, tetapi keyakinan yang berkelanjutan bahwa komputasi yang dipercepat akhirnya akan menjadi penting di luar kasus penggunaan awal.

CUDA dan Kisah Asal Kecerdasan Buatan yang Banyak Dilupakan

Salah satu kontribusi paling penting dari The Thinking Machine adalah bagaimana buku ini merangkum kembali peran CUDA dalam sejarah kecerdasan buatan.

Sebelum membaca buku ini, mudah untuk berpikir bahwa CUDA hanya sebagai alat pengembang yang sukses. Witt menunjukkan mengapa CUDA layak mendapatkan perhatian lebih. CUDA dibuat untuk membuat komputasi paralel dapat digunakan di luar grafis. Sebelum CUDA, menggunakan GPU untuk komputasi umum memerlukan memaksa masalah melalui antarmuka khusus grafis. Ini rapuh, tidak efisien, dan terbatas pada spesialis.

CUDA mengubah itu dengan memungkinkan pengembang untuk memprogram GPU menggunakan model pemrograman yang familiar. Ribuan inti komputasi menjadi tersedia sebagai sumber daya umum. Ini menurunkan hambatan untuk memasuki komputasi kinerja tinggi dengan cara yang sedikit orang sepenuhnya menghargai pada saat itu.

Ini adalah tempat di mana buku ini sangat beresonansi dengan pengalaman saya sendiri dalam mempelajari sejarah kecerdasan buatan. Narasi yang saya serap berfokus berat pada model dan algoritma. Apa yang The Thinking Machine buat jelas adalah bahwa banyak dari ide-ide itu hanya menjadi praktis sekali peneliti dapat benar-benar melatih mereka dalam skala.

Peneliti kecerdasan buatan dengan cepat mengakui bahwa jaringan saraf hampir sempurna cocok untuk komputasi paralel. Pelatihan melibatkan pengulangan operasi yang sama di seluruh dataset yang besar, menyesuaikan jutaan atau milyaran parameter dari waktu ke waktu. CUDA memungkinkan proses ini terjadi lebih cepat, lebih murah, dan lebih andal daripada CPU.

Ini menjadi sangat penting ketika pembelajaran dalam mengambil alih dan kemudian ketika model berbasis transformer muncul. Transformer berkembang dalam skala. Tanpa percepatan GPU, banyak model yang mendefinisikan lanskap kecerdasan buatan saat ini akan tetap teoretis atau sangat mahal. CUDA tidak menemukan arsitektur ini, tetapi membuat evolusi mereka yang cepat menjadi mungkin.

Apa yang Witt tangkap dengan sangat baik adalah bahwa hasil ini tidak sepenuhnya direncanakan. CUDA dibangun untuk komputasi ilmiah. Peneliti kecerdasan buatan menemukan kekuatannya dan menarik NVIDIA ke pusat perlombaan kecerdasan buatan.

Infrastruktur Lebih Penting daripada Algoritma

Salah satu wawasan paling berharga dari buku ini adalah bahwa kemajuan kecerdasan buatan dibatasi oleh infrastruktur serta oleh ide. Banyak akun populer berfokus pada algoritma, trik pelatihan, dan dataset. The Thinking Machine mengingatkan pembaca bahwa tidak satu pun dari hal-hal tersebut yang penting tanpa komputasi yang cukup.

Dari perspektif ini, boom kecerdasan buatan modern tampak kurang tiba-tiba dan lebih tertunda. Jaringan saraf telah ada selama dekade. Apa yang berubah adalah ketersediaan perangkat keras yang dapat melatih mereka dalam skala yang bermakna.

NVIDIA tidak hanya menyediakan chip yang lebih cepat. Mereka membangun ekosistem perangkat keras, perpustakaan perangkat lunak, dan alat pengembang yang saling memperkuat dari waktu ke waktu. Ketika peneliti mengoptimalkan pekerjaan mereka untuk platform NVIDIA, NVIDIA memperbarui produknya untuk lebih baik melayani beban kerja kecerdasan buatan. Loop umpan balik ini menciptakan keunggulan yang tahan lama yang meluas jauh melampaui kinerja murni.

Buku ini secara diam-diam menekankan kenyataan yang semakin jelas hari ini: kepemimpinan dalam kecerdasan buatan dibentuk oleh rantai pasokan, kapasitas manufaktur, ekosistem perangkat lunak, dan kontrol platform, bukan hanya kecerdasan penelitian.

Visi, Risiko, dan Konsekuensi yang Berkompoun

Witt tidak ragu-ragu untuk membahas implikasi dari dominasi NVIDIA. Ketika perusahaan ini menjadi fondasi infrastruktur kecerdasan buatan global, pengaruhnya tumbuh sesuai. Keyakinan Jensen Huang bahwa komputasi yang dipercepat akan mendefinisikan fase berikutnya dari kemajuan teknologi berjalan sepanjang buku.

Alih-alih membahas moral, The Thinking Machine fokus pada bagaimana keputusan teknik dan strategis yang konsisten berkompoun dari waktu ke waktu. NVIDIA tidak menang dengan mengejar tren. Mereka menang dengan berkomitmen awal pada komputasi paralel, bertahan melalui siklus pasar yang berulang, dan berinvestasi tanpa henti pada alat yang membuat perangkat keras mereka tak tergantikan.

Bagi Pembaca yang Ingin Memahami Bagaimana Kecerdasan Buatan Benar-Benar Berkembang

Bagi pembaca yang sudah tahu momen-momen utama sejarah kecerdasan buatan, buku ini mengisi lapisan yang hilang di bawah mereka. Buku ini menjelaskan mengapa terobosan-terobosan itu bisa berkembang ketika mereka melakukannya, dan mengapa NVIDIA muncul sebagai kekuatan sentral dalam proses tersebut.

Ini adalah buku untuk pembaca yang ingin memahami kecerdasan buatan sebagai sistem industri, bukan sebagai kumpulan model cerdas. Buku ini akan beresonansi kuat dengan mereka yang tertarik dengan chip, pusat data, dan keputusan teknik yang sering tidak terlihat yang membentuk kekuatan teknologi.

The Thinking Machine sukses karena merangkum kisah kecerdasan buatan dari awal, menunjukkan bagaimana komputasi paralel, platform pengembang, dan visi jangka panjang membangun fondasi di mana kecerdasan buatan modern sekarang berdiri.

Antoine adalah seorang pemimpin visioner dan mitra pendiri Unite.AI, didorong oleh semangat yang tak tergoyahkan untuk membentuk dan mempromosikan masa depan AI dan robotika. Seorang wirausaha serial, ia percaya bahwa AI akan sama-sama mengganggu masyarakat seperti listrik, dan sering tertangkap berbicara tentang potensi teknologi mengganggu dan AGI.

As a futurist, ia berdedikasi untuk mengeksplorasi bagaimana inovasi ini akan membentuk dunia kita. Selain itu, ia adalah pendiri Securities.io, sebuah platform yang fokus pada investasi di teknologi-teknologi canggih yang mendefinisikan kembali masa depan dan membentuk kembali seluruh sektor.