Connect with us

Book Reviews

Bài Đánh Giá Sách: The Thinking Machine: Jensen Huang, NVIDIA, và Con Chip Vi Mạch Được Thèm Muốn Nhất Thế Giới của Stephen Witt

mm

The Thinking Machine: Jensen Huang, NVIDIA, and the World’s Most Coveted Microchip nổi bật so với hầu hết các cuốn sách viết về trí tuệ nhân tạo vì nó tiếp cận chủ đề từ một hướng mà nhiều độc giả am hiểu kỹ thuật, bao gồm cả tôi, trước đây đã đánh giá thấp.

Giống như nhiều người đã theo dõi AI trong nhiều năm, hiểu biết của tôi về lĩnh vực này được định hình bởi những cột mốc quen thuộc. Câu chuyện thường bắt đầu vào năm 1956 với hội thảo Dartmouth, đi qua các hệ thống ký hiệu ban đầu, rồi nhảy tới những khoảnh khắc đáng nhớ như việc Deep Blue của IBM đánh bại Garry Kasparov, DeepMind thành thạo môn Cờ Vây, và gần đây hơn là OpenAI chứng minh rằng các mô hình ngôn ngữ lớn có thể phối hợp chiến lược trong các môi trường nhiều người chơi phức tạp. Những khoảnh khắc này thỏa mãn về mặt trí tuệ và dễ nhớ vì chúng tập trung vào những chiến thắng hữu hình.

Điều mà cuốn sách của Stephen Witt làm cực kỳ tốt là thách thức cách đóng khung đó. Thay vì tập trung vào những thời điểm AI gây ấn tượng với thế giới, The Thinking Machine tập trung vào lớp nền ít được nhìn thấy bên dưới những thành tựu đó. Nó lập luận một cách thuyết phục rằng kỷ nguyên AI hiện đại không được mở khóa chủ yếu chỉ bởi những ý tưởng thông minh, mà bởi một sự thay đổi cơ bản trong cách chính bản thân việc tính toán được thực hiện.

Bằng cách đặt câu chuyện trọng tâm vào NVIDIA (NVDA +1.63%) và đồng sáng lập Jensen Huang, Witt định hình lại cuộc cách mạng AI như một câu chuyện về kiến trúc máy tính, hệ sinh thái nhà phát triển và niềm tin dài hạn. Kết quả không chỉ là một cuốn tiểu sử doanh nghiệp, mà còn là một chương sử thiếu trong lịch sử rộng lớn hơn của trí tuệ nhân tạo.

Từ Trò Chơi Điện Tử Đến Một Mô Hình Máy Tính Mới

Khởi đầu của NVIDIA cách xa những tham vọng cao cả hiện nay gắn liền với trí tuệ nhân tạo. Công ty ra đời năm 1993 với tư cách là nhà sản xuất chip đồ họa, tập trung vào việc kết xuất những thế giới trò chơi điện tử ngày càng chân thực. Thách thức lúc đó không phải là trí tuệ, mà là tốc độ. Các trò chơi yêu cầu một số lượng lớn phép tính được thực hiện ngay lập tức để mô phỏng ánh sáng, chuyển động và chiều sâu.

Giải pháp mà NVIDIA theo đuổi là tính toán song song. Tính toán song song có nghĩa là thực hiện nhiều phép tính cùng một lúc thay vì thực thi chúng tuần tự. Thay vì dựa vào một lõi mạnh mẽ duy nhất xử lý từng lệnh một, GPU sử dụng hàng nghìn lõi nhỏ hơn hoạt động đồng thời trên các phép toán tương tự. Cách tiếp cận này đặc biệt mạnh mẽ đối với các khối lượng công việc liên quan đến việc lặp lại các phép tính giống nhau trên các tập dữ liệu lớn.

Ban đầu, kiến trúc này được xây dựng cho đồ họa. Tuy nhiên, Witt cho thấy quyết định này đã âm thầm tạo ra nền tảng lý tưởng cho mạng nơ-ron nhiều thập kỷ sau. Việc huấn luyện các mô hình AI hiện đại liên quan đến số lượng khổng lồ các phép toán giống hệt nhau được áp dụng trên khối lượng dữ liệu khổng lồ. GPU vốn đã được tối ưu hóa cho chính loại công việc đó.

Điều làm cho phần này của cuốn sách hấp dẫn là cách Witt kết nối rõ ràng các lựa chọn thiết kế kỹ thuật với sự sinh tồn. NVIDIA không chọn tính toán song song vì họ dự đoán được trí tuệ nhân tạo. Họ chọn nó vì đó là cách duy nhất để cạnh tranh trong đồ họa thời gian thực. Sự cần thiết đó buộc công ty phải làm chủ một mô hình tính toán mà sau này sẽ chứng minh là có tính chuyển đổi vượt xa ngành chơi game.

Jensen Huang và Tư Duy Hệ Thống, Không Phải Sản Phẩm

Ở trung tâm câu chuyện này là Jensen Huang, được mô tả không phải là một giám đốc điều hành thông thường, mà là người luôn suy nghĩ theo hệ thống hơn là các sản phẩm riêng lẻ. Witt trình bày Huang là người đòi hỏi cao, mãnh liệt và thường khó tính, nhưng cũng nhất quán một cách đáng chú ý trong cách ông nhìn nhận công nghệ trong thời gian dài.

Trong khi các đối thủ cạnh tranh coi GPU như những linh kiện có thể thay thế gắn liền với chu kỳ chơi game, Huang coi chúng là nền tảng của một nền tảng máy tính rộng lớn hơn. Sự phân biệt này trở nên quan trọng. Sản phẩm bị thay thế. Nền tảng thì tích lũy.

Nội bộ NVIDIA phản ánh tư duy này. Các kỹ sư được khuyến khích suy nghĩ trước nhiều năm. Phần mềm được đối xử quan trọng về mặt chiến lược như silicon. Các khoản đầu tư vào công cụ và hỗ trợ nhà phát triển được thực hiện từ lâu trước khi có nhu cầu rõ ràng. Nhiều lựa chọn trong số này vào thời điểm đó có vẻ quá mức hoặc không cần thiết. Nhìn lại, chúng đã tạo ra một hào rào mà các đối thủ cạnh tranh phải vật lộn để vượt qua.

Witt làm rõ rằng sự trỗi dậy của NVIDIA không phải là điều tất yếu. Công ty đã nhiều lần suýt thất bại. Điều đưa nó tiến lên không phải là một đột phá duy nhất, mà là một niềm tin bền bỉ rằng tính toán tăng tốc cuối cùng sẽ quan trọng vượt xa trường hợp sử dụng ban đầu của nó.

CUDA và Câu Chuyện Khởi Nguồn AI Mà Nhiều Người Bỏ Lỡ

Một trong những đóng góp quan trọng nhất của The Thinking Machine là cách nó định hình lại vai trò của CUDA trong lịch sử AI.

Trước khi đọc cuốn sách này, rất dễ nghĩ về CUDA đơn giản như một công cụ dành cho nhà phát triển thành công. Witt cho thấy tại sao nó xứng đáng được chú ý nhiều hơn. CUDA được tạo ra để làm cho tính toán song song có thể sử dụng được bên ngoài lĩnh vực đồ họa. Trước CUDA, việc sử dụng GPU cho tính toán tổng quát đòi hỏi phải ép các vấn đề thông qua các giao diện dành riêng cho đồ họa. Điều này dễ vỡ, kém hiệu quả và chỉ giới hạn cho các chuyên gia.

CUDA đã thay đổi điều đó bằng cách cho phép các nhà phát triển lập trình GPU bằng các mô hình lập trình quen thuộc. Hàng nghìn lõi tính toán trở nên có thể truy cập như một tài nguyên chung. Điều này đã hạ thấp rào cản gia nhập cho điện toán hiệu suất cao theo cách mà ít người đánh giá đầy đủ vào thời điểm đó.

Đây là nơi cuốn sách cộng hưởng mạnh mẽ với trải nghiệm của chính tôi khi tìm hiểu lịch sử AI. Câu chuyện tôi tiếp nhận tập trung nặng nề vào các mô hình và thuật toán. Điều mà The Thinking Machine làm rõ là nhiều ý tưởng trong số đó chỉ trở nên khả thi một khi các nhà nghiên cứu thực sự có thể huấn luyện chúng ở quy mô lớn.

Các nhà nghiên cứu AI nhanh chóng nhận ra rằng mạng nơ-ron là một sự kết hợp gần như hoàn hảo với tính toán song song. Huấn luyện liên quan đến việc lặp lại các thao tác giống nhau trên các tập dữ liệu lớn, điều chỉnh hàng triệu hoặc hàng tỷ tham số theo thời gian. CUDA cho phép quá trình này diễn ra nhanh hơn, rẻ hơn và đáng tin cậy hơn so với CPU.

Điều này trở nên đặc biệt quan trọng khi học sâu tăng tốc và sau này khi các mô hình dựa trên transformer xuất hiện. Transformer phát triển mạnh nhờ quy mô. Nếu không có gia tốc GPU, nhiều mô hình định hình cảnh quan AI ngày nay sẽ vẫn chỉ là lý thuyết hoặc quá đắt đỏ. CUDA không phát minh ra những kiến trúc này, nhưng nó đã làm cho sự tiến hóa nhanh chóng của chúng trở nên khả thi.

Điều mà Witt nắm bắt đặc biệt tốt là kết quả này không hoàn toàn được lên kế hoạch. CUDA được xây dựng cho tính toán khoa học. Các nhà nghiên cứu AI đã phát hiện ra sức mạnh của nó và kéo NVIDIA vào trung tâm của cuộc đua AI.

Cơ Sở Hạ Tầng Hơn Là Thuật Toán

Một trong những hiểu biết giá trị nhất của cuốn sách là tiến bộ AI bị giới hạn bởi cơ sở hạ tầng nhiều như bởi ý tưởng. Nhiều bài viết phổ biến tập trung vào thuật toán, thủ thuật huấn luyện và tập dữ liệu. The Thinking Machine nhắc nhở người đọc rằng không có điều nào trong số này quan trọng nếu không có đủ năng lực tính toán.

Từ góc độ này, sự bùng nổ AI hiện đại có vẻ ít đột ngột hơn và bị trì hoãn nhiều hơn. Mạng nơ-ron đã tồn tại trong nhiều thập kỷ. Điều thay đổi là sự sẵn có của phần cứng có khả năng huấn luyện chúng ở quy mô có ý nghĩa.

NVIDIA không chỉ đơn thuần cung cấp chip nhanh hơn. Họ đã xây dựng một hệ sinh thái gồm phần cứng, thư viện phần mềm và công cụ dành cho nhà phát triển củng cố lẫn nhau theo thời gian. Khi các nhà nghiên cứu tối ưu hóa công việc của họ cho nền tảng NVIDIA, NVIDIA đã cải tiến sản phẩm của mình để phục vụ tốt hơn các khối lượng công việc AI. Vòng phản hồi này đã tạo ra một lợi thế bền vững vượt xa hiệu suất thô.

Cuốn sách âm thầng nhấn mạnh một thực tế ngày càng rõ ràng hiện nay: vị thế dẫn đầu trong AI được định hình bởi chuỗi cung ứng, năng lực sản xuất, hệ sinh thái phần mềm và kiểm soát nền tảng, không chỉ bởi sự xuất sắc trong nghiên cứu.

Tầm Nhìn, Rủi Ro và Hệ Quả Tích Lũy

Witt không né tránh những hàm ý về sự thống trị của NVIDIA. Khi công ty trở thành nền tảng cho cơ sở hạ tầng AI toàn cầu, ảnh hưởng của nó cũng tăng lên tương ứng. Niềm tin của Jensen Huang rằng tính toán tăng tốc sẽ định nghĩa giai đoạn tiếp theo của tiến bộ công nghệ xuyên suốt cuốn sách.

Thay vì đạo đức hóa, The Thinking Machine tập trung vào cách các quyết định kỹ thuật và chiến lược nhất quán tích lũy theo thời gian. NVIDIA không chiến thắng bằng cách đuổi theo xu hướng. Họ chiến thắng bằng cách cam kết sớm với tính toán song song, chịu đựng các chu kỳ thị trường lặp đi lặp lại và đầu tư không ngừng vào các công cụ làm cho phần cứng của họ trở nên không thể thiếu.

Dành Cho Độc Giả Muốn Hiểu AI Thực Sự Được Mở Rộng Như Thế Nào

Đối với độc giả đã biết những khoảnh khắc nổi bật của lịch sử AI, cuốn sách này lấp đầy lớp nền thiếu sót bên dưới chúng. Nó giải thích tại sao những đột phá đó có thể mở rộng quy mô vào thời điểm chúng xảy ra, và tại sao NVIDIA nổi lên như một lực lượng trung tâm trong quá trình đó.

Đây là một cuốn sách dành cho độc giả muốn hiểu trí tuệ nhân tạo như một hệ thống công nghiệp hơn là một tập hợp các mô hình thông minh. Nó sẽ cộng hưởng mạnh mẽ với những người quan tâm đến chip, trung tâm dữ liệu và những quyết định kỹ thuật thường vô hình đã âm thầm định hình sức mạnh công nghệ.

The Thinking Machine thành công vì nó định hình lại câu chuyện AI từ gốc rễ, cho thấy cách tính toán song song, nền tảng dành cho nhà phát triển và tầm nhìn dài hạn đã xây dựng nền tảng mà trên đó trí tuệ nhân tạo hiện đại đang đứng vững.

//www.futurist.ai">nhà tương lai học, ông tận tâm khám phá cách những đổi mới này sẽ định hình thế giới của chúng ta. Ngoài ra, ông là người sáng lập Securities.io, một nền tảng tập trung vào đầu tư vào các công nghệ tiên phong đang định nghĩa lại tương lai và định hình lại toàn bộ các lĩnh vực.