Các phê bình sách
Đánh giá sách: Cỗ máy tư duy: Jensen Huang, NVIDIA và con chip được thèm muốn nhất thế giới của Stephen Witt

Cỗ máy tư duy: Jensen Huang, NVIDIA và con chip được thèm muốn nhất thế giới Cuốn sách này khác biệt so với hầu hết các sách viết về trí tuệ nhân tạo bởi vì nó tiếp cận chủ đề từ một hướng mà nhiều độc giả am hiểu kỹ thuật, trong đó có tôi, trước đây thường đánh giá thấp.
Giống như nhiều người đã theo dõi lĩnh vực AI trong nhiều năm, sự hiểu biết của tôi về lĩnh vực này được hình thành từ những cột mốc quen thuộc. Câu chuyện thường bắt đầu từ... Năm 1956, với hội thảo Dartmouth, Di chuyển qua các hệ thống ký hiệu ban đầu, sau đó nhảy vọt đến những cột mốc quan trọng như của IBM. Deep Blue đánh bại Garry Kasparov, DeepMind thành thạo tiếng GoVà gần đây hơn, OpenAI đã chứng minh rằng các mô hình ngôn ngữ quy mô lớn có thể phối hợp chiến lược trong môi trường nhiều người chơi phức tạp. Những khoảnh khắc này mang lại sự thỏa mãn về mặt trí tuệ và dễ nhớ vì chúng tập trung vào những chiến thắng rõ ràng.
Điều mà cuốn sách của Stephen Witt làm rất xuất sắc là thách thức cách nhìn nhận đó. Thay vì tập trung vào những khoảnh khắc trí tuệ nhân tạo gây ấn tượng với thế giới, Cỗ máy tư duy Bài viết tập trung vào lớp ít được chú ý hơn nằm bên dưới những thành tựu đó. Nó lập luận một cách thuyết phục rằng kỷ nguyên AI hiện đại không chỉ được mở khóa chủ yếu nhờ những ý tưởng thông minh, mà còn nhờ một sự thay đổi cơ bản trong cách thức thực hiện tính toán.
Bằng cách tập trung câu chuyện vào NVIDIA. (NVDA -0.08%) Cùng với người đồng sáng lập Jensen Huang, Witt đã định hình lại cuộc cách mạng AI như một câu chuyện về kiến trúc điện toán, hệ sinh thái nhà phát triển và niềm tin lâu dài. Kết quả không chỉ là một cuốn tiểu sử doanh nghiệp, mà còn là một chương còn thiếu trong lịch sử rộng lớn hơn của trí tuệ nhân tạo.
Từ trò chơi điện tử đến mô hình điện toán mới
Khởi đầu của NVIDIA hoàn toàn khác xa với những tham vọng cao cả hiện nay gắn liền với trí tuệ nhân tạo. Công ty nổi lên vào năm 1993 Là một nhà sản xuất chip đồ họa, họ tập trung vào việc tái tạo thế giới trò chơi điện tử ngày càng chân thực. Thách thức vào thời điểm đó không phải là trí thông minh, mà là tốc độ. Các trò chơi yêu cầu thực hiện một lượng lớn phép tính tức thời để mô phỏng ánh sáng, chuyển động và chiều sâu.
Giải pháp mà NVIDIA theo đuổi là tính toán song song. Tính toán song song nghĩa là thực hiện nhiều phép tính cùng một lúc thay vì thực hiện chúng tuần tự. Thay vì dựa vào một lõi xử lý mạnh mẽ duy nhất để xử lý từng lệnh một, GPU sử dụng hàng nghìn lõi nhỏ hơn hoạt động đồng thời trên các phép toán tương tự. Phương pháp này đặc biệt hiệu quả đối với các khối lượng công việc liên quan đến việc lặp lại các phép tính giống nhau trên các tập dữ liệu lớn.
Ban đầu, kiến trúc này được xây dựng cho đồ họa. Tuy nhiên, Witt cho thấy quyết định này đã âm thầm tạo ra nền tảng lý tưởng cho mạng nơ-ron nhiều thập kỷ sau đó. Việc huấn luyện các mô hình AI hiện đại liên quan đến số lượng lớn các phép toán giống hệt nhau được áp dụng trên lượng dữ liệu khổng lồ. GPU đã được tối ưu hóa cho chính loại công việc đó.
Điều làm cho phần này của cuốn sách trở nên hấp dẫn là cách Witt kết nối rõ ràng các lựa chọn thiết kế kỹ thuật với sự sống còn. NVIDIA không chọn điện toán song song vì họ dự đoán được trí tuệ nhân tạo. Họ chọn nó vì đó là cách duy nhất để cạnh tranh trong lĩnh vực đồ họa thời gian thực. Sự cần thiết đó đã buộc công ty phải làm chủ một mô hình điện toán mà sau này đã chứng minh được sức mạnh chuyển đổi vượt xa lĩnh vực trò chơi.
Jensen Huang và tư duy hệ thống, không phải tư duy sản phẩm.
Trung tâm của câu chuyện là Jensen Huang, được khắc họa không phải là một giám đốc điều hành thông thường, mà là người luôn suy nghĩ theo hệ thống hơn là từng sản phẩm riêng lẻ. Witt miêu tả Huang là người khắt khe, quyết liệt và thường khó tính, nhưng cũng vô cùng nhất quán trong quan điểm về công nghệ trong thời gian dài.
Trong khi các đối thủ cạnh tranh coi GPU là những linh kiện dùng một lần gắn liền với chu kỳ chơi game, Huang lại coi chúng là nền tảng của một hệ thống điện toán rộng lớn hơn. Sự khác biệt này trở nên vô cùng quan trọng. Sản phẩm được thay thế. Nền tảng được mở rộng.
Về nội bộ, NVIDIA phản ánh tư duy này. Các kỹ sư được khuyến khích suy nghĩ trước nhiều năm. Phần mềm được coi trọng về mặt chiến lược như chip bán dẫn. Các khoản đầu tư được thực hiện vào công cụ và hỗ trợ nhà phát triển từ rất lâu trước khi nhu cầu rõ ràng. Nhiều lựa chọn trong số này có vẻ quá mức hoặc không cần thiết vào thời điểm đó. Nhìn lại, chúng đã tạo ra một rào cản mà các đối thủ cạnh tranh khó lòng vượt qua.
Witt khẳng định rõ ràng rằng sự trỗi dậy của NVIDIA không phải là điều tất yếu. Công ty đã nhiều lần suýt thất bại. Điều giúp họ tiến lên không phải là một bước đột phá duy nhất, mà là niềm tin bền bỉ rằng điện toán tăng tốc cuối cùng sẽ có ý nghĩa vượt xa ứng dụng ban đầu.
CUDA và câu chuyện nguồn gốc của AI mà nhiều người đã bỏ lỡ
Một trong những đóng góp quan trọng nhất của Cỗ máy tư duy Đó là cách nó định hình lại vai trò của CUDA trong lịch sử trí tuệ nhân tạo.
Trước khi đọc cuốn sách này, người ta dễ dàng nghĩ rằng... CUDA CUDA không chỉ đơn thuần là một công cụ phát triển thành công. Witt đã chỉ ra lý do tại sao nó xứng đáng được chú ý nhiều hơn. CUDA được tạo ra để giúp việc tính toán song song có thể sử dụng được ngoài lĩnh vực đồ họa. Trước CUDA, việc sử dụng GPU cho các phép tính tổng quát đòi hỏi phải giải quyết các bài toán thông qua các giao diện chuyên dụng cho đồ họa. Điều này rất dễ gặp lỗi, không hiệu quả và chỉ dành cho các chuyên gia.
CUDA đã thay đổi điều đó bằng cách cho phép các nhà phát triển lập trình GPU bằng các mô hình lập trình quen thuộc. Hàng ngàn lõi tính toán trở nên dễ tiếp cận như một tài nguyên chung. Điều này đã hạ thấp rào cản gia nhập lĩnh vực điện toán hiệu năng cao theo cách mà ít người thực sự đánh giá cao vào thời điểm đó.
Đây là điểm mà cuốn sách gây được sự đồng cảm mạnh mẽ với trải nghiệm học lịch sử trí tuệ nhân tạo của chính tôi. Những nội dung tôi tiếp thu tập trung chủ yếu vào các mô hình và thuật toán. Vậy thì sao? Cỗ máy tư duy Điều này làm rõ rằng nhiều ý tưởng đó chỉ trở nên khả thi khi các nhà nghiên cứu có thể thực sự huấn luyện chúng trên quy mô lớn.
Các nhà nghiên cứu AI nhanh chóng nhận ra rằng mạng nơ-ron là sự kết hợp gần như hoàn hảo cho điện toán song song. Quá trình huấn luyện bao gồm việc lặp lại các thao tác tương tự trên các tập dữ liệu lớn, điều chỉnh hàng triệu hoặc hàng tỷ tham số theo thời gian. CUDA cho phép quá trình này diễn ra nhanh hơn, rẻ hơn và đáng tin cậy hơn so với CPU.
Điều này trở nên đặc biệt quan trọng khi học sâu (deep learning) phát triển nhanh chóng và sau đó là khi các mô hình dựa trên Transformer xuất hiện. Transformer hoạt động hiệu quả nhờ quy mô lớn. Nếu không có khả năng tăng tốc GPU, nhiều mô hình định hình nên lĩnh vực AI ngày nay sẽ chỉ dừng lại ở lý thuyết hoặc có chi phí quá cao. CUDA không phải là đơn vị phát minh ra các kiến trúc này, nhưng nó đã giúp cho sự phát triển nhanh chóng của chúng trở nên khả thi.
Điều mà Witt nắm bắt đặc biệt tốt là kết quả này không hoàn toàn nằm trong kế hoạch. CUDA được xây dựng cho tính toán khoa học. Các nhà nghiên cứu AI đã phát hiện ra sức mạnh của nó và đưa NVIDIA vào trung tâm của cuộc đua AI.
Cơ sở hạ tầng vượt trội hơn thuật toán
Một trong những nhận định giá trị nhất của cuốn sách là sự tiến bộ của trí tuệ nhân tạo bị hạn chế bởi cơ sở hạ tầng cũng như bởi ý tưởng. Nhiều bài viết phổ biến tập trung vào thuật toán, thủ thuật huấn luyện và tập dữ liệu. Cỗ máy tư duy Điều này nhắc nhở người đọc rằng tất cả những điều đó đều vô nghĩa nếu không có đủ năng lực tính toán.
Từ góc nhìn này, sự bùng nổ AI hiện đại Hiện tượng này diễn ra ít đột ngột hơn và có phần trì hoãn hơn. Mạng nơ-ron đã tồn tại hàng thập kỷ. Điều thay đổi là sự sẵn có của phần cứng có khả năng huấn luyện chúng ở quy mô đáng kể.
NVIDIA không chỉ đơn thuần cung cấp chip nhanh hơn. Họ đã xây dựng một hệ sinh thái gồm phần cứng, thư viện phần mềm và công cụ phát triển, hỗ trợ lẫn nhau theo thời gian. Khi các nhà nghiên cứu tối ưu hóa công việc của họ cho nền tảng NVIDIA, NVIDIA đã tinh chỉnh sản phẩm của mình để phục vụ tốt hơn cho các tác vụ trí tuệ nhân tạo. Vòng phản hồi này đã tạo ra một lợi thế bền vững, vượt xa hiệu năng thô.
Cuốn sách khéo léo nhấn mạnh một thực tế ngày càng trở nên rõ ràng hiện nay: vị trí dẫn đầu trong lĩnh vực trí tuệ nhân tạo được định hình bởi chuỗi cung ứng, năng lực sản xuất, hệ sinh thái phần mềm và khả năng kiểm soát nền tảng, chứ không chỉ đơn thuần là sự xuất sắc trong nghiên cứu.
Tầm nhìn, rủi ro và hậu quả chồng chất
Witt không hề né tránh những hệ lụy từ sự thống trị của NVIDIA. Khi công ty này trở thành nền tảng cho cơ sở hạ tầng AI toàn cầu, tầm ảnh hưởng của nó cũng tăng lên tương ứng. Niềm tin của Jensen Huang rằng điện toán tăng tốc sẽ định hình giai đoạn tiếp theo của tiến bộ công nghệ được thể hiện xuyên suốt cuốn sách.
Thay vì lên án đạo đức, Cỗ máy tư duy Tập trung vào cách các quyết định chiến lược và kỹ thuật nhất quán đã tích lũy theo thời gian. NVIDIA không chiến thắng bằng cách chạy theo xu hướng. Họ chiến thắng bằng cách sớm cam kết với điện toán song song, vượt qua các chu kỳ thị trường lặp đi lặp lại và đầu tư không ngừng vào các công cụ làm cho phần cứng của họ trở nên không thể thiếu.
Dành cho những độc giả muốn hiểu cách trí tuệ nhân tạo thực sự phát triển theo quy mô lớn.
Dành cho những độc giả đã biết về những sự kiện nổi bật của Lịch sử AICuốn sách này lấp đầy lớp còn thiếu bên dưới những thành tựu đó. Nó giải thích tại sao những đột phá đó có thể mở rộng quy mô vào thời điểm đó, và tại sao NVIDIA lại nổi lên như một thế lực trung tâm trong quá trình này.
Đây là cuốn sách dành cho những độc giả muốn hiểu trí tuệ nhân tạo như một hệ thống công nghiệp chứ không phải chỉ là tập hợp các mô hình thông minh. Cuốn sách sẽ gây được tiếng vang lớn đối với những người quan tâm đến chip, trung tâm dữ liệu và những quyết định kỹ thuật thường vô hình nhưng âm thầm định hình sức mạnh công nghệ.
Cỗ máy tư duy Cuốn sách thành công vì nó định hình lại câu chuyện về trí tuệ nhân tạo từ gốc rễ, cho thấy cách điện toán song song, nền tảng phát triển và tầm nhìn dài hạn đã xây dựng nên nền tảng mà trí tuệ nhân tạo hiện đại ngày nay đang dựa trên đó.










