Các phê bình sách
Đánh giá sách: Khóa học cấp tốc về Học sâu: Giới thiệu thực hành, dựa trên dự án về Trí tuệ nhân tạo

Khóa học cấp tốc về Học sâu: Giới thiệu thực hành, dựa trên dự án về Trí tuệ nhân tạo Tác phẩm này được viết bởi Giovanni Volpe, Benjamin Midtvedt, Jesús Pineda, Henrik Klein Moberg, Harshith Bachimanchi, Joana B. Pereira và Carlo Manzo, một nhóm các nhà nghiên cứu và nhà giáo dục giàu kinh nghiệm trong các lĩnh vực vật lý, học máy và nghiên cứu trí tuệ nhân tạo ứng dụng.
Trước khi đi sâu vào nội dung cuốn sách, tôi muốn bắt đầu bằng một lời thú nhận cá nhân, bởi vì nó đã định hình cách tôi cảm nhận cuốn sách này. Đây là cuốn sách đầu tiên tôi từng đọc từ... Không có máy ép tinh bộtVà khi bắt đầu, tôi thực sự không biết mình nên mong đợi điều gì. Mặc dù điều hành một trang web lớn tập trung vào AI, tôi cũng phải thừa nhận mình là một lập trình viên cực kỳ kém theo tiêu chuẩn AI hiện đại. Tôi hiểu khá rõ những kiến thức cơ bản về HTML, CSS, JavaScript và PHP, nhưng khi nói đến Python, kỹ năng của tôi chỉ ở mức trung bình. Điều đó rất quan trọng ở đây, bởi vì Python Đó là ngôn ngữ được sử dụng xuyên suốt cuốn sách và đóng vai trò trung tâm trong hầu hết mọi dự án.
Thay vì cảm giác thất vọng, tôi lại tìm thấy điều quý giá hơn nhiều. Cuốn sách này kiên nhẫn mà không hề đơn giản hóa vấn đề, sâu sắc mà không gây choáng ngợp, và thực tiễn theo cách mà rất ít sách về trí tuệ nhân tạo làm được. Nó không cho rằng bạn đã thông thạo về văn hóa, thuật ngữ hoặc quy trình làm việc của máy học. Thay vào đó, nó xây dựng sự tự tin một cách vững chắc, từng chương một, thông qua lời giải thích được kết hợp trực tiếp với các bài tập thực hành.
Ấn tượng đầu tiên tạo nên toàn bộ câu chuyện.
Đây là một cuốn sách đồ sộ, dày hơn sáu trăm trang, và nó sử dụng không gian đó một cách hiệu quả. Một chi tiết ngay lập tức gây ấn tượng với tôi là các tác giả đã quyết định chuyển toàn bộ mã nguồn từ... TensorFlow đến Kim tự tháp Sau khi bản thảo đầu tiên đã hoàn thành. Đó không phải là một thay đổi nhỏ, đặc biệt đối với một cuốn sách có dung lượng như vậy. Nó báo hiệu một điều quan trọng: đây không phải là một cuốn sách bị đóng băng trong thời gian hay được viết ra chỉ để đáp ứng các yêu cầu. Đây là một cuốn sách được thiết kế để luôn phù hợp và tương thích với cách thức thực hành học sâu hiện nay.
Ngay từ đầu, giọng văn đã rất thực tế và dễ hiểu. Cuốn sách không bắt đầu bằng triết học trừu tượng hay toán học phức tạp. Thay vào đó, nó đi sâu vào cơ chế xây dựng mô hình, tiến hành thí nghiệm và hiểu được mã lệnh đang làm gì và tại sao. Cách tiếp cận này tạo nên sự khác biệt rất lớn, đặc biệt đối với những độc giả hiểu các khái niệm ở mức độ cao nhưng gặp khó khăn trong việc chuyển chúng thành các triển khai thực tế.
Học bằng cách thực hành, không phải bằng cách ghi nhớ.
Một trong những điểm mạnh nhất của Deep Learning Crash Course là cấu trúc dựa trên dự án. Đây không phải là cuốn sách mà bạn đọc hàng giờ rồi mới thử làm sau. Bạn liên tục xây dựng mọi thứ. Mỗi khái niệm chính đều gắn liền với một dự án cụ thể, và độ phức tạp của các dự án tăng dần khi bạn hiểu biết sâu hơn.
Bạn bắt đầu bằng cách xây dựng và huấn luyện đội đầu tiên của mình. mạng thần kinh Từ đầu, hãy sử dụng PyTorch. Những chương đầu này giới thiệu các ý tưởng cốt lõi đằng sau mạng nơ-ron, bao gồm các lớp, trọng số, hàm kích hoạt, hàm mất mát và tối ưu hóa. Điều quan trọng là, những ý tưởng này không được coi là các bài toán toán học trừu tượng. Chúng được giới thiệu như những công cụ giải quyết các vấn đề cụ thể, và bạn sẽ thấy tác động của từng lựa chọn thiết kế trực tiếp trong kết quả.
Là một người không thường xuyên viết Python, tôi đánh giá cao cách các tác giả giải thích mã nguồn một cách cẩn thận. Bạn không bao giờ bị kỳ vọng phải hiểu ngay lập tức những gì đang diễn ra. Các giải thích chi tiết nhưng vẫn dễ đọc, và chúng tập trung vào trực quan cũng như tính chính xác.
Nắm bắt các mẫu và hiểu dữ liệu
Sau khi nắm vững các kiến thức cơ bản, cuốn sách chuyển sang phần phân tích xu hướng và mô hình trong dữ liệu. Đây là lúc mạng nơ-ron dày đặc được áp dụng cho các nhiệm vụ thực tế hơn như... hồi quy và các vấn đề phân loại. Bạn sẽ học cách các mô hình khái quát hóa, cách chúng thất bại và cách chẩn đoán những thất bại đó.
Phần này âm thầm giảng dạy một số kỹ năng thực tiễn quan trọng nhất trong học máy. Các chủ đề như xác thực, quá mứcCác khái niệm như hiện tượng thiếu khớp (underfitting), và đánh giá hiệu năng được giới thiệu một cách tự nhiên thông qua thực nghiệm chứ không phải bằng cách nhồi nhét lý thuyết. Bạn sẽ học cách diễn giải đường cong học tập, cách điều chỉnh siêu tham số và cách suy luận về hành vi của mô hình thay vì tin tưởng mù quáng vào kết quả đầu ra.
Đối với những độc giả chỉ từng tương tác với AI thông qua API hoặc các công cụ có sẵn, riêng phần này thôi cũng đáng giá tiền mua cuốn sách.
Làm việc với hình ảnh bằng mạng nơ-ron
Một trong những phần hấp dẫn nhất của cuốn sách tập trung vào... đang xử lý hình ảnh và thị giác máy tính. Đây là đâu mạng nơ ron phức hợp bắt đầu phát huy tác dụng. Thay vì coi CNN là một điều bí ẩn, hãy xem xét lại. hộp đenCuốn sách phân tích chúng thành các thành phần dễ hiểu.
Bạn sẽ học được chức năng thực sự của phép tích chập, tầm quan trọng của các lớp gộp (pooling layers), và cách thức trích xuất đặc trưng hoạt động giữa các lớp. Quan trọng hơn, bạn sẽ áp dụng những ý tưởng này vào các tập dữ liệu hình ảnh thực tế. Các dự án bao gồm phân loại hình ảnh, biến đổi hình ảnh và các thí nghiệm hình ảnh sáng tạo như chuyển đổi phong cách và các hiệu ứng tương tự như DeepDream.
Phần này được hưởng lợi rất nhiều từ các hình minh họa trong sách. Các giải thích trực quan đi kèm với mã code, giúp dễ dàng kết nối những gì mô hình đang thực hiện về mặt toán học với những gì nó tạo ra về mặt hình ảnh. Đối với những người học bằng hình ảnh, phần này của cuốn sách đặc biệt hữu ích.
Từ nén dữ liệu đến tạo ra bản in.
Sau đó, cuốn sách mở rộng sang... bộ mã hóa tự động và các kiến trúc mã hóa-giải mã, bao gồm cả U-Net. Các mô hình này giới thiệu các ý tưởng như giảm chiều dữ liệu, biểu diễn tiềm ẩn và tạo ra đầu ra có cấu trúc. Bạn sẽ thấy cách các mô hình có thể học được các biểu diễn cô đọng của dữ liệu phức tạp và cách các biểu diễn đó có thể được sử dụng cho các tác vụ như khử nhiễu và phân đoạn.
Từ đó, phạm vi lại mở rộng sang lĩnh vực mô hình hóa tạo sinh. Điều này bao gồm... mạng lưới nghịch cảnh và mô hình khuếch tánChúng tạo nên xương sống của nhiều hệ thống AI tạo sinh hiện đại. Các chương này không né tránh những thách thức trong việc huấn luyện các mô hình tạo sinh. Sự bất ổn, các vấn đề về hội tụ và đánh giá đều được thảo luận một cách cởi mở.
Điều tôi đánh giá cao nhất ở đây là cuốn sách không thổi phồng quá mức các mô hình này. Nó cho thấy cả sức mạnh và những hạn chế của chúng, điều này thật đáng trân trọng trong một lĩnh vực thường bị chi phối bởi những lời quảng cáo thổi phồng.
Trình tự, Ngôn ngữ và Sự chú ý
Một điểm mạnh khác của cuốn sách là cách nó xử lý dữ liệu và ngôn ngữ tuần tự. Mạng nơ-ron hồi quy được giới thiệu như một bước đệm, giúp người đọc hiểu cách các mô hình xử lý chuỗi thời gian và đầu vào có thứ tự.
Từ đó, cuốn sách chuyển sang các cơ chế chú ý và kiến trúc Transformer. Các chương này cung cấp nền tảng khái niệm vững chắc để hiểu các mô hình ngôn ngữ hiện đại mà không yêu cầu bạn phải thông thạo lĩnh vực này trước đó. Các giải thích tập trung vào lý do tại sao sự chú ý lại quan trọng, cách nó thay đổi động lực học tập và cách nó cho phép các mô hình mở rộng quy mô.
Đối với những độc giả muốn hiểu sâu hơn về cách thức hoạt động của các hệ thống trí tuệ nhân tạo hiện nay, phần này sẽ kết nối nhiều khía cạnh khác nhau.
Đồ thị, Quyết định và Học hỏi từ Tương tác
Các chương sau sẽ khám phá thêm đồ thị mạng nơ ronChúng được sử dụng để mô hình hóa dữ liệu quan hệ, trong đó các mối liên hệ quan trọng không kém gì các giá trị riêng lẻ. Điều này bao gồm các ví dụ liên quan đến dữ liệu khoa học, mạng lưới và các hệ thống có cấu trúc.
Cuốn sách cũng giới thiệu phương pháp học tập tích cực và học tập củng cố sâuTrong đó, các mô hình học hỏi bằng cách tương tác với môi trường và đưa ra quyết định. Các phần này vượt ra ngoài các tập dữ liệu tĩnh và đi sâu vào các hệ thống động, cho thấy cách thức học tập có thể thích ứng dựa trên phản hồi và kết quả.
Đến cuối cuốn sách, người đọc sẽ được tiếp cận toàn bộ vòng đời của các hệ thống học sâu, từ giai đoạn đầu. nhập dữ liệu cho các tác nhân ra quyết định.
Những kỹ năng thực tiễn có thể áp dụng ngoài sách vở
Xuyên suốt cuốn sách, các thói quen thực tiễn được nhấn mạnh rất nhiều. Bạn sẽ học cách cấu trúc thí nghiệm, gỡ lỗi mô hình, trực quan hóa kết quả và tư duy phản biện về hiệu năng. Đây là những kỹ năng quan trọng nhất khi bạn chuyển từ các bài hướng dẫn sang các ứng dụng thực tế.
Các sổ tay và bộ dữ liệu đi kèm giúp việc thử nghiệm, chỉnh sửa dự án và khám phá ý tưởng sâu hơn trở nên dễ dàng. Tính linh hoạt này làm cho cuốn sách có giá trị không chỉ để đọc một lần mà còn là tài liệu tham khảo lâu dài.
Cuốn sách này dành cho ai
Cuốn sách này lý tưởng cho các lập trình viên, kỹ sư, nhà nghiên cứu và những chuyên gia có óc tò mò về kỹ thuật muốn hiểu về học sâu bằng cách tự xây dựng các mô hình. Bạn không cần phải là một chuyên gia lập trình Python để bắt đầu, và bạn cũng không cần có kiến thức toán học nâng cao để tiến bộ. Điều bạn cần là sự tò mò và sẵn sàng thực hiện các dự án một cách cẩn trọng.
Cuốn sách này cũng cực kỳ hữu ích như một tài liệu tham khảo, và đó chính xác là cách tôi dự định sử dụng nó trong thời gian tới. Là một người ngày càng tập trung vào... mã hóa rung cảm Thay vì tập trung vào việc thực thi từng dòng mã từ đầu đến cuối, tôi thấy cuốn sách này là một tài liệu mà tôi sẽ thường xuyên tham khảo để làm sâu sắc thêm hiểu biết về mặt khái niệm. Các giải thích, sơ đồ và phân tích kiến trúc giúp người đọc nắm bắt được cấu trúc của các mô hình, lý do lựa chọn các phương pháp nhất định và những sự đánh đổi tồn tại. Theo nghĩa đó, cuốn sách không chỉ thành công như một khóa học từng bước mà còn là người bạn đồng hành lâu dài cho những độc giả muốn hiểu những gì các hệ thống AI hiện đại đang làm bên trong khi thử nghiệm, tạo mẫu hoặc suy luận ở cấp độ cao hơn.
.
Khóa học cấp tốc về Học sâue Nó đã vượt quá sự mong đợi của tôi một cách thực sự. Nó không chỉ giải thích về học sâu, mà còn làm cho nó trở nên dễ tiếp cận và khả thi. Sau khi kết thúc, tôi cảm thấy thoải mái hơn rất nhiều khi đọc, chỉnh sửa và viết các mô hình dựa trên PyTorch so với khi mới bắt đầu.
Đây là một cuốn sách đáng để nỗ lực. Nó tôn trọng trí thông minh của người đọc mà không giả định họ có chuyên môn, và mang đến một trong những trải nghiệm học tập thực tiễn nhất mà tôi từng gặp trong lĩnh vực giáo dục AI. Đối với bất kỳ ai nghiêm túc muốn chuyển từ người quan sát AI sang người xây dựng AI, cuốn sách này rất đáng để đọc.










