Đánh giá sách
Đánh giá sách: The Worlds I See của Tiến sĩ Fei-Fei Li

Trí tuệ nhân tạo thường được giải thích thông qua các thuật toán, các đột phá về phần cứng và sự gia tăng nhanh chóng của các mô hình mạnh mẽ. Điều thường bị thiếu trong câu chuyện đó là câu chuyện con người về các nhà khoa học đã đặt nền móng cho cuộc cách mạng AI ngày nay.
The Worlds I See: Sự tò mò, Khám phá và Phát hiện tại黎 明 của AI của Tiến sĩ Fei-Fei Li lấp đầy khoảng trống đó một cách đẹp đẽ. Cuốn sách hoạt động đồng thời như một cuốn hồi ký, một lịch sử của trí tuệ nhân tạo hiện đại và một sự phản ánh về trách nhiệm mà đi kèm với việc xây dựng các công nghệ chuyển đổi.
Điều làm cho cuốn sách đặc biệt hấp dẫn là cách Li kết hợp hai câu chuyện song song. Một là câu chuyện về AI chính nó. Câu chuyện khác là câu chuyện về một cô gái nhập cư trẻ đến Hoa Kỳ và cuối cùng trở thành một trong những nhân vật có ảnh hưởng nhất trong lĩnh vực thị giác máy tính.
Cuộc Hành Trình Của Người Nhập Cư Định Hình Tâm Trí Khoa Học
Một trong những yếu tố mạnh nhất của cuốn sách là câu chuyện cá nhân sâu sắc mà tiền thân cho sự nghiệp khoa học của Li.
Li lớn lên ở Trung Quốc trước khi nhập cư vào Hoa Kỳ khi còn là một thiếu niên. Sự chuyển đổi này rất khó khăn. Gia đình của cô đến với nguồn lực tài chính hạn chế và phải đối mặt với thách thức xây dựng lại cuộc sống từ đầu. Trong những năm đầu tại Mỹ, Li giúp đỡ cha mẹ cô điều hành một doanh nghiệp giặt khô trong khi tiếp tục việc học.
Các trải nghiệm này tạo thành một nền tảng quan trọng cho cuốn sách. Chúng tiết lộ sự kiên nhẫn và sự kiên trì mà sau này sẽ định hình công việc khoa học của cô. Cuốn hồi ký không lãng mạn hóa trải nghiệm của người nhập cư. Thay vào đó, nó trình bày thực tế của việc điều chỉnh văn hóa, áp lực tài chính và sự quyết tâm cần thiết để theo đuổi tham vọng học thuật trong một môi trường hoàn toàn mới.
Cuối cùng Li được nhận vào Đại học Princeton. Những ngày đầu tiên trên khuôn viên trường được mô tả với sự pha trộn giữa sự phấn khích và sự ngạc nhiên. Đối với một người vừa mới đến Hoa Kỳ, Princeton đại diện cho một thế giới trí tuệ mà chỉ vài năm trước đây dường như không thể tưởng tượng được.
Những trải nghiệm học thuật đầu tiên này đã giúp định hình sự tò mò mà thúc đẩy phần còn lại của câu chuyện.
Định Hướng Trong Một Lĩnh Vực Được Chi Phối Bởi Nam Giới
Một chủ đề khác chạy xuyên suốt cuốn sách là trải nghiệm của Li như một phụ nữ trong khoa học máy tính.
Nghiên cứu trí tuệ nhân tạo đã được thống trị bởi nam giới trong lịch sử, đặc biệt là trong những năm đầu sự nghiệp của Li. Cô thường tìm thấy mình trong những căn phòng nơi cô là một trong số rất ít phụ nữ. Cuốn sách không mô tả điều này như một cuộc xung đột kịch tính mà như một thực tế cơ bản ảnh hưởng đến cách cô định hướng trong lĩnh vực này.
Các trải nghiệm này cuối cùng đã góp phần vào nỗ lực sau này của Li nhằm mở rộng sự tham gia trong lĩnh vực AI. Cô trở thành một người ủng hộ sự đa dạng trong lĩnh vực này và giúp tạo ra các sáng kiến nhằm mang lại nhiều phụ nữ và nhóm thiểu số hơn vào nghiên cứu trí tuệ nhân tạo.
Thông điệp rộng lớn hơn xuất hiện là AI không nên được xây dựng bởi một phân khúc hẹp của xã hội. Nếu công nghệ này sẽ định hình thế giới, những người xây dựng nó nên phản ánh thế giới đó cũng vậy.
Khám Phá WordNet và Tầm Quan Trọng Của Các Cấu Trúc Kiến Thức
Cuốn sách bắt đầu đi sâu vào lịch sử kỹ thuật của AI khi Li gặp một cơ sở dữ liệu ngôn ngữ được gọi là WordNet trong quá trình học thuật của mình.
WordNet tổ chức các từ tiếng Anh thành các nhóm khái niệm liên quan được gọi là synsets. Những mối quan hệ khái niệm này ánh xạ ngôn ngữ theo cách giống như cách con người phân loại và hiểu thế giới.
Đối với Li, WordNet đại diện cho hơn một công cụ ngôn ngữ. Nó tiết lộ một khuôn khổ có thể cho việc dạy máy móc hiểu thông tin trực quan.
Vào thời điểm đó, nghiên cứu trí tuệ nhân tạo tập trung mạnh vào việc cải thiện các thuật toán. Nhưng Li bắt đầu nhìn thấy lĩnh vực này khác. Cô nhận ra rằng thực sự nút thắt trong học máy không chỉ là các mô hình tốt hơn mà còn là dữ liệu tốt hơn.
Nếu máy tính sẽ học cách nhận ra các đối tượng trong thế giới, chúng sẽ cần truy cập vào một số lượng lớn các ví dụ được gắn nhãn.
Sự nhận ra này cuối cùng sẽ dẫn đến một trong những tập dữ liệu quan trọng nhất từng được tạo ra.
Sự Tạo Tác Của ImageNet
Phần hấp dẫn nhất của cuốn sách tập trung vào việc tạo ra ImageNet.
ImageNet được thiết kế như một cơ sở dữ liệu trực quan khổng lồ có thể giúp máy móc học cách nhận ra các đối tượng. Sử dụng WordNet như một xương sống khái niệm, tập dữ liệu này tổ chức hàng triệu hình ảnh thành hàng nghìn danh mục đối tượng.
Quy mô của dự án này chưa từng có. Cuối cùng, tập dữ liệu này chứa hơn mười bốn triệu hình ảnh được gắn nhãn thuộc hơn hai mươi nghìn danh mục. Các nhà nghiên cứu và công nhân đám đông đã chú thích cẩn thận các hình ảnh để các thuật toán có thể học cách xác định các đối tượng như động vật, phương tiện, công cụ và các vật dụng hàng ngày.
Vào thời điểm đó, nhiều nhà nghiên cứu đặt câu hỏi liệu một tập dữ liệu như vậy có cần thiết hay không. Nghiên cứu trí tuệ nhân tạo vẫn tập trung mạnh vào việc thiết kế các thuật toán thông minh hơn chứ không phải thu thập lượng lớn dữ liệu.
Li có quan điểm ngược lại. Cô tin rằng các hệ thống học máy chỉ có thể cải thiện nếu chúng được đào tạo trên lượng lớn các ví dụ trong thế giới thực.
Cuốn sách mô tả chi tiết việc xây dựng ImageNet như thế nào. Dự án này đòi hỏi nhiều năm kiên nhẫn, thí nghiệm kỹ thuật và phối hợp quy mô lớn với hàng nghìn người đóng góp giúp gắn nhãn cho các hình ảnh.
Đây là một dự án khổng lồ mà ban đầu thu hút sự hoài nghi trong cộng đồng nghiên cứu.
Đột Phá Mà Thay Đổi Trí Tuệ Nhân Tạo
Điểm chuyển tiếp đến với Thử thách Nhận dạng Hình ảnh Quy mô Lớn của ImageNet.
Cuộc thi này mời các nhà nghiên cứu xây dựng các hệ thống có khả năng nhận dạng đối tượng trong tập dữ liệu khổng lồ này. Trong vài năm, tiến bộ là dần dần. Sau đó, vào năm 2012, một mạng nơ-ron sâu đã vượt trội so với các phương pháp trước đó.
Đột phá đó chứng minh sức mạnh của việc kết hợp các tập dữ liệu lớn với kiến trúc học sâu. Kết quả đã làm cho cộng đồng AI ngạc nhiên và kích hoạt một sự thay đổi nhanh chóng hướng tới các phương pháp mạng nơ-ron.
ImageNet trở thành sân tập mà cho phép nhiều tiến bộ trong thị giác máy tính sau này. Tập dữ liệu này giúp kích hoạt tiến bộ trong các lĩnh vực từ nhận dạng hình ảnh đến phương tiện tự hành, hình ảnh y tế và các hệ thống AI hiện đại phụ thuộc nặng vào sự hiểu biết trực quan.
Cuốn sách cung cấp một góc nhìn hiếm có về cách khoảnh khắc đó diễn ra và cách các nhà nghiên cứu nhận ra họ đang chứng kiến một bước ngoặt lớn trong lịch sử trí tuệ nhân tạo.
Trí Tuệ Nhân Tạo Định Hướng Con Người
Khi câu chuyện tiến triển, Li bắt đầu tập trung vào các ý nghĩa rộng lớn hơn của công nghệ mà cô đã giúp đẩy nhanh.
Cô lập luận rằng trí tuệ nhân tạo phải vẫn giữ nguyên là định hướng con người. Mục tiêu của AI không chỉ là xây dựng các hệ thống mạnh mẽ mà còn đảm bảo rằng những hệ thống đó mang lại lợi ích cho xã hội.
Quan điểm này phản ánh công việc sau này của Li trong học thuật và chính sách. Cô trở thành một giọng nói hàng đầu ủng hộ sự phát triển AI có trách nhiệm và giúp thúc đẩy các sáng kiến nhằm đảm bảo AI được xây dựng với các xem xét đạo đức.
Cuốn sách nhấn mạnh rằng tương lai của AI sẽ không chỉ được định hình bởi các đột phá công nghệ. Nó cũng sẽ được định hình bởi các lựa chọn mà các nhà nghiên cứu, kỹ sư và nhà hoạch định chính sách đưa ra về cách các hệ thống đó được triển khai.
Suy Nghĩ Cuối Cùng
The Worlds I See là nhiều hơn một cuốn hồi ký về trí tuệ nhân tạo.
Nó là câu chuyện về một cô gái nhập cư trẻ theo đuổi sự tò mò trong một quốc gia mới. Nó là một tài khoản chi tiết về cách một trong những tập dữ liệu quan trọng nhất trong học máy được tạo ra. Nó cũng là một sự phản ánh về trách nhiệm mà đi kèm với việc xây dựng các công nghệ có khả năng thay đổi xã hội.
Điều làm cho cuốn sách đặc biệt mạnh mẽ là những câu chuyện này không thể tách rời. Hành trình cá nhân của Li và sự tiến hóa của AI hiện đại diễn ra cùng nhau.
Đối với những người đọc quan tâm đến lịch sử của trí tuệ nhân tạo, cuốn sách này cung cấp một góc nhìn hiếm có từ một người đã giúp xây dựng nền tảng của lĩnh vực này. Đối với bất kỳ ai quan tâm đến mặt nhân văn của khám phá khoa học, nó cũng hấp dẫn không kém.
Trong nhiều cách, The Worlds I See nhắc nhở chúng ta rằng các cuộc cách mạng trong công nghệ hiếm khi bắt đầu với máy móc. Chúng bắt đầu với sự tò mò, sự kiên nhẫn và sự can đảm để theo đuổi những ý tưởng mà người khác có thể ban đầu bỏ qua.












