Trí tuệ nhân tạo
Máy tính có thể xác định 200 loài chim từ một bức ảnh

Các nhà nghiên cứu từ Đại học Duke đã sử dụng học máy để đào tạo một máy tính xác định lên đến 200 loài chim khác nhau. Máy tính chỉ yêu cầu một bức ảnh để hoàn thành quá trình xác định. Đối với con người, nhiều năm quan sát chim thường được yêu cầu để có thể xác định các loài khác nhau.
Nghiên cứu được dẫn dắt bởi sinh viên tiến sĩ khoa học máy tính của Duke, Chaofan Chen, cùng với sinh viên đại học Oscar Li. Nó cũng được thực hiện bởi các thành viên khác của Phòng thí nghiệm Phân tích Dự đoán do giáo sư Duke Cynthia Rudin chỉ đạo.
Trí tuệ nhân tạo thể hiện suy nghĩ của nó
Trong khi quá trình xác định ấn tượng, có một khía cạnh quan trọng hơn của sự phát triển. Trí tuệ nhân tạo có thể thể hiện suy nghĩ của nó, cho phép thậm chí những người quan sát chim không có kinh nghiệm hiểu quá trình.
Mạng lưới thần kinh sâu, hoặc các thuật toán dựa trên hoạt động của não, được đào tạo với 11.788 bức ảnh. Các bức ảnh bao gồm 200 loài chim khác nhau, từ vịt đến chim ruồi.
Đội ngũ nhà nghiên cứu không cần phải đào tạo cụ thể mạng lưới để xác định mỏ hoặc lông cánh. Thay vào đó, mạng lưới có thể lấy một bức ảnh của một con chim và xác định các mẫu nhất định trong hình ảnh. Nó có thể lấy những mẫu đó và xác định các mẫu trước đó mà nó đã gặp trong các đặc điểm loài điển hình.
Theo đội ngũ, mạng lưới sau đó tạo ra một loạt các bản đồ nhiệt xác định các đặc điểm nhất định. Ví dụ, nó có thể phân biệt giữa một con chim warbler bình thường và một con chim warbler có mũ, cùng với các đặc điểm khác như đầu có mũ và bụng vàng. Sau đó, nó chỉ ra rằng những đặc điểm này là gì đã dẫn đến việc xác định.
Khác với các hệ thống khác
Mạng lưới thần kinh có thể xác định loài chính xác lên đến 84% thời gian. Điều này tương tự như một số hệ thống hoạt động tốt nhất. Sự khác biệt là những hệ thống đó không giải thích quá trình suy nghĩ như hệ thống này.
Theo Rudin, khía cạnh cách mạng nhất của dự án này là nó cung cấp hình ảnh hóa cho những gì các mạng lưới thần kinh sâu nhìn thấy khi chúng xem một hình ảnh.
Công nghệ này cũng đang được sử dụng trên các trang web truyền thông xã hội, để xác định các nghi phạm trong camera giám sát, và giúp các phương tiện tự động xác định đèn giao thông và người đi bộ.
Phần mềm học sâu thường không yêu cầu phải lập trình rõ ràng để học từ dữ liệu, điều này không phải là trường hợp của phần mềm truyền thống. Tuy nhiên, quá trình này không luôn rõ ràng hoặc được hiển thị, vì vậy nó thường khó giải thích cách các thuật toán “suy nghĩ” khi phân loại một hình ảnh.
Tương lai
Rudin và những người khác hiện đang làm việc trên các mô hình học sâu mới cho trí tuệ nhân tạo, đẩy lĩnh vực này tiến về phía trước. Các mô hình mới có thể giải thích lý do và quá trình xác định của chúng. Điều này giúp các nhà nghiên cứu xem từ đầu đến cuối, và nó làm cho việc xác định lý do đằng sau một sai lầm hoặc vấn đề trở nên dễ dàng hơn.
Rudin và đội ngũ của cô sẽ làm việc trên việc sử dụng thuật toán trong lĩnh vực y tế. Nó có thể xác định các khu vực vấn đề nhất định trong các hình ảnh y tế như chụp X-quang vú. Điều này sẽ giúp các chuyên gia y tế phát hiện các cục u, vôi hóa, và các dấu hiệu khác của ung thư vú.
Theo Rudin, mạng lưới mô phỏng cách các bác sĩ chẩn đoán.
“Đây là suy nghĩ dựa trên trường hợp,” Rudin nói. “Chúng tôi hy vọng chúng tôi có thể giải thích tốt hơn cho các bác sĩ hoặc bệnh nhân tại sao hình ảnh của họ được phân loại bởi mạng lưới là ác tính hoặc lành tính.”
Đội ngũ sẽ trình bày một bài báo bao gồm nghiên cứu của họ tại Hội nghị thứ ba mươi ba về Xử lý Thông tin Thần kinh (NeurlIPS2019) tại Vancouver vào ngày 12 tháng 12.
Nghiên cứu cũng bao gồm các tác giả Daniel Tao và Alina Barnerr của Duke và Jonathan Su tại Phòng thí nghiệm Lincoln của MIT.












