Robot
Khả năng Xử lý Ánh Sáng Của Não Bộ Con Người Có Thể Dẫn Đến Cảm Biến Robot Tốt Hơn

Não bộ con người thường là nguồn cảm hứng cho trí tuệ nhân tạo (AI), và đó là trường hợp một lần nữa khi một nhóm các nhà nghiên cứu của Quân đội đã quản lý để cải thiện cảm biến robot bằng cách xem xét cách não bộ con người xử lý ánh sáng sáng và tương phản.
Theo các nhà nghiên cứu, điều quan trọng là cảm biến máy phải hiệu quả trên các môi trường thay đổi, điều này dẫn đến sự phát triển của tính tự chủ.
Nghiên cứu được công bố trên Tạp chí Thị giác.
Khả năng Hiển thị 100.000 đến 1
Andre Harrison là một nhà nghiên cứu tại U.S. Army Combat Capabilities Development Command’s Army Research Laboratory.
“Khi chúng tôi phát triển các thuật toán học máy, hình ảnh thế giới thực thường được nén vào một phạm vi hẹp hơn, như một máy ảnh điện thoại di động, trong một quá trình gọi là ánh xạ âm sắc,” Harrison nói. “Điều này có thể góp phần làm cho các thuật toán tầm nhìn máy trở nên giòn hơn vì chúng dựa trên hình ảnh nhân tạo không hoàn toàn phù hợp với các mẫu chúng ta thấy trong thế giới thực.”
Đội ngũ các nhà nghiên cứu đã phát triển một hệ thống với khả năng hiển thị 100.000 đến 1, điều này cho phép họ có được cái nhìn sâu sắc vào quá trình tính toán của não bộ trong thế giới thực.
Theo Harrison, điều này cho phép đội ngũ thực hiện sự bền vững sinh học vào các cảm biến.
Các thuật toán tầm nhìn hiện tại vẫn còn một chặng đường dài để trở nên lý tưởng.
Điều này liên quan đến phạm vi sáng độ hạn chế, ở mức tỷ lệ 100 đến 1, do các thuật toán dựa trên nghiên cứu về con người và động vật với màn hình máy tính.
Tỷ lệ 100 đến 1 là thấp hơn so với lý tưởng trong thế giới thực, nơi sự thay đổi có thể lên đến 100.000 đến 1.
Tỷ lệ cao này được gọi là phạm vi động cao, hoặc HDR.
Tiến sĩ Chou Po Hung là một nhà nghiên cứu của Quân đội.
“Thay đổi và biến đổi đáng kể trong ánh sáng có thể thách thức các hệ thống của Quân đội — máy bay không người lái bay dưới tán cây rừng có thể bị nhầm lẫn bởi sự thay đổi phản xạ khi gió thổi qua lá, hoặc xe tự hành di chuyển trên địa hình gồ ghề có thể không nhận ra ổ gà hay chướng ngại vật khác vì điều kiện ánh sáng khác với những gì mà các thuật toán tầm nhìn của chúng được đào tạo,” Hung nói.
Khả năng Nén Của Não Bộ Con Người
Não bộ con người có khả năng tự động nén đầu vào 100.000 đến 1 vào một phạm vi hẹp hơn, và điều này cho phép con người diễn giải hình dạng.
Đội ngũ các nhà nghiên cứu đã tìm hiểu quá trình này bằng cách nghiên cứu xử lý thị giác sớm dưới HDR.
“Não bộ có hơn 30 khu vực thị giác, và chúng tôi vẫn chỉ có một sự hiểu biết cơ bản về cách các khu vực này xử lý hình ảnh của mắt thành sự hiểu biết về hình dạng 3D,” Hung tiếp tục.
“Kết quả của chúng tôi với các nghiên cứu về độ sáng HDR, dựa trên hành vi của con người và ghi lại từ vương miện, cho thấy chúng tôi biết rất ít về cách bắc cầu từ môi trường phòng thí nghiệm đến môi trường thế giới thực.
Nhưng những phát hiện này giúp chúng tôi thoát khỏi hộp đó, cho thấy rằng những giả định trước đây của chúng tôi từ màn hình máy tính tiêu chuẩn có khả năng khái quát hóa thấp đến thế giới thực, và chúng tiết lộ các nguyên tắc có thể hướng dẫn mô hình hóa của chúng tôi đến các cơ chế chính xác.”
Bằng cách khám phá cách ánh sáng và cạnh tương phản tương tác trong biểu diễn thị giác của não bộ, các thuật toán sẽ hiệu quả hơn trong việc tái tạo thế giới 3D dưới độ sáng của thế giới thực.
Khi ước tính hình dạng 3D từ thông tin 2D, luôn có sự mơ hồ, nhưng việc khám phá này cho phép chúng được sửa chữa.
“Qua hàng triệu năm tiến hóa, não bộ của chúng ta đã phát triển các lối tắt hiệu quả để tái tạo 3D từ thông tin 2D,” Hung nói.
“Đây là một vấn đề đã tồn tại hàng thập kỷ vẫn tiếp tục thách thức các nhà khoa học tầm nhìn máy, ngay cả với những tiến bộ gần đây trong AI.”
Phát hiện của đội ngũ cũng quan trọng cho sự phát triển của các thiết bị AI như radar và hiểu giọng nói từ xa, những thiết bị sử dụng cảm biến phạm vi động rộng.
“Vấn đề phạm vi động không chỉ là một vấn đề cảm biến,” Hung nói.
“Nó cũng có thể là một vấn đề tính toán não bộ chung hơn vì mỗi nơ-ron có hàng chục nghìn đầu vào.
Làm thế nào bạn xây dựng các thuật toán và kiến trúc có thể lắng nghe các đầu vào chính xác trên các ngữ cảnh khác nhau?
Chúng tôi hy vọng rằng, bằng cách làm việc trên vấn đề này ở mức độ cảm biến, chúng tôi có thể xác nhận rằng chúng tôi đang trên đúng hướng, để chúng tôi có thể có các công cụ phù hợp khi xây dựng các AI phức tạp hơn.”










