Trí tuệ nhân tạo

Tầm nhìn ngoại vi của AI có thể cải thiện công nghệ và an toàn như thế nào

cập nhật on 18 Tháng ba, 2024

Tầm nhìn ngoại vi, một khía cạnh thường bị bỏ qua trong tầm nhìn của con người, đóng một vai trò then chốt trong cách chúng ta tương tác và hiểu được môi trường xung quanh. Nó cho phép chúng ta phát hiện và nhận biết các hình dạng, chuyển động và các tín hiệu quan trọng không nằm trong tầm nhìn trực tiếp của chúng ta, do đó mở rộng tầm nhìn của chúng ta ra ngoài khu vực trung tâm tập trung. Khả năng này rất quan trọng đối với các công việc hàng ngày, từ việc di chuyển trên những con phố đông đúc cho đến phản ứng với những chuyển động đột ngột trong thể thao.

Tại Viện Công nghệ Massachusetts (MIT), các nhà nghiên cứu đang đào sâu vào lĩnh vực trí tuệ nhân tạo với một cách tiếp cận sáng tạo, nhằm mục đích cung cấp cho các mô hình AI một dạng mô phỏng tầm nhìn ngoại vi. Công trình mang tính đột phá của họ nhằm mục đích thu hẹp khoảng cách đáng kể về khả năng AI hiện tại, vốn thiếu khả năng nhận thức ngoại vi, không giống như con người. Hạn chế này trong các mô hình AI hạn chế tiềm năng của chúng trong các tình huống cần phát hiện ngoại vi, chẳng hạn như trong hệ thống lái xe tự động hoặc trong môi trường năng động, phức tạp.

Hiểu tầm nhìn ngoại vi trong AI

Tầm nhìn ngoại vi ở con người được đặc trưng bởi khả năng nhận thức và giải thích thông tin ở vùng ngoại vi của tiêu điểm thị giác trực tiếp của chúng ta. Mặc dù tầm nhìn này ít chi tiết hơn tầm nhìn trung tâm nhưng nó rất nhạy cảm với chuyển động và đóng vai trò quan trọng trong việc cảnh báo chúng ta về những mối nguy hiểm và cơ hội tiềm ẩn trong môi trường của chúng ta.

Ngược lại, các mô hình AI thường phải vật lộn với khía cạnh tầm nhìn này. Các hệ thống thị giác máy tính hiện tại được thiết kế chủ yếu để xử lý và phân tích các hình ảnh nằm ngay trong tầm nhìn của chúng, giống như tầm nhìn trung tâm ở con người. Điều này để lại một điểm mù đáng kể trong nhận thức AI, đặc biệt là trong các tình huống mà thông tin ngoại vi rất quan trọng để đưa ra quyết định sáng suốt hoặc phản ứng với những thay đổi không lường trước được của môi trường.

Nghiên cứu do MIT thực hiện đã giải quyết được khoảng trống quan trọng này. Bằng cách kết hợp một dạng tầm nhìn ngoại vi vào các mô hình AI, nhóm nghiên cứu đặt mục tiêu tạo ra các hệ thống không chỉ nhìn thấy mà còn giải thích thế giới theo cách gần giống với tầm nhìn của con người hơn. Tiến bộ này có tiềm năng nâng cao các ứng dụng AI trong nhiều lĩnh vực khác nhau, từ an toàn ô tô đến robot và thậm chí có thể góp phần nâng cao hiểu biết của chúng ta về xử lý hình ảnh của con người.

Phương pháp tiếp cận MIT

Để đạt được điều này, họ đã mô phỏng lại cách AI xử lý và cảm nhận hình ảnh, đưa nó đến gần hơn với trải nghiệm của con người. Trọng tâm trong cách tiếp cận của họ là sử dụng mô hình ốp lát kết cấu đã được sửa đổi. Các phương pháp truyền thống thường chỉ dựa vào việc làm mờ các cạnh của hình ảnh để mô phỏng tầm nhìn ngoại vi. Tuy nhiên, các nhà nghiên cứu của MIT nhận ra rằng phương pháp này không thể hiện chính xác sự mất mát thông tin phức tạp xảy ra trong tầm nhìn ngoại vi của con người.

Để giải quyết vấn đề này, họ đã cải tiến mô hình xếp lát kết cấu, một kỹ thuật ban đầu được thiết kế để mô phỏng tầm nhìn ngoại vi của con người. Mô hình được sửa đổi này cho phép chuyển đổi hình ảnh có nhiều sắc thái hơn, ghi lại mức độ mất chi tiết xảy ra khi ánh mắt của một người di chuyển từ trung tâm đến ngoại vi.

Một phần thiết yếu của nỗ lực này là tạo ra một bộ dữ liệu toàn diện, được thiết kế đặc biệt để đào tạo các mô hình học máy trong việc nhận biết và diễn giải thông tin hình ảnh ngoại vi. Tập dữ liệu này bao gồm một loạt các hình ảnh, mỗi hình ảnh được biến đổi tỉ mỉ để thể hiện các mức độ trung thực hình ảnh ngoại vi khác nhau. Bằng cách đào tạo các mô hình AI bằng tập dữ liệu này, các nhà nghiên cứu nhằm mục đích truyền cho họ nhận thức thực tế hơn về hình ảnh ngoại vi, giống như quá trình xử lý hình ảnh của con người.

Những phát hiện và ý nghĩa

Sau khi đào tạo các mô hình AI bằng bộ dữ liệu mới này, nhóm MIT đã bắt tay vào so sánh tỉ mỉ hiệu suất của các mô hình này với khả năng của con người trong các nhiệm vụ phát hiện đối tượng. Kết quả thật sáng sủa. Mặc dù các mô hình AI thể hiện khả năng phát hiện và nhận dạng vật thể ở ngoại vi được cải thiện nhưng hiệu suất của chúng vẫn chưa ngang bằng với khả năng của con người.

Một trong những phát hiện nổi bật nhất là mô hình hiệu suất khác biệt và những hạn chế cố hữu của AI trong bối cảnh này. Không giống như con người, kích thước của vật thể hoặc mức độ lộn xộn về mặt thị giác không ảnh hưởng đáng kể đến hiệu suất của mô hình AI, cho thấy sự khác biệt cơ bản trong cách AI và con người xử lý thông tin hình ảnh ngoại vi.

Những phát hiện này có ý nghĩa sâu sắc đối với các ứng dụng khác nhau. Trong lĩnh vực an toàn ô tô, hệ thống AI với tầm nhìn ngoại vi nâng cao có thể giảm đáng kể tai nạn bằng cách phát hiện các mối nguy hiểm tiềm ẩn nằm ngoài tầm nhìn trực tiếp của người lái xe hoặc cảm biến. Công nghệ này cũng có thể đóng một vai trò then chốt trong việc tìm hiểu hành vi của con người, đặc biệt là cách chúng ta xử lý và phản ứng với các kích thích thị giác ở ngoại vi.

Ngoài ra, tiến bộ này hứa hẹn sẽ cải thiện giao diện người dùng. Bằng cách hiểu cách AI xử lý tầm nhìn ngoại vi, các nhà thiết kế và kỹ sư có thể phát triển các giao diện trực quan và phản hồi nhanh hơn, phù hợp hơn với tầm nhìn tự nhiên của con người, từ đó tạo ra các hệ thống thân thiện và hiệu quả hơn với người dùng.

Về bản chất, công trình của các nhà nghiên cứu MIT không chỉ đánh dấu một bước tiến quan trọng trong quá trình phát triển tầm nhìn AI mà còn mở ra những chân trời mới để tăng cường sự an toàn, hiểu biết nhận thức của con người và cải thiện tương tác của người dùng với công nghệ.

Bằng cách thu hẹp khoảng cách giữa nhận thức của con người và máy móc, nghiên cứu này mở ra rất nhiều khả năng trong tiến bộ công nghệ và cải tiến an toàn. Ý nghĩa của nghiên cứu này mở rộng sang nhiều lĩnh vực, hứa hẹn một tương lai nơi AI không chỉ có thể nhìn giống chúng ta hơn mà còn hiểu và tương tác với thế giới theo cách đa sắc thái và phức tạp hơn.

Chủ đề liên quan:Tầm nhìn máy tính

Sự tiến hóa thầm lặng trong AI: Sự trỗi dậy của các hệ thống AI phức hợp vượt ra ngoài các mô hình AI truyền thống

Đừng bỏ lỡ

Thế hệ tiếp theo của AI tí hon: Điện toán lượng tử, Chip thần kinh và hơn thế nữa

Alex McFarland

Alex McFarland là một nhà báo và nhà văn về AI đang khám phá những phát triển mới nhất về trí tuệ nhân tạo. Anh ấy đã cộng tác với nhiều công ty khởi nghiệp và ấn phẩm về AI trên toàn thế giới.