Trí tuệ nhân tạo
Quân đội Mỹ Đang Tiến gần hơn đến Xe Chiến đấu Tự động Off-Road

Các nhà nghiên cứu tại Bộ Chỉ huy Phát triển Khả năng Chiến đấu của Lục quân Mỹ và Đại học Texas tại Austin đã phát triển một thuật toán có thể có những ý nghĩa lớn đối với xe tự động. Với thuật toán, xe tự động mặt đất có thể cải thiện hệ thống điều hướng của mình bằng cách quan sát một người lái.
Phương pháp được phát triển bởi các nhà nghiên cứu được gọi là học thông số lập kế hoạch thích ứng từ biểu diễn, hoặc APPLD. Nó đã được thử nghiệm trên một xe tự động mặt đất thí nghiệm của Quân đội.
Nghiên cứu đã được công bố trong IEEE Robotics and Automation Letters. Công việc này có tiêu đề “APPLD: Học thông số lập kế hoạch thích ứng từ biểu diễn.”
APPLD
Tiến sĩ Garrett Warnell là một nhà nghiên cứu của Quân đội.
“Sử dụng các phương pháp như APPLD, các binh sĩ hiện tại trong các cơ sở đào tạo hiện có sẽ có thể đóng góp vào việc cải thiện các hệ thống tự động chỉ bằng cách vận hành xe của họ như bình thường,” Warnell nói. “Các kỹ thuật như những này sẽ là một đóng góp quan trọng cho kế hoạch của Quân đội để thiết kế và triển khai các xe chiến đấu thế hệ tiếp theo được trang bị để điều hướng tự động trong môi trường triển khai off-road.”
Để phát triển hệ thống mới, các nhà nghiên cứu đã kết hợp các thuật toán học máy từ biểu diễn và các hệ thống điều hướng tự động cổ điển. Một trong những tính năng tốt nhất của phương pháp này là nó cho phép APPLD cải thiện một hệ thống hiện có để hành xử giống như một con người, chứ không phải thay thế toàn bộ hệ thống cổ điển.
Do đó, hệ thống được triển khai có thể giữ lại các tính năng như tối ưu, giải thích và an toàn, hiện diện trong các hệ thống điều hướng cổ điển, đồng thời tạo ra một hệ thống linh hoạt hơn có thể thích nghi với các môi trường mới.
“Một biểu diễn duy nhất của lái xe con người, được cung cấp bằng cách sử dụng một bộ điều khiển không dây Xbox thông thường, cho phép APPLD học cách điều chỉnh hệ thống điều hướng tự động hiện có khác nhau tùy thuộc vào môi trường cục bộ cụ thể,” Warnell nói. “Ví dụ, khi trong một hành lang hẹp, người lái xe đã giảm tốc độ và lái xe cẩn thận. Sau khi quan sát hành vi này, hệ thống tự động học cách giảm tốc độ tối đa và tăng ngân sách tính toán trong các môi trường tương tự. Điều này cuối cùng cho phép xe điều hướng tự động thành công trong các hành lang hẹp khác nơi nó đã thất bại trước đó.”
https://www.youtube.com/watch?v=u2xxPTZA0DY
Kết quả cho thấy hệ thống APPLD đã được đào tạo có thể điều hướng các môi trường thử nghiệm hiệu quả hơn và với ít sai sót hơn so với hệ thống cổ điển. Ngoài ra, nó cũng có thể điều hướng môi trường nhanh hơn người phụ trách đào tạo nó.
Tiến sĩ Peter Stone là giáo sư và chủ tịch Liên minh Robot tại UT Austin.
“Từ quan điểm học máy, APPLD trái ngược với các hệ thống học cuối cùng đến cuối cùng cố gắng học toàn bộ hệ thống điều hướng từ đầu,” Stone nói. “Các phương pháp này thường yêu cầu nhiều dữ liệu và có thể dẫn đến các hành vi không an toàn hoặc không mạnh mẽ. APPLD tận dụng các phần của hệ thống điều khiển đã được thiết kế cẩn thận, trong khi tập trung nỗ lực học máy của nó vào quá trình điều chỉnh thông số, thường được thực hiện dựa trên trực giác của một người.”
Hệ thống mới cho phép những người không chuyên trong lĩnh vực robot đào tạo và cải thiện điều hướng xe tự động. Ví dụ, một số lượng người dùng không giới hạn có thể cung cấp dữ liệu cần thiết cho hệ thống để cải thiện bản thân, thay vì dựa vào một nhóm kỹ sư chuyên gia để thay đổi hệ thống thủ công.
Tiến sĩ Jonathan Fink là một nhà nghiên cứu của Quân đội.
“Các hệ thống điều hướng tự động hiện tại thường phải được điều chỉnh lại bằng tay cho từng môi trường triển khai mới,” Fink nói. “Quá trình này cực kỳ khó khăn – nó phải được thực hiện bởi người có đào tạo chuyên sâu về robot, và nó yêu cầu nhiều thử nghiệm và sai sót cho đến khi tìm thấy các cài đặt hệ thống phù hợp. Ngược lại, APPLD điều chỉnh hệ thống tự động bằng cách quan sát một người lái hệ thống – điều mà bất kỳ ai cũng có thể làm nếu họ có kinh nghiệm với bộ điều khiển trò chơi video. Trong quá trình triển khai, APPLD cũng cho phép hệ thống điều chỉnh lại bản thân trong thời gian thực khi môi trường thay đổi.”
Sử dụng Quân sự
Hệ thống này sẽ hữu ích cho Quân đội, hiện đang làm việc trên việc phát triển các xe chiến đấu hiện đại hóa tùy chọn và xe chiến đấu robot. Hiện tại, nhiều môi trường quá phức tạp cho ngay cả các hệ thống điều hướng tự động tốt nhất.
Tiến sĩ Xuesu Xiao là một nhà nghiên cứu sau tiến sĩ tại UT Austin và là tác giả chính của bài báo.
“Ngoài ý nghĩa ngay lập tức đối với Quân đội, APPLD cũng tạo ra cơ hội để bắc cầu giữa các phương pháp kỹ thuật truyền thống và các kỹ thuật học máy mới nổi, để tạo ra các robot di động mạnh mẽ, thích ứng và đa năng trong thế giới thực,” Xiao nói
Hệ thống APPLD sẽ được thử nghiệm trong các môi trường ngoài trời khác nhau. Đội ngũ các nhà nghiên cứu cũng sẽ xem liệu thông tin cảm biến bổ sung có thể giúp các hệ thống học các hành vi phức tạp hơn.












