Robot

Làm thế nào robot học hỏi để yêu cầu giúp đỡ

mm

Trong thế giới robot đang phát triển, một sự hợp tác đột phá giữa Đại học Princeton và Google nổi bật. Các kỹ sư từ những cơ quan danh tiếng này đã phát triển một phương pháp đổi mới dạy cho robot một kỹ năng quan trọng: nhận biết khi họ cần giúp đỡ và cách yêu cầu nó. Sự phát triển này đánh dấu một bước nhảy vĩ đại trong lĩnh vực robot, bắc cầu giữa hoạt động tự động và tương tác giữa con người và robot.

Con đường hướng tới các robot thông minh và độc lập hơn luôn bị cản trở bởi một thách thức quan trọng: sự phức tạp và mơ hồ của ngôn ngữ con người. Không giống như sự rõ ràng của mã máy tính, ngôn ngữ con người đầy rẫy những sắc thái và phức tạp, khiến nó trở thành một mê cung đối với robot. Ví dụ, một lệnh đơn giản như “nhặt bát” có thể trở thành một nhiệm vụ phức tạp khi có nhiều bát hiện diện. Robot, được trang bị để cảm nhận môi trường và phản ứng với ngôn ngữ, thường tìm mình ở ngã tư khi đối mặt với những bất ổn ngôn ngữ như vậy.

Định lượng sự không chắc chắn

Để giải quyết thách thức này, nhóm Princeton và Google đã giới thiệu một phương pháp mới định lượng ‘sự mờ’ của ngôn ngữ con người. Kỹ thuật này đo lường mức độ không chắc chắn trong các lệnh ngôn ngữ và sử dụng số liệu này để hướng dẫn hành động của robot. Trong các tình huống mà một lệnh có thể dẫn đến nhiều cách hiểu, robot bây giờ có thể đo lường mức độ không chắc chắn và quyết định khi nào cần làm rõ thêm. Ví dụ, trong một môi trường có nhiều bát, mức độ không chắc chắn cao hơn sẽ khiến robot hỏi bát nào để nhặt, từ đó tránh các lỗi hoặc hiệu quả không cần thiết.

Phương pháp này không chỉ trao cho robot sự hiểu biết ngôn ngữ tốt hơn mà còn tăng cường sự an toàn và hiệu quả trong việc thực hiện nhiệm vụ. Bằng cách tích hợp các mô hình ngôn ngữ lớn (LLM) như những mô hình đằng sau ChatGPT, các nhà nghiên cứu đã thực hiện một bước quan trọng trong việc điều chỉnh hành động của robot gần hơn với kỳ vọng và nhu cầu của con người.

Vai trò của các mô hình ngôn ngữ lớn

Tích hợp LLM đóng vai trò quan trọng trong phương pháp mới này. LLM là công cụ quan trọng trong việc xử lý và giải thích ngôn ngữ con người. Trong bối cảnh này, chúng được sử dụng để đánh giá và đo lường sự không chắc chắn hiện diện trong các lệnh ngôn ngữ cho robot.

Tuy nhiên, việc dựa vào LLM không phải là không có thách thức. Như nhóm nghiên cứu đã chỉ ra, đầu ra từ LLM đôi khi có thể không đáng tin cậy.

Anirudha Majumdar, giáo sư trợ lý tại Princeton, nhấn mạnh tầm quan trọng của sự cân bằng này:

“Theo đuổi mù quáng các kế hoạch được tạo ra bởi LLM có thể khiến robot hành động theo cách không an toàn hoặc không đáng tin cậy, và vì vậy chúng tôi cần robot dựa trên LLM của mình biết khi nào họ không biết.”

Điều này nhấn mạnh sự cần thiết của một cách tiếp cận tinh tế, nơi LLM được sử dụng như các công cụ hướng dẫn chứ không phải là những người quyết định không thể sai lầm.

Ứng dụng thực tế và thử nghiệm

Tính thực tế của phương pháp này đã được thử nghiệm trong nhiều kịch bản, minh họa sự đa năng và hiệu quả của nó. Một thử nghiệm như vậy liên quan đến một cánh tay robot, được giao nhiệm vụ phân loại các món ăn đồ chơi vào các danh mục khác nhau. Cài đặt đơn giản này đã chứng minh khả năng của robot trong việc điều hướng các nhiệm vụ với lựa chọn rõ ràng một cách hiệu quả.

Hình ảnh: Đại học Princeton

Sự phức tạp tăng lên đáng kể trong một thí nghiệm khác với cánh tay robot được gắn trên một nền tảng có bánh xe trong một nhà bếp văn phòng. Tại đây, robot phải đối mặt với các thách thức của thế giới thực như xác định món ăn đúng để đặt vào lò vi sóng khi có nhiều lựa chọn.

Qua những thử nghiệm này, robot đã chứng minh thành công khả năng sử dụng sự không chắc chắn định lượng để đưa ra quyết định hoặc yêu cầu làm rõ, do đó xác nhận tính hữu ích thực tế của phương pháp này.

Ảnh hưởng tương lai và nghiên cứu

Nhìn về phía trước, ảnh hưởng của nghiên cứu này mở rộng xa hơn các ứng dụng hiện tại. Nhóm nghiên cứu, dẫn đầu bởi Majumdar và sinh viên sau đại học Allen Ren, đang khám phá cách tiếp cận này có thể được áp dụng cho các vấn đề phức tạp hơn trong nhận thức robot và trí tuệ nhân tạo. Điều này bao gồm các kịch bản mà robot cần kết hợp thông tin thị giác và ngôn ngữ để đưa ra quyết định, từ đó thu hẹp khoảng cách giữa hiểu biết của robot và tương tác con người.

Nghiên cứu đang diễn ra nhằm không chỉ tăng cường khả năng của robot trong việc thực hiện nhiệm vụ với độ chính xác cao hơn mà còn điều hướng thế giới với sự hiểu biết tương tự như nhận thức của con người. Nghiên cứu này có thể mở đường cho robot không chỉ hiệu quả và an toàn hơn mà còn phù hợp hơn với nhu cầu tinh vi của môi trường con người.

Bạn có thể tìm thấy nghiên cứu được công bố tại đây.

Alex McFarland là một nhà báo và nhà văn về trí tuệ nhân tạo, khám phá những phát triển mới nhất trong lĩnh vực trí tuệ nhân tạo. Ông đã hợp tác với nhiều công ty khởi nghiệp và xuất bản về trí tuệ nhân tạo trên toàn thế giới.