sơ khai Robot học cách yêu cầu trợ giúp như thế nào - Unite.AI
Kết nối với chúng tôi

Robotics

Robot đang học cách yêu cầu trợ giúp như thế nào

Được phát hành

 on

Trong thế giới robot đang phát triển, sự hợp tác mang tính đột phá giữa Đại học Princeton và Google là nổi bật. Các kỹ sư từ các tổ chức danh tiếng này đã phát triển một phương pháp đổi mới để dạy cho robot một kỹ năng quan trọng: nhận biết khi nào chúng cần trợ giúp và cách yêu cầu. Sự phát triển này đánh dấu một bước nhảy vọt đáng kể trong lĩnh vực robot, thu hẹp khoảng cách giữa chức năng tự động và tương tác giữa con người và robot.

Hành trình hướng tới những robot thông minh và độc lập hơn luôn bị cản trở bởi một thách thức lớn: sự phức tạp và mơ hồ của ngôn ngữ con người. Không giống như sự rõ ràng nhị phân của mã máy tính, ngôn ngữ của con người có nhiều sắc thái và sự tinh tế, khiến nó trở thành một mê cung cho robot. Ví dụ: một lệnh đơn giản như “nhấc cái bát lên” có thể trở thành một nhiệm vụ phức tạp khi có nhiều cái bát. Robot, được trang bị để cảm nhận môi trường và phản ứng với ngôn ngữ, thường thấy mình ở ngã ba đường khi phải đối mặt với những bất ổn về ngôn ngữ như vậy.

Định lượng độ không đảm bảo

Để giải quyết thách thức này, nhóm Princeton và Google đã giới thiệu một phương pháp tiếp cận mới có thể định lượng “độ mờ” của ngôn ngữ con người. Về cơ bản, kỹ thuật này đo lường mức độ không chắc chắn trong các lệnh ngôn ngữ và sử dụng số liệu này để hướng dẫn hành động của robot. Trong các tình huống mà một lệnh có thể dẫn đến nhiều cách diễn giải, giờ đây robot có thể đánh giá mức độ không chắc chắn và quyết định thời điểm cần làm rõ thêm. Ví dụ: trong môi trường có nhiều bát, mức độ không chắc chắn cao hơn sẽ khiến robot hỏi nên lấy bát nào, từ đó tránh được các lỗi tiềm ẩn hoặc hoạt động kém hiệu quả.

Cách tiếp cận này không chỉ giúp robot hiểu ngôn ngữ tốt hơn mà còn nâng cao tính an toàn và hiệu quả của chúng khi thực hiện nhiệm vụ. Bằng cách tích hợp các mô hình ngôn ngữ lớn (LLM) giống như các mô hình đằng sau ChatGPT, các nhà nghiên cứu đã thực hiện một bước quan trọng trong việc điều chỉnh các hành động của robot chặt chẽ hơn với mong đợi và nhu cầu của con người.

Vai trò của các mô hình ngôn ngữ lớn

Việc tích hợp LLM đóng một vai trò then chốt trong cách tiếp cận mới này. LLM là công cụ xử lý và giải thích ngôn ngữ của con người. Trong bối cảnh này, chúng được sử dụng để đánh giá và đo lường mức độ không chắc chắn trong các lệnh ngôn ngữ được đưa ra cho robot.

Tuy nhiên, việc phụ thuộc vào LLM không phải là không có thách thức. Như nhóm nghiên cứu đã chỉ ra, kết quả đầu ra từ LLM đôi khi có thể không đáng tin cậy.

Anirudha Majumdar, trợ lý giáo sư tại Princeton, nhấn mạnh tầm quan trọng của sự cân bằng này:

“Việc tuân theo các kế hoạch do LLM tạo ra một cách mù quáng có thể khiến robot hành động theo cách không an toàn hoặc không đáng tin cậy và vì vậy chúng tôi cần các robot dựa trên LLM của mình biết khi nào chúng không biết.”

Điều này nhấn mạnh sự cần thiết của một cách tiếp cận đa sắc thái, trong đó LLM được sử dụng làm công cụ hướng dẫn thay vì là những người ra quyết định chắc chắn.

Ứng dụng thực tế và thử nghiệm

Tính thực tế của phương pháp này đã được thử nghiệm trong nhiều tình huống khác nhau, minh họa tính linh hoạt và hiệu quả của nó. Một thử nghiệm như vậy liên quan đến một cánh tay robot, có nhiệm vụ phân loại các món đồ chơi thực phẩm thành các loại khác nhau. Thiết lập đơn giản này đã chứng tỏ khả năng của robot trong việc điều hướng các nhiệm vụ với những lựa chọn rõ ràng một cách hiệu quả.

Hình ảnh: Đại học Princeton

Độ phức tạp tăng lên đáng kể trong một thí nghiệm khác có cánh tay robot gắn trên bệ có bánh xe trong nhà bếp văn phòng. Tại đây, robot phải đối mặt với những thách thức trong thế giới thực như xác định đúng vật phẩm để đặt vào lò vi sóng khi có nhiều lựa chọn.

Thông qua các thử nghiệm này, robot đã thể hiện thành công khả năng sử dụng độ không đảm bảo định lượng để đưa ra quyết định hoặc tìm kiếm sự làm rõ, từ đó xác nhận tính hữu ích thực tế của phương pháp này.

Ý nghĩa và nghiên cứu trong tương lai

Nhìn về phía trước, ý nghĩa của nghiên cứu này còn vượt xa các ứng dụng hiện tại. Nhóm nghiên cứu do Majumdar và sinh viên tốt nghiệp Allen Ren dẫn đầu đang khám phá cách áp dụng phương pháp này cho các vấn đề phức tạp hơn về nhận thức robot và AI. Điều này bao gồm các tình huống trong đó robot cần kết hợp thông tin về thị giác và ngôn ngữ để đưa ra quyết định, tiếp tục thu hẹp khoảng cách giữa hiểu biết của robot và tương tác của con người.

Nghiên cứu đang diễn ra nhằm mục đích không chỉ nâng cao khả năng của robot thực hiện các nhiệm vụ với độ chính xác cao hơn mà còn điều hướng thế giới với sự hiểu biết giống như nhận thức của con người. Nghiên cứu này có thể mở đường cho các robot không chỉ hiệu quả hơn và an toàn hơn mà còn phù hợp hơn với nhu cầu đa dạng của môi trường con người.

Bạn có thể tìm thấy nghiên cứu được công bố tại đây.

Alex McFarland là một nhà báo và nhà văn về AI đang khám phá những phát triển mới nhất về trí tuệ nhân tạo. Anh ấy đã cộng tác với nhiều công ty khởi nghiệp và ấn phẩm về AI trên toàn thế giới.