Робототехніка
Як Роботи Навчаються Проходити Про допомогу

У світі робототехніки виділяється новаторське співробітництво між Принстонським університетом і Google. Інженери цих престижних закладів розробили інноваційний метод, який вчить роботів важливому навику: визнавати, коли їм потрібна допомога, і як про неї просити. Цей розвиток став значним кроком вперед у робототехніці, звузивши розрив між автономною діяльністю та взаємодією людини і робота.
Дорога до більш інтелектуальних та незалежних роботів завжди була ускладнена однією значною проблемою: складністю та двозначністю людської мови. На відміну від двійкової ясності комп’ютерних кодів, людська мова наповнена нюансами та тонкостями, роблячи її лабіринтом для роботів. Наприклад, команда такої простої, як “підніміть чашку”, може стати складним завданням, коли присутнє кілька чашок. Роботи, обладнані для сприйняття середовища та реагування на мову, часто знаходяться на розі, коли стикаються з такими лінгвістичними невизначеностями.
Квантуюча Невизначеність
Розглянувши цю проблему, команда Принстона і Google ввела новий підхід, який квантуює “розмитість” людської мови. Цей метод міряє рівень невизначеності в мовних командах і використовує цю міру для керування діями робота. У ситуаціях, коли команда може привести до кількох інтерпретацій, робот тепер може оцінити рівень невизначеності і вирішити, коли шукати подальше уточнення. Наприклад, у середовищі з кількома чашками, вищий рівень невизначеності спонукатиме робота запитати, яку чашку підняти, тим самим уникнувши потенційних помилок або неефективності.
Цей підхід не тільки наділяє роботів кращим розумінням мови, але також підвищує їхню безпеку та ефективність у виконанні завдань. Інтегруючи великі мовні моделі (LLM), як ті, що стоять за ChatGPT, дослідники зробили значний крок у зближенні дій роботів з людськими очікуваннями та потребами.
Роль Великих Мовних Моделей
Інтеграція LLM грає ключову роль у цьому новому підході. LLM інструментальні у обробці та інтерпретації людської мови. У цьому контексті вони використовуються для оцінки та вимірювання невизначеності, присутньої в мовних командах, дані роботам.
Однак, залежність від LLM не позбавлена своїх викликів. Як зазначили члени дослідницької команди, вивід LLM іноді може бути ненадійним.
Анірудха Маджумдар, асистент-професор у Принстоні, підкреслює важливість цього балансу:
“Сліпе слідування планам, згенерованим LLM, може змусити роботів діяти у небезпечній або недостовірній манері, і тому нам потрібно, щоб наші LLM-роботи знали, коли вони не знають.”
Це підкреслює необхідність нюансованого підходу, де LLM використовуються як інструменти для керівництва, а не як ненадійні приймачі рішень.
Практичне Застосування та Тестування
Практичність цього методу була перевірена у різних сценаріях, демонструючи його універсальність та ефективність. Одним з таких тестів було завдання роботизованої руки, яке мало сортувати іграшки-їжу у різні категорії. Ця проста установка продемонструвала здатність робота ефективно орієнтуватися у завданнях з чіткими виборами.

Зображення: Принстонський університет
Складність значно зросла в іншому експерименті, який включав роботизовану руку, встановлену на колісній платформі в офісній кухні. Тут робот стикнувся з реальними викликами, такими як ідентифікація правильного предмета для розміщення у мікрохвильовій печі, коли було представлено кілька варіантів.
Через ці тести роботи успішно продемонстрували свою здатність використовувати квантуючу невизначеність для прийняття рішень або пошуку уточнення, тим самим підтверджуючи практичну корисність цього методу.
Майбутні Імплікації та Дослідження
Оглядаючи майбутнє, імплікації цього дослідження виходять далеко за межі поточних застосувань. Команда, очолювана Маджумдаром та аспірантом Алленом Реном, досліджує, як цей підхід можна застосувати до більш складних проблем у сприйнятті роботів та штучному інтелекті. Це включає сценарії, у яких роботам потрібно комбінувати візуальну та мовну інформацію для прийняття рішень, ще більше звужуючи розрив між розумінням роботів та людською взаємодією.
Триває дослідження, спрямоване не тільки на підвищення здатності роботів виконувати завдання з вищою точністю, але й на орієнтацію у світі з розумінням, подібним до людського сприйняття.
Ви можете знайти опубліковане дослідження тут.












