Робототехніка

Як роботи вчаться просити про допомогу

опублікований

5 місяців тому

1 Грудня, 2023

У світі робототехніки, що розвивається, варто виділити новаторську співпрацю між Прінстонським університетом і Google. Інженери з цих престижних закладів розробили інноваційний метод, який навчає роботів важливої навички: розпізнавати, коли їм потрібна допомога, і як її просити. Ця розробка знаменує значний крок вперед у робототехніці, подолаючи розрив між автономним функціонуванням і взаємодією людини з роботом.

Подорож до більш розумних і незалежних роботів завжди заважала одна серйозна проблема: складність і неоднозначність людської мови. На відміну від двійкової чіткості комп’ютерних кодів, людська мова пронизана нюансами й тонкощами, що робить її лабіринтом для роботів. Наприклад, така проста команда, як «підняти миску», може стати складним завданням, якщо є кілька мисок. Роботи, здатні відчувати навколишнє середовище та реагувати на мову, часто опиняються на роздоріжжі, коли стикаються з такою мовною невизначеністю.

Кількісна невизначеність

Вирішуючи цю проблему, команда Прінстона та Google представила новий підхід, який кількісно визначає «розмитість» людської мови. Ця техніка по суті вимірює рівень невизначеності мовних команд і використовує цей показник для керування діями робота. У ситуаціях, коли команда може призвести до кількох інтерпретацій, робот тепер може оцінити рівень невизначеності та вирішити, коли шукати додаткові роз’яснення. Наприклад, у середовищі з кількома мисками вищий ступінь невизначеності спонукатиме робота запитати, яку миску взяти, таким чином уникаючи потенційних помилок або неефективності.

Цей підхід не тільки дає роботам змогу краще розуміти мову, але й підвищує їх безпеку та ефективність у виконанні завдань. Завдяки інтеграції великих мовних моделей (LLM), подібних до тих, що стоять за ChatGPT, дослідники зробили значний крок у більш тісному узгодженні роботів із очікуваннями та потребами людей.

Роль великих мовних моделей

Інтеграція LLMs відіграє ключову роль у цьому новому підході. LLM є інструментом для обробки та інтерпретації людської мови. У цьому контексті вони використовуються для оцінки та вимірювання невизначеності, присутньої в мовних командах, які надаються роботам.

Однак залежність від LLM не позбавлена проблем. Як зазначає дослідницька група, результати LLM іноді можуть бути ненадійними.

Анірудха Маджумдар, доцент Прінстонського університету, підкреслює важливість цього балансу:

«Сліпе дотримання планів, створених LLM, може призвести до того, що роботи будуть діяти небезпечно або ненадійно, тому нам потрібно, щоб наші роботи на основі LLM знали, коли вони не знають».

Це підкреслює необхідність нюансованого підходу, де LLM використовуються як інструменти для керівництва, а не як безпомилкові особи, які приймають рішення.

Практичне застосування та перевірка

Практичність цього методу була перевірена в різних сценаріях, що свідчить про його універсальність і ефективність. В одному з таких тестів використовувалася роботизована рука, якій доручалося сортувати іграшкові харчові продукти за різними категоріями. Це просте налаштування продемонструвало здатність робота ефективно керувати завданнями за допомогою чіткого вибору.

Зображення: Прінстонський університет

Складність значно зросла в іншому експерименті з роботизованою рукою, встановленою на платформі на колесах на офісній кухні. Тут робот зіткнувся з реальними проблемами, як-от визначити правильний предмет для мікрохвильової печі, коли йому було запропоновано кілька варіантів.

За допомогою цих випробувань роботи успішно продемонстрували свою здатність використовувати кількісну невизначеність для прийняття рішень або пошуку роз’яснень, тим самим підтвердивши практичну корисність цього методу.

Майбутні наслідки та дослідження

Забігаючи вперед, наслідки цього дослідження виходять далеко за рамки поточних застосувань. Команда під керівництвом Маджумдара та аспіранта Аллена Рена досліджує, як цей підхід можна застосувати до більш складних проблем сприйняття роботів та ШІ. Це включає сценарії, коли роботам потрібно поєднувати зорову та мовну інформацію для прийняття рішень, що ще більше усуває розрив між розумінням роботами та взаємодією з людьми.

Дослідження, що тривають, мають на меті не лише покращити здатність роботів виконувати завдання з більшою точністю, але й орієнтуватися у світі з розумінням, подібним до людського пізнання. Це дослідження може прокласти шлях до роботів, які будуть не тільки ефективнішими та безпечнішими, але й більш відповідатимуть деталізованим вимогам людського середовища.

Ви можете знайти опубліковані дослідження тут.

Схожі теми:Робототехніка

Вгору Далі

Дослідники революціонізують навігацію за допомогою Twisted Ringbots

Не пропустіть

UBC і Honda представили революційний м’який датчик для чутливої робототехніки

Алекс МакФарланд

Алекс МакФарланд — журналіст і письменник, що займається штучним інтелектом, досліджує останні розробки в галузі штучного інтелекту. Він співпрацював з численними стартапами та публікаціями зі штучного інтелекту по всьому світу.

Об'єднуйтесь.AI

Як роботи вчаться просити про допомогу

Робототехніка

Як роботи вчаться просити про допомогу

Зміст

Кількісна невизначеність

Роль великих мовних моделей

Практичне застосування та перевірка

Майбутні наслідки та дослідження

Останні повідомлення

Об'єднуйтесь.AI

Як роботи вчаться просити про допомогу

Зміст

Кількісна невизначеність

Роль великих мовних моделей

Практичне застосування та перевірка

Майбутні наслідки та дослідження

Вам може сподобатися

Останні повідомлення