заглушки Людська мова прискорює робототехнічне навчання - Unite.AI
Зв'язатися з нами

Робототехніка

Людська мова прискорює робототехнічне навчання

опублікований

 on

Зображення: Прінстонський університет

Команда дослідників у Прінстоні виявила, що описи інструментів людською мовою можуть прискорити навчання імітації роботизованої руки, яка може піднімати та використовувати різні інструменти.

Нове дослідження підтверджує ідею про те, що навчання штучному інтелекту може зробити автономних роботів більш адаптивними в нових ситуаціях, що, у свою чергу, підвищує їхню ефективність і безпеку.

Завдяки додаванню опису форми та функції інструменту до процесу навчання робота було покращено здатність робота маніпулювати новими інструментами.

Метод ATLA для навчання

Новий метод називається Прискорене навчання маніпуляції інструментами за допомогою мови, або ATLA.

Анірудха Маджумдар є доцентом кафедри механічної та аерокосмічної інженерії в Прінстоні та керівником лабораторії інтелектуального руху роботів.

«Додаткова інформація у формі мови може допомогти роботу швидше навчитися використовувати інструменти», — сказав Маджумдар.

Команда запитала мовну модель GPT-3, щоб отримати описи інструментів. Випробувавши різні підказки, вони вирішили використати «Опишіть [функцію] [інструмента] у детальній та науковій відповіді», де функція — це форма або призначення інструменту.

Картік Нарасімхан — доцент кафедри інформатики та співавтор дослідження. Нарасімхан також є провідним викладачем Прінстонської групи з обробки природної мови (NLP) і брав участь у створенні оригінальної моделі мови GPT як запрошений науковий співробітник OpenAI.

«Оскільки ці мовні моделі були навчені в Інтернеті, у певному сенсі ви можете думати про це як про інший спосіб більш ефективного та повного отримання цієї інформації, ніж використання краудсорсингу або збирання конкретних веб-сайтів для описів інструментів», — сказав Нарасімхан.

Експерименти з імітацією навчання роботів

Команда вибрала навчальний набір із 27 інструментів для своїх експериментів зі змодельованим навчанням роботів, починаючи від сокири до ракеля. Перед робототехнічною рукою було поставлено чотири різні завдання: штовхати інструмент, піднімати інструмент, використовувати його, щоб підмітати циліндр уздовж столу або забити кілок у отвір.

Потім команда розробила набір політик, використовуючи підходи машинного навчання з інформацією про мову та без неї. Ефективність політик порівнювалася в окремому тесті дев’яти інструментів із парними описами.

Підхід, який називається метанавчанням, покращує здатність робота навчатися з кожним наступним завданням.

За словами Нарасімхана, робот не лише вчиться користуватися кожним інструментом, але й «намагається навчитися розуміти описи кожного з цих сотень різних інструментів, тож коли він бачить 101-й інструмент, він швидше навчиться користуватися новим інструментом. »

У більшості експериментів мовна інформація надавала значні переваги для здатності робота використовувати нові інструменти.

Аллен З. Рен є доктором філософії. студент групи Маджумдара та провідний автор дослідницької роботи.

«З мовним навчанням він навчиться хапатися за довгий кінець лома та використовувати вигнуту поверхню, щоб краще стримувати рух пляшки», — сказав Рен. «Без мови він схопив лом близько до вигнутої поверхні, і ним було важче керувати».

«Загальна мета полягає в тому, щоб змусити роботизовані системи — зокрема ті, які навчені за допомогою машинного навчання — узагальнити для нових середовищ», — додав Маджумдар.

Алекс МакФарланд — журналіст і письменник, що займається штучним інтелектом, досліджує останні розробки в галузі штучного інтелекту. Він співпрацював з численними стартапами та публікаціями зі штучного інтелекту по всьому світу.