заглушки Метод обучения позволяет роботам учиться, наблюдая за людьми - Unite.AI
Свяжитесь с нами:

Робототехника

Метод обучения позволяет роботам учиться, наблюдая за людьми

опубликованный

 on

Изображение: КМУ

Новый метод обучения, разработанный исследователями из Университета Карнеги-Меллона (CMU), позволяет роботам напрямую учиться на видео взаимодействия с человеком и обобщать информацию для новых задач, что помогает им научиться выполнять работу по дому. Метод обучения называется WHIRL, что означает «обучение человека, имитирующего робота в дикой природе», и он помогает роботу наблюдать за задачами и собирать видеоданные, чтобы в конечном итоге научиться выполнять работу самостоятельно. 

Исследование было представлено на конференции Robotics: Science and Systems в Нью-Йорке. 

Подражание как способ обучения

Шихар Бахл - доктор философии. студент Института робототехники (RI) Школы компьютерных наук Университета Карнеги-Меллона. 

«Подражание — отличный способ учиться, — сказал Бал. «Наличие роботов на самом деле учится, непосредственно наблюдая за людьми, остается нерешенной проблемой в этой области, но эта работа делает значительный шаг в обеспечении этой способности».

Бал работал вместе с Дипаком Патхаком и Абхинавом Гуптой, которые также являются преподавателями РИ. Команда добавила камеру и свое программное обеспечение к готовому роботу, который научился выполнять более 20 задач. Эти задачи включали в себя все, от открытия и закрытия бытовой техники до извлечения мешка для мусора из мусорного ведра. Каждый раз робот наблюдал, как человек выполняет задачи, прежде чем пытаться сделать это сам. 

Патхак является доцентом в РИ.

«Эта работа представляет собой способ принести роботов в дом», — сказал Патхак. «Вместо того, чтобы ждать, пока роботы будут запрограммированы или обучены для успешного выполнения различных задач, прежде чем размещать их в домах людей, эта технология позволяет нам развертывать роботов и обучать их выполнению задач, при этом адаптируясь к окружающей среде и улучшая исключительно при просмотре». 

WHIRL: имитация человека в робота в дикой природе. Опубликовано на RSS 2022.

WHIRL против текущих методов

Большинство современных методов обучения робота задаче основаны на имитации или обучении с подкреплением. При имитационном обучении люди вручную управляют роботом и учат его выполнять задачу, которую необходимо выполнять несколько раз, прежде чем робот научится. При обучении с подкреплением робот обычно обучается на миллионах примеров в моделировании, прежде чем адаптировать обучение к реальному миру. 

Хотя обе эти модели эффективны при обучении робота одной задаче в структурированной среде, их сложно масштабировать и развертывать. Но с WHIRL робот может учиться на любом видео человека, выполняющего задачу. Он также легко масштабируется, не ограничивается одной конкретной задачей и может работать в домашних условиях. 

WHIRL позволяет роботам выполнять задачи в их естественной среде. И хотя первые несколько попыток обычно заканчивались неудачей, он мог очень быстро учиться уже после нескольких успехов. Робот не всегда выполняет задачу теми же движениями, что и человек, но это потому, что у него разные части, которые двигаются по-разному. При этом конечный результат выполнения задач всегда одинаков.

«Чтобы масштабировать робототехнику в дикой природе, данные должны быть надежными и стабильными, а роботы должны становиться лучше в своей среде, практикуясь самостоятельно», — сказал Патхак. 

Алекс МакФарланд — журналист и писатель, занимающийся искусственным интеллектом. Он сотрудничал с многочисленными стартапами и публикациями в области искусственного интеллекта по всему миру.