Робототехника

Метод обучения позволяет роботам учиться, наблюдая за людьми

опубликованный

2 лет назад

Июль 26, 2022

Изображение: КМУ

Новый метод обучения, разработанный исследователями из Университета Карнеги-Меллона (CMU), позволяет роботам напрямую учиться на видео взаимодействия с человеком и обобщать информацию для новых задач, что помогает им научиться выполнять работу по дому. Метод обучения называется WHIRL, что означает «обучение человека, имитирующего робота в дикой природе», и он помогает роботу наблюдать за задачами и собирать видеоданные, чтобы в конечном итоге научиться выполнять работу самостоятельно.

Исследование было представлено на конференции Robotics: Science and Systems в Нью-Йорке.

Подражание как способ обучения

Шихар Бахл - доктор философии. студент Института робототехники (RI) Школы компьютерных наук Университета Карнеги-Меллона.

«Подражание — отличный способ учиться, — сказал Бал. «Наличие роботов на самом деле учится, непосредственно наблюдая за людьми, остается нерешенной проблемой в этой области, но эта работа делает значительный шаг в обеспечении этой способности».

Бал работал вместе с Дипаком Патхаком и Абхинавом Гуптой, которые также являются преподавателями РИ. Команда добавила камеру и свое программное обеспечение к готовому роботу, который научился выполнять более 20 задач. Эти задачи включали в себя все, от открытия и закрытия бытовой техники до извлечения мешка для мусора из мусорного ведра. Каждый раз робот наблюдал, как человек выполняет задачи, прежде чем пытаться сделать это сам.

Патхак является доцентом в РИ.

«Эта работа представляет собой способ принести роботов в дом», — сказал Патхак. «Вместо того, чтобы ждать, пока роботы будут запрограммированы или обучены для успешного выполнения различных задач, прежде чем размещать их в домах людей, эта технология позволяет нам развертывать роботов и обучать их выполнению задач, при этом адаптируясь к окружающей среде и улучшая исключительно при просмотре».

WHIRL: имитация человека в робота в дикой природе. Опубликовано на RSS 2022.

WHIRL: Human-to-Robot Imitation in the Wild. Published at RSS 2022.

Watch this video on YouTube

WHIRL против текущих методов

Большинство современных методов обучения робота задаче основаны на имитации или обучении с подкреплением. При имитационном обучении люди вручную управляют роботом и учат его выполнять задачу, которую необходимо выполнять несколько раз, прежде чем робот научится. При обучении с подкреплением робот обычно обучается на миллионах примеров в моделировании, прежде чем адаптировать обучение к реальному миру.

Хотя обе эти модели эффективны при обучении робота одной задаче в структурированной среде, их сложно масштабировать и развертывать. Но с WHIRL робот может учиться на любом видео человека, выполняющего задачу. Он также легко масштабируется, не ограничивается одной конкретной задачей и может работать в домашних условиях.

WHIRL позволяет роботам выполнять задачи в их естественной среде. И хотя первые несколько попыток обычно заканчивались неудачей, он мог очень быстро учиться уже после нескольких успехов. Робот не всегда выполняет задачу теми же движениями, что и человек, но это потому, что у него разные части, которые двигаются по-разному. При этом конечный результат выполнения задач всегда одинаков.

«Чтобы масштабировать робототехнику в дикой природе, данные должны быть надежными и стабильными, а роботы должны становиться лучше в своей среде, практикуясь самостоятельно», — сказал Патхак.

Похожие темы:

ИИ помогает обучать команды совместных роботов и дронов

Не пропустите

Инженеры подарили мягким роботам сердце

Алекс МакФарланд

Алекс МакФарланд — журналист и писатель, занимающийся искусственным интеллектом. Он сотрудничал с многочисленными стартапами и публикациями в области искусственного интеллекта по всему миру.

Unite.ИИ

Метод обучения позволяет роботам учиться, наблюдая за людьми

Робототехника

Метод обучения позволяет роботам учиться, наблюдая за людьми

Оглавление

Подражание как способ обучения

WHIRL против текущих методов

Последние посты

Unite.ИИ

Метод обучения позволяет роботам учиться, наблюдая за людьми

Оглавление

Подражание как способ обучения

WHIRL против текущих методов

Вам может понравиться

Последние посты