Робототехника
Метод обучения позволяет роботам учиться, наблюдая за людьми
Новый метод обучения, разработанный исследователями из Университета Карнеги-Меллона (CMU), позволяет роботам напрямую учиться на видео взаимодействия с человеком и обобщать информацию для новых задач, что помогает им научиться выполнять работу по дому. Метод обучения называется WHIRL, что означает «обучение человека, имитирующего робота в дикой природе», и он помогает роботу наблюдать за задачами и собирать видеоданные, чтобы в конечном итоге научиться выполнять работу самостоятельно.
Исследование было представлено на конференции Robotics: Science and Systems в Нью-Йорке.
Подражание как способ обучения
Шихар Бахл - доктор философии. студент Института робототехники (RI) Школы компьютерных наук Университета Карнеги-Меллона.
«Подражание — отличный способ учиться, — сказал Бал. «Наличие роботов на самом деле учится, непосредственно наблюдая за людьми, остается нерешенной проблемой в этой области, но эта работа делает значительный шаг в обеспечении этой способности».
Бал работал вместе с Дипаком Патхаком и Абхинавом Гуптой, которые также являются преподавателями РИ. Команда добавила камеру и свое программное обеспечение к готовому роботу, который научился выполнять более 20 задач. Эти задачи включали в себя все, от открытия и закрытия бытовой техники до извлечения мешка для мусора из мусорного ведра. Каждый раз робот наблюдал, как человек выполняет задачи, прежде чем пытаться сделать это сам.
Патхак является доцентом в РИ.
«Эта работа представляет собой способ принести роботов в дом», — сказал Патхак. «Вместо того, чтобы ждать, пока роботы будут запрограммированы или обучены для успешного выполнения различных задач, прежде чем размещать их в домах людей, эта технология позволяет нам развертывать роботов и обучать их выполнению задач, при этом адаптируясь к окружающей среде и улучшая исключительно при просмотре».
WHIRL против текущих методов
Большинство современных методов обучения робота задаче основаны на имитации или обучении с подкреплением. При имитационном обучении люди вручную управляют роботом и учат его выполнять задачу, которую необходимо выполнять несколько раз, прежде чем робот научится. При обучении с подкреплением робот обычно обучается на миллионах примеров в моделировании, прежде чем адаптировать обучение к реальному миру.
Хотя обе эти модели эффективны при обучении робота одной задаче в структурированной среде, их сложно масштабировать и развертывать. Но с WHIRL робот может учиться на любом видео человека, выполняющего задачу. Он также легко масштабируется, не ограничивается одной конкретной задачей и может работать в домашних условиях.
WHIRL позволяет роботам выполнять задачи в их естественной среде. И хотя первые несколько попыток обычно заканчивались неудачей, он мог очень быстро учиться уже после нескольких успехов. Робот не всегда выполняет задачу теми же движениями, что и человек, но это потому, что у него разные части, которые двигаются по-разному. При этом конечный результат выполнения задач всегда одинаков.
«Чтобы масштабировать робототехнику в дикой природе, данные должны быть надежными и стабильными, а роботы должны становиться лучше в своей среде, практикуясь самостоятельно», — сказал Патхак.