Робототехника

Робот учится ходить с помощью обучения с подкреплением

Published April 16, 2021

Updated April 5, 2026

Alex McFarland

Хотя Boston Dynamics и танцующие роботы обычно получают большинство внимания, есть некоторые значительные разработки, происходящие за кулисами, которые не получают достаточного освещения. Одна из таких разработок происходит в лаборатории Беркли, где робот по имени Cassie смог научиться ходить с помощью обучения с подкреплением.

После проб и ошибок пара роботизированных ног научилась ориентироваться в симулированной среде, прежде чем быть протестированной в реальном мире. Первоначально робот продемонстрировал способность ходить во всех направлениях, ходить, приседая, переориентироваться, когда его сбивали с равновесия, и адаптироваться к разным типам поверхностей.

Робот Cassie является первым случаем успешного использования двухногого робота для обучения с помощью обучения с подкреплением.

Восхищение танцующими роботами

Хотя роботы, такие как те, что от Boston Dynamics, являются非常 впечатляющими и вызывают восхищение у всех, кто их смотрит, есть несколько ключевых факторов. Наиболее заметно, что эти роботы запрограммированы и откорректированы, чтобы достичь результата, но этот метод не является предпочтительным в реальных ситуациях.

За пределами лаборатории роботы должны быть прочными, устойчивыми, гибкими и многим другим. Кроме того, они должны уметь встречать и обрабатывать неожиданные ситуации, что может быть сделано только путем предоставления им возможности самостоятельно справляться с такими ситуациями.

Zhongyu Li был частью команды, работающей над Cassie в Университете Беркли.

«Эти видео могут привести некоторых людей к убеждению, что это решенная и простая проблема», – говорит Ли. «Но у нас еще есть долгий путь, чтобы иметь humanoid роботов, которые могут надежно работать и жить в человеческой среде».

https://www.youtube.com/watch?v=goxCjGPQH7U

Обучение с подкреплением

Чтобы создать такого робота, команда Беркли полагалась на обучение с подкреплением, которое было использовано компаниями, такими как DeepMind, для обучения алгоритмов, которые могут победить человека в самых сложных играх. Обучение с подкреплением основано на пробах и ошибках, когда робот учится на своих ошибках.

Робот Cassie использовал обучение с подкреплением, чтобы научиться ходить в симуляции, что не является первым случаем использования этого подхода. Однако это обычно не выходит за пределы симулированной среды и не попадает в реальный мир. Даже небольшая разница может привести к тому, что робот не сможет ходить.

Исследователи использовали две симуляции вместо одной, первой из которых был открытый источник обучающей среды под названием MuJoCo. В этой первой симуляции алгоритм пробовал и учился из библиотеки возможных движений, а во второй симуляции под названием SimMechanics робот тестировал их в более реальных условиях.

После разработки в двух симуляциях алгоритм не нуждался в доработке. Он уже был готов к работе в реальном мире. Не только он смог ходить, но и смог сделать многое другое. Согласно исследователям, Cassie смогла восстановиться после того, как два двигателя в колене робота вышли из строя.

Хотя Cassie может не иметь всех колокольчиков и свистков, как некоторые другие роботы, он во многих отношениях намного более впечатляющий. У него также есть более значительные последствия для технологии, когда речь идет о реальном использовании, поскольку такой ходячий робот может быть использован в различных секторах.

Related Topics:AI artificial intelligence Robotics

Alex McFarland

Алекс Макфарленд - журналист и писатель в области искусственного интеллекта, исследующий последние разработки в этой области. Он сотрудничал с многочисленными стартапами и изданиями в области искусственного интеллекта во всем мире.