Модели и платформы ИИ

Новая Техника Позволяет ИИ Интуитивно Понимать Некоторую Физику

Опубликовано 6 декабря 2019

Обновлено 25 мая 2026

Daniel Nelson

Искусственный интеллект уже некоторое время может развивать понимание физики с помощью обучения с подкреплением, но новая техника, разработанная исследователями в MIT, может помочь инженерам проектировать модели, демонстрирующие интуитивное понимание физики.

Психологические исследования показали, что, в некоторой степени, люди имеют интуитивное понимание законов физики. Младенцы имеют ожидания о том, как объекты должны взаимодействовать и двигаться, и нарушения этих ожиданий вызывают у них удивление. Исследования, проведенные командой MIT, имеют потенциал не только стимулировать новые применения искусственного интеллекта, но и помочь психологам понять, как младенцы воспринимают и учатся о мире.

Модель, разработанная командой MIT, называется ADEPT, и она функционирует, делая прогнозы о том, как объекты должны вести себя в физическом пространстве. Модель наблюдает объекты и отслеживает “метрику удивления”, когда она это делает. Если происходит что-то неожиданное, модель реагирует увеличением значения удивления. Неожиданные и, казалось бы, невозможные действия, такие как телепортация объекта или его полное исчезновение, вызывают значительное увеличение удивления.

Целью исследовательской команды было сделать так, чтобы их модель регистрировала те же уровни удивления, что и люди, когда они видят объекты, ведущие себя неправдоподобным образом.

ADEPT имеет две основные компоненты: физический движок и модуль обратной графики. Физический движок отвечает за прогнозирование того, как объект будет двигаться, предсказывая будущее представление объекта из набора возможных состояний. Между тем, модуль обратной графики отвечает за создание представлений объектов, которые будут переданы в физический движок.

Модуль обратной графики отслеживает несколько атрибутов, таких как скорость, форма и ориентация объекта, извлекая эту информацию из кадров видео. Модуль обратной графики фокусируется только на наиболее важных деталях, игнорируя детали, которые не помогут физическому движку интерпретировать объект и предсказать новые состояния. Фокусируясь только на наиболее важных деталях, модель лучше обобщает новые объекты. Физический движок затем берет эти описания объектов и симулирует более сложное физическое поведение, такое как жидкость или жесткость, чтобы сделать прогнозы о том, как объект должен вести себя.

После того, как этот процесс происходит, модель наблюдает фактический следующий кадр в видео, который она использует для пересчета своего распределения вероятностей относительно возможного поведения объекта. Удивление обратно пропорционально вероятности того, что событие должно произойти, регистрируя большое удивление только тогда, когда есть значительный несоответствие между тем, что модель считает должно произойти дальше, и тем, что на самом деле происходит дальше.

Исследовательская команда нуждалась в некотором способе сравнить удивление своей модели с удивлением людей, наблюдающих за тем же поведением объекта. В области развития психологии исследователи часто тестируют младенцев, показывая им два разных видео. В одном видео объект представлен так, как ожидается в реальном мире, без спонтанного исчезновения или телепортации. В другом видео объект нарушает законы физики каким-либо образом. Исследовательская команда взяла эти же основные концепции и показала 60 взрослым 64 разных видео ожидаемого и неожиданного физического поведения. Участникам затем было предложено оценить свое удивление в различных моментах видео по шкале от 1 до 100.

Анализ работы модели показал, что она работала довольно хорошо на видео, где объект был перемещен за стену и исчез, когда стена была удалена, обычно соответствуя уровням удивления людей в этих случаях. Модель также, казалось, была удивлена видео, где люди не демонстрировали удивления, но, возможно, должны были. Например, чтобы объект мог переместиться за стену на определенной скорости и сразу же появиться на другой стороне стены, он должен был либо телепортироваться, либо испытать значительное увеличение скорости.

Когда сравнили с работой традиционных нейронных сетей, которые способны учиться на наблюдениях, но не явно регистрируют представление объекта, исследователи обнаружили, что сеть ADEPT была намного более точной в различении удивительного и неудивительного сценариев и что работа ADEPT более тесно соответствовала реакциям людей.

Команда исследователей MIT планирует провести больше исследований и получить более глубокие знания о том, как младенцы наблюдают за миром вокруг себя и учатся на этих наблюдениях, включая свои находки в новые версии модели ADEPT.

Daniel Nelson

Блогер и программист с специализацией в Machine Learning и Deep Learning темах. Daniel надеется помочь другим использовать силу ИИ для социального блага.

Unite.AI

Новая Техника Позволяет ИИ Интуитивно Понимать Некоторую Физику

Узнать больше