Sztuczna inteligencja

Nowa technika pozwala AI intuicyjnie rozumieć część fizyki

Published December 6, 2019

Updated March 16, 2026

Daniel Nelson

Sztuczna inteligencja od pewnego czasu potrafi rozwijać zrozumienie fizyki poprzez uczenie ze wzmocnieniem, ale nowa technika opracowana przez badaczy z MIT może pomóc inżynierom projektować modele, które wykazują intuicyjne zrozumienie fizyki. Badania psychologiczne wykazały, że ludzie do pewnego stopnia posiadają intuicyjne zrozumienie praw fizyki. Niemowlęta mają oczekiwania co do tego, jak obiekty powinny oddziaływać i się poruszać, a naruszenia tych oczekiwań wywołują u nich reakcję zaskoczenia. Badania przeprowadzone przez zespół MIT mają potencjał nie tylko do napędzania nowych zastosowań sztucznej inteligencji, ale także do pomocy psychologom w zrozumieniu, jak niemowlęta postrzegają świat i się o nim uczą. Model zaprojektowany przez zespół MIT nazywa się ADEPT i funkcjonuje poprzez formułowanie przewidywań, jak obiekty powinny zachowywać się w przestrzeni fizycznej. Model obserwuje obiekty i śledzi przy tym wskaźnik “zaskoczenia”. Jeśli zdarzy się coś nieoczekiwanego, model reaguje zwiększeniem wartości zaskoczenia. Nieoczekiwane i pozornie niemożliwe działania, takie jak teleportacja obiektu lub jego całkowite zniknięcie, powodują gwałtowny wzrost zaskoczenia. Celem zespołu badawczego było sprawienie, aby ich model rejestrował takie same poziomy zaskoczenia, jakie rejestrują ludzie, gdy widzą obiekty zachowujące się w niewiarygodny sposób. ADEPT składa się z dwóch głównych komponentów: silnika fizycznego i modułu grafiki odwrotnej. Silnik fizyczny odpowiada za przewidywanie, jak obiekt będzie się poruszał, przewidując przyszłą reprezentację obiektu z zakresu możliwych stanów. Tymczasem moduł grafiki odwrotnej odpowiada za tworzenie reprezentacji obiektów, które będą wprowadzane do silnika fizycznego. Moduł grafiki odwrotnej śledzi kilka różnych atrybutów, takich jak prędkość, kształt i orientacja obiektu, wyodrębniając te informacje z klatek wideo. Moduł grafiki odwrotnej skupia się tylko na najbardziej istotnych szczegółach, ignorując te, które nie pomogą silnikowi fizycznemu w interpretacji obiektu i przewidywaniu nowych stanów. Skupiając się tylko na najważniejszych szczegółach, model jest w stanie lepiej uogólniać na nowe obiekty. Silnik fizyczny następnie pobiera te opisy obiektów i symuluje bardziej złożone zachowania fizyczne, takie jak płynność czy sztywność, aby przewidzieć, jak obiekt powinien się zachować. Po tym procesie przetwarzania model obserwuje rzeczywistą następną klatkę wideo, której używa do ponownego obliczenia swojego rozkładu prawdopodobieństwa w odniesieniu do możliwych zachowań obiektu. Zaskoczenie jest odwrotnie proporcjonalne do prawdopodobieństwa wystąpienia zdarzenia, rejestrując duże zaskoczenie tylko wtedy, gdy istnieje poważna rozbieżność między tym, co model uważa, że powinno się wydarzyć dalej, a tym, co faktycznie się dzieje. Zespół badawczy potrzebował jakiegoś sposobu, aby porównać zaskoczenie swojego modelu ze zaskoczeniem ludzi obserwujących to samo zachowanie obiektu. W psychologii rozwojowej badacze często testują niemowlęta, pokazując im dwa różne filmy. Na jednym filmie przedstawiony jest obiekt, który zachowuje się tak, jak można by oczekiwać od obiektów w rzeczywistym świecie, nie znikając ani nie teleportując się spontanicznie. Na drugim filmie obiekt w jakiś sposób łamie prawa fizyki. Zespół badawczy wykorzystał te same podstawowe koncepcje i poprosił 60 dorosłych o obejrzenie 64 różnych filmów przedstawiających zarówno oczekiwane, jak i nieoczekiwane zachowania fizyczne. Uczestników poproszono następnie o ocenę swojego zaskoczenia w różnych momentach filmu w skali od 1 do 100. Analiza działania modelu wykazała, że radził on sobie całkiem dobrze na filmach, na których obiekt był przesuwany za ścianę i znikał, gdy ścianę usunięto, zazwyczaj odpowiadając poziomom zaskoczenia ludzi w tych przypadkach. Model wydawał się również być zaskoczony filmami, na których ludzie nie wykazywali zaskoczenia, choć mogliby. Jako przykład, aby obiekt mógł poruszać się za ścianą z daną prędkością i natychmiast pojawić się po drugiej stronie ściany, musiałby albo się teleportować, albo doświadczyć dramatycznego wzrostu prędkości. Porównując działanie z tradycyjnymi sieciami neuronowymi, które potrafią uczyć się poprzez obserwację, ale nie rejestrują jawnie reprezentacji obiektu, badacze odkryli, że sieć ADEPT była znacznie dokładniejsza w rozróżnianiu scen zaskakujących i niezaskakujących oraz że jej działanie było bliższe reakcjom ludzkim. Zespół badawczy MIT zamierza przeprowadzić więcej badań i uzyskać głębszy wgląd w to, jak niemowlęta obserwują otaczający je świat i uczą się z tych obserwacji, włączając swoje odkrycia do nowych wersji modelu ADEPT.

Unite.AI

Nowa technika pozwala AI intuicyjnie rozumieć część fizyki

You may like