Artificiell intelligens
Revolutionerande AI-modell förutsäger fysiska system utan fördefinierad kunskap
En nyligen genomförd studie av forskare från Archetype AI har avslöjat en banbrytande AI-modell som kan generalisera över olika fysiska signaler och fenomen, vilket markerar ett betydande steg framåt inom området för artificiell intelligens. Artikeln, med titeln “A Phenomenological AI Foundation Model for Physical Signals,“ föreslår en ny approach för att bygga en enhetlig AI-modell som kan förutsäga och tolka fysiska processer från olika domäner, allt utan föregiven kunskap om de underliggande fysiska lagarna.
En ny approach till AI för fysiska system
Studien syftar till att utveckla en AI-grundmodell som kan hantera fysiska signaler från ett brett spektrum av system, inklusive elektriska strömmar, fluidflöden och optiska sensorsdata. Genom att anta en fenomenologisk approach, undvek forskarna att infoga specifika fysiska lagar i modellen, vilket möjliggjorde generalisering till nya fysiska fenomen som den tidigare inte hade mött.
Tränad på 0,59 miljarder sensorsmätningar från olika domäner, har modellen visat exceptionell prestanda i att förutsäga beteenden hos fysiska system. Dessa system sträcker sig från enkla mekaniska oscillatorer till komplexa processer som elektriska nätverksdynamik, vilket visar modellens mångsidighet.
En fenomenologisk AI-ram
Studiens approach är grundad i en fenomenologisk ram. Till skillnad från traditionella AI-modeller som förlitar sig på fördefinierade induktiva bias (såsom bevarandelagar), tränade forskarna sin AI enbart på observationsdata från sensorer. Detta möjliggjorde för modellen att lära sig de inre mönstren hos olika fysiska fenomen utan att anta någon föregiven kunskap om de styrande fysiska principerna.
Genom att fokusera på fysiska kvantiteter som temperatur, elektrisk ström och vridmoment, kunde modellen generalisera över olika sensortyper och system, vilket öppnar dörrar till tillämpningar inom branscher som sträcker sig från energihantering till avancerad vetenskaplig forskning.
Den Ω-ramen: En väg till universella fysiska modeller
I centrum för denna genombrott ligger den Ω-ramen, en strukturerad metodik som utvecklats av forskarna för att skapa AI-modeller som kan härleda och förutsäga fysiska processer. I denna ram representeras alla fysiska processer som uppsättningar av observerbara kvantiteter. Utmaningen i att bygga en universell modell ligger i det faktum att inte alla möjliga fysiska kvantiteter kan mätas eller ingå i träning. Trots detta möjliggör den Ω-ramen för modellen att härleda beteenden i nya system baserat på de data den har mött.
Denna förmåga att generalisera kommer från hur modellen hanterar ofullständig eller brusig sensorsdata, vilket är typiskt för realvärldstillämpningar. AI:n lär sig att avkoda och rekonstruera dessa signaler, förutsägande framtida beteenden med imponerande noggrannhet.
Transformer-baserad arkitektur för fysiska signaler
Modellens arkitektur är baserad på transformer-nätverk, vanligtvis använda i naturlig språkbehandling men nu tillämpade på fysiska signaler. Dessa nätverk transformerar sensorsdata till en-dimensionella patchar, som sedan bäddas in i ett enhetligt latentspace. Denna inbäddning möjliggör för modellen att fånga de komplexa tidsmönstren hos fysiska signaler, oavsett specifik sensortyp.
Nedströms fenomenologiska avkodare möjliggör sedan för modellen att rekonstruera tidigare beteende eller förutsäga framtida händelser, vilket gör den anpassningsbar till en bred range av fysiska system. De lätta avkodarna möjliggör också för uppgiftsspecifik finjustering utan att behöva träna om hela modellen.
Validering över diversa fysiska system
Forskarna genomförde omfattande experiment för att testa modellens generaliseringsförmåga. I en uppsättning tester utvärderades modellen på en harmonisk oscillator och ett termoelektriskt system. Båda systemen var välkända för sina kaotiska eller komplexa beteenden, vilket gjorde dem till idealiska kandidater för att testa modellens förutsägelse noggrannhet.
AI:n förutsåg framgångsrikt beteendet hos dessa system med minimal fel, även under kaotiska faser. Denna framgång belyser dess potential för att förutsäga fysiska system som uppvisar icke-linjära dynamiker.
Ytterligare experiment genomfördes med verkliga data, inklusive:
- Elektrisk effekt konsumtion i olika länder.
- Temperatur variationer i Melbourne, Australien.
- Olje temperatur data från elektriska transformatorer.
I varje fall överträffade modellen traditionella, domänspecifika modeller, vilket visar dess förmåga att hantera komplexa, verkliga system.
Noll-skott generalisering och mångsidighet
En av de mest spännande resultaten från denna studie är modellens noll-skott generaliseringsförmåga. AI:n kunde förutsäga beteenden i system den aldrig hade mött under träning, såsom termoelektriskt beteende och elektrisk transformator dynamik, med hög noggrannhet.
Denna förmåga speglar de prestationer som ses i naturliga språkmodeller, som GPT-4, där en enda modell tränad på en stor dataset kan överträffa modeller specialiserade på specifika uppgifter. Denna genombrott kan ha långtgående implikationer för AI:s förmåga att tolka fysiska processer.
Implikationer för branscher och forskning
De potentiella tillämpningarna av denna AI-grundmodell är omfattande. Genom att möjliggöra sensortoleranta system, kan modellen användas inom domäner där insamling av stora, specialiserade dataset är svårt. Dess förmåga att lära sig autonomt från observationsdata kunde leda till utvecklingen av självlärande AI-system som anpassar sig till nya miljöer utan mänskligt ingripande.
Dessutom har denna modell betydande potential för vetenskaplig upptäckt. Inom områden som fysik, materialvetenskap och experimentell forskning, där data ofta är komplex och multi-dimensionell, kunde modellen accelerera analysprocessen och erbjuda insikter som tidigare var otillgängliga med traditionella metoder.
Framtida riktningar
Medan modellen representerar ett betydande framsteg inom AI för fysiska system, identifierar studien också områden för ytterligare forskning. Dessa inkluderar att förbättra modellens hantering av sensor-specifik brus, undersöka dess prestanda på icke-periodiska signaler och hantera hörnfall där förutsägelserna var mindre exakta.
Framtida arbete kunde också fokusera på att utveckla mer robusta avkodare för specifika uppgifter, såsom avvikelse upptäckt, klassificering eller hantering av gränsfall i komplexa system.
Slutsats
Införandet av denna Fenomenologiska AI-grundmodell för fysiska signaler markerar ett nytt kapitel i AI:s förmåga att förstå och förutsäga den fysiska världen. Med dess förmåga att generalisera över en bred range av fenomen och sensortyper, kunde denna modell förvandla branscher, vetenskaplig forskning och till och med vardagsteknologi. Den noll-skott-inlärningsförmåga som demonstreras i studien öppnar dörren till AI-modeller som kan lära sig autonomt och anpassa sig till nya utmaningar, utan att kräva domänspecifik omträning.
Denna banbrytande forskning, ledd av Archetype AI, kommer troligen att ha bestående inverkan på hur AI tillämpas på fysiska system, revolutionerande fält som förlitar sig på precisa och skalbara förutsägelser.












