Artificiell intelligens
Intels Masked Humanoid Controller: A Novel Approach to Physically Realistic and Directable Human Motion Generation

Forskare frÄn Intel Labs, i samarbete med akademiska experter och branschexperter, har introducerat en banbrytande teknik för att generera realistiska och styrbara mÀnskliga rörelser frÄn sparsamma, multimodala ingÄngar. Deras arbete, belyst pÄ Europeiska konferensen om datorsyn (ECCV 2024), fokuserar pÄ att övervinna utmaningarna med att generera naturliga, fysiskt baserade mÀnskliga beteenden i högdimensionella humanoida karaktÀrer. Denna forskning Àr en del av Intel Labs bredare initiativ för att frÀmja datorseende och maskininlÀrning.
Intel Labs och dess partners presenterade nyligen sex banbrytande tidningar vid ECCV 2024, en förstklassig konferens som anordnas av European Computer Vision Association (ECVA).
Pappret Generera fysiskt realistiska och styrbara mÀnskliga rörelser frÄn multimodala ingÄngar visade upp innovationer inklusive en ny försvarsstrategi för att skydda text-till-bild-modeller frÄn promptbaserade röda teamattacker och utvecklingen av en storskalig datauppsÀttning utformad för att förbÀttra rumslig konsekvens i dessa modeller. Bland dessa bidrag belyser tidningen Intels engagemang för att frÀmja generativ modellering samtidigt som de prioriterar ansvarig AI praxis.
Generera realistiska mÀnskliga rörelser med hjÀlp av multimodala ingÄngar
Intels Masked Humanoid Controller (MHC) Àr ett banbrytande system designat för att generera mÀnskliga rörelser i simulerade fysikmiljöer. Till skillnad frÄn traditionella metoder som i hög grad förlitar sig pÄ fullstÀndigt detaljerad motion capture-data, Àr MHC byggd för att hantera glesa, ofullstÀndiga eller partiella indata frÄn en mÀngd olika kÀllor. Dessa kÀllor kan inkludera VR-kontroller, som kanske bara spÄrar hand- eller huvudrörelser; joystick-ingÄngar som endast ger navigeringskommandon pÄ hög nivÄ; videospÄrning, dÀr vissa kroppsdelar kan vara tilltÀppta; eller till och med abstrakta instruktioner hÀrledda frÄn textuppmaningar.
Teknikens innovation ligger i dess förmÄga att tolka och fylla i de luckor dÀr data saknas eller Àr ofullstÀndig. Den uppnÄr detta genom vad Intel benÀmner HÀmta, kombinera och komplettera (CCC) FörmÄgor:
- Komma ikapp: Den hÀr funktionen gör att MHC kan ÄterhÀmta sig och synkronisera sin rörelse nÀr störningar intrÀffar, till exempel nÀr systemet startar i ett misslyckat tillstÄnd, som en humanoid karaktÀr som har fallit. Systemet kan snabbt korrigera sina rörelser och Äteruppta naturlig rörelse utan omtrÀning eller manuella justeringar.
- Kombinera: MHC kan blanda olika rörelsesekvenser tillsammans, som att slÄ samman överkroppsrörelser frÄn en handling (t.ex. vinka) med underkroppsrörelser frÄn en annan (t.ex. promenad). Denna flexibilitet möjliggör generering av helt nya beteenden frÄn befintliga rörelsedata.
- Komplett: NÀr MHC ges glesa indata, sÄsom partiella kroppsrörelsedata eller vaga högnivÄdirektiv, kan MHC pÄ ett intelligent sÀtt sluta sig till och generera de saknade delarna av rörelsen. Till exempel, om endast armrörelser specificeras, kan MHC autonomt generera motsvarande benrörelser för att bibehÄlla fysisk balans och realism.
Resultatet Àr ett mycket anpassningsbart rörelsegenereringssystem som kan skapa jÀmna, realistiska och fysiskt exakta rörelser, Àven med ofullstÀndiga eller underspecificerade direktiv. Detta gör MHC idealisk för applikationer inom spel, robotteknik, virtuell verklighet och alla scenarier dÀr högkvalitativa mÀnskliga rörelser behövs men indata Àr begrÀnsade.
Effekten av MHC pÄ generativa rörelsemodeller
The Masked Humanoid Controller (MHC) Àr en del av en bredare anstrÀngning av Intel Labs och dess samarbetspartners för att ansvarsfullt bygga generativa modeller, inklusive de som driver text-till-bild och 3D generation uppgifter. Som diskuterades vid ECCV 2024 har detta tillvÀgagÄngssÀtt betydande konsekvenser för industrier som robotik, virtuell verklighet, spel och simulering, dÀr genereringen av realistiska mÀnskliga rörelser Àr avgörande. Genom att integrera multimodala ingÄngar och göra det möjligt för styrenheten att sömlöst vÀxla mellan rörelser, kan MHC hantera verkliga förhÄllanden dÀr sensordata kan vara störande eller ofullstÀndig.
Detta arbete av Intel Labs stÄr vid sidan av annan avancerad forskning som presenterades vid ECCV 2024, sÄsom deras nya försvar för text-till-bild-modeller och utvecklingen av tekniker för att förbÀttra rumslig konsekvens i bildgenerering. Tillsammans visar dessa framsteg upp Intels ledarskap inom datorseende, med fokus pÄ att utveckla sÀker, skalbar och ansvarsfull AI-teknik.
Slutsats
Masked Humanoid Controller (MHC), utvecklad av Intel Labs och akademiska samarbetspartners, representerar ett avgörande steg framÄt inom omrÄdet för mÀnsklig rörelsegenerering. Genom att ta itu med det komplexa kontrollproblemet att generera realistiska rörelser frÄn multimodala ingÄngar banar MHC vÀgen för nya applikationer inom VR, spel, robotik och simulering. Denna forskning, som presenterades pÄ ECCV 2024, visar Intels engagemang för att frÀmja ansvarsfull AI och generativ modellering, vilket bidrar till sÀkrare och mer adaptiva teknologier inom olika domÀner.