Anslut dig till vÄrt nÀtverk!

Artificiell intelligens

Intels Masked Humanoid Controller: A Novel Approach to Physically Realistic and Directable Human Motion Generation

mm

Forskare frÄn Intel Labs, i samarbete med akademiska experter och branschexperter, har introducerat en banbrytande teknik för att generera realistiska och styrbara mÀnskliga rörelser frÄn sparsamma, multimodala ingÄngar. Deras arbete, belyst pÄ Europeiska konferensen om datorsyn (ECCV 2024), fokuserar pÄ att övervinna utmaningarna med att generera naturliga, fysiskt baserade mÀnskliga beteenden i högdimensionella humanoida karaktÀrer. Denna forskning Àr en del av Intel Labs bredare initiativ för att frÀmja datorseende och maskininlÀrning.

Intel Labs och dess partners presenterade nyligen sex banbrytande tidningar vid ECCV 2024, en förstklassig konferens som anordnas av European Computer Vision Association (ECVA).

Pappret Generera fysiskt realistiska och styrbara mÀnskliga rörelser frÄn multimodala ingÄngar visade upp innovationer inklusive en ny försvarsstrategi för att skydda text-till-bild-modeller frÄn promptbaserade röda teamattacker och utvecklingen av en storskalig datauppsÀttning utformad för att förbÀttra rumslig konsekvens i dessa modeller. Bland dessa bidrag belyser tidningen Intels engagemang för att frÀmja generativ modellering samtidigt som de prioriterar ansvarig AI praxis.

Generera realistiska mÀnskliga rörelser med hjÀlp av multimodala ingÄngar

Intels Masked Humanoid Controller (MHC) Àr ett banbrytande system designat för att generera mÀnskliga rörelser i simulerade fysikmiljöer. Till skillnad frÄn traditionella metoder som i hög grad förlitar sig pÄ fullstÀndigt detaljerad motion capture-data, Àr MHC byggd för att hantera glesa, ofullstÀndiga eller partiella indata frÄn en mÀngd olika kÀllor. Dessa kÀllor kan inkludera VR-kontroller, som kanske bara spÄrar hand- eller huvudrörelser; joystick-ingÄngar som endast ger navigeringskommandon pÄ hög nivÄ; videospÄrning, dÀr vissa kroppsdelar kan vara tilltÀppta; eller till och med abstrakta instruktioner hÀrledda frÄn textuppmaningar.

Teknikens innovation ligger i dess förmÄga att tolka och fylla i de luckor dÀr data saknas eller Àr ofullstÀndig. Den uppnÄr detta genom vad Intel benÀmner HÀmta, kombinera och komplettera (CCC) FörmÄgor:

  • Komma ikapp: Den hĂ€r funktionen gör att MHC kan Ă„terhĂ€mta sig och synkronisera sin rörelse nĂ€r störningar intrĂ€ffar, till exempel nĂ€r systemet startar i ett misslyckat tillstĂ„nd, som en humanoid karaktĂ€r som har fallit. Systemet kan snabbt korrigera sina rörelser och Ă„teruppta naturlig rörelse utan omtrĂ€ning eller manuella justeringar.
  • Kombinera: MHC kan blanda olika rörelsesekvenser tillsammans, som att slĂ„ samman överkroppsrörelser frĂ„n en handling (t.ex. vinka) med underkroppsrörelser frĂ„n en annan (t.ex. promenad). Denna flexibilitet möjliggör generering av helt nya beteenden frĂ„n befintliga rörelsedata.
  • Komplett: NĂ€r MHC ges glesa indata, sĂ„som partiella kroppsrörelsedata eller vaga högnivĂ„direktiv, kan MHC pĂ„ ett intelligent sĂ€tt sluta sig till och generera de saknade delarna av rörelsen. Till exempel, om endast armrörelser specificeras, kan MHC autonomt generera motsvarande benrörelser för att bibehĂ„lla fysisk balans och realism.

Resultatet Àr ett mycket anpassningsbart rörelsegenereringssystem som kan skapa jÀmna, realistiska och fysiskt exakta rörelser, Àven med ofullstÀndiga eller underspecificerade direktiv. Detta gör MHC idealisk för applikationer inom spel, robotteknik, virtuell verklighet och alla scenarier dÀr högkvalitativa mÀnskliga rörelser behövs men indata Àr begrÀnsade.

Effekten av MHC pÄ generativa rörelsemodeller

The Masked Humanoid Controller (MHC) Àr en del av en bredare anstrÀngning av Intel Labs och dess samarbetspartners för att ansvarsfullt bygga generativa modeller, inklusive de som driver text-till-bild och 3D generation uppgifter. Som diskuterades vid ECCV 2024 har detta tillvÀgagÄngssÀtt betydande konsekvenser för industrier som robotik, virtuell verklighet, spel och simulering, dÀr genereringen av realistiska mÀnskliga rörelser Àr avgörande. Genom att integrera multimodala ingÄngar och göra det möjligt för styrenheten att sömlöst vÀxla mellan rörelser, kan MHC hantera verkliga förhÄllanden dÀr sensordata kan vara störande eller ofullstÀndig.

Detta arbete av Intel Labs stÄr vid sidan av annan avancerad forskning som presenterades vid ECCV 2024, sÄsom deras nya försvar för text-till-bild-modeller och utvecklingen av tekniker för att förbÀttra rumslig konsekvens i bildgenerering. Tillsammans visar dessa framsteg upp Intels ledarskap inom datorseende, med fokus pÄ att utveckla sÀker, skalbar och ansvarsfull AI-teknik.

Slutsats

Masked Humanoid Controller (MHC), utvecklad av Intel Labs och akademiska samarbetspartners, representerar ett avgörande steg framÄt inom omrÄdet för mÀnsklig rörelsegenerering. Genom att ta itu med det komplexa kontrollproblemet att generera realistiska rörelser frÄn multimodala ingÄngar banar MHC vÀgen för nya applikationer inom VR, spel, robotik och simulering. Denna forskning, som presenterades pÄ ECCV 2024, visar Intels engagemang för att frÀmja ansvarsfull AI och generativ modellering, vilket bidrar till sÀkrare och mer adaptiva teknologier inom olika domÀner.

Antoine Àr en visionÀr ledare och grundande partner till Unite.AI, driven av en orubblig passion för att forma och frÀmja framtiden för AI och robotik. En serieentreprenör, han tror att AI kommer att vara lika störande för samhÀllet som elektricitet, och fÄngas ofta pÄ att tjata om potentialen hos störande teknologier och AGI.

Som en futurist, Àr han dedikerad till att utforska hur dessa innovationer kommer att forma vÄr vÀrld. Dessutom Àr han grundare av Securities.io, en plattform fokuserad pÄ att investera i banbrytande teknologier som omdefinierar framtiden och omformar hela sektorer.