Finansiering

Mirelo samler inn 41 millioner dollar i seed-runde for å bringe AI-generert lyd til video, spill og mer

mm

Berlin-baserte Mirelo har samlet inn 41 millioner dollar i seed-runde for å løse ett av de mest vedvarende blindpunktene i generativ media: lyd. Finansieringen ble co-ledet av Index Ventures og Andreessen Horowitz, med deltakelse fra Atlantic.vc og TriplePoint Capital, som understreker økende investor-tillit til at audio er det neste store frontarealet for AI-drevet kreativitet.

Mens kunstig intelligens raskt har forandret hvordan tekst, bilder og video produseres, har lyd liggende etter. Musikk, lydeffekter og bakgrunnsløyder er fortsatt arbeidskrevende, ofte lagt til sent i den kreative prosessen, til tross for deres store innvirkning på hvordan innhold oppfattes. Mirelos ambisjon er å endre dette ved å gjøre høykvalitets, emosjonelt resonant lyd like lett å generere som visuelt innhold.

Hvorfor lyd har blitt liggende etter

Lyd har en unik evne til å forme emosjon, spenning og atmosfære. En stum video, uansett hvor visuelt imponerende, føles sjelden fullstendig. Likevel må de fleste skapere fortsatt søke gjennom lager av lydeffekter, manuelt justere lydeffekter og iterere gjennom tidsplaner til alt føles riktig.

Dette mismatchet har blitt mer tydelig når video-skaping akselerer. AI-generert visuelt innhold, kortformat socialt innhold og adaptivt spillmiljø beveger seg raskere enn tradisjonelle lyd-arbeidsflyter kan støtte. Resultatet er en økende gap mellom hva skapere kan forestille seg visuelt og hva de kan realistisk utføre sonisk.

Mirelos grunnleggere så på dette gapet ikke som en begrensning av kreativitet, men som en begrensning av verktøy.

Bygging av grunnmodeller for lyd

Grundlagt i 2023, har Mirelo utviklet sine egne grunnmodeller spesifikt designet for lyd i video. I stedet for å gjenbruke store språkmodeller eller bilde-baserte systemer, fokuserte selskapet på lyd fra grunnen av. En bruker kan laste opp en video og, innen få sekunder, motta synkroniserte lydeffekter som responderer til bevegelse, timing og hendelser på skjermen.

Dette tilnærmingen er spesielt relevant i miljøer hvor innhold er dynamisk. AI-generert video, personlig sosialt innhold og moderne spillmiljøer alle nyter godt av lyd som kan tilpasse seg i sanntid. Mirelos system genererer lyd raskere enn sanntid, noe som gjør det mulig å holde pace med erfaringer som endrer seg på fly.

Selskapet har nylig lansert Mirelo SFX v1.5, en video-til-lydeffektmodell tilgjengelig gjennom sin selvbetjenings-API og web-applikasjon, Mirelo Studio. Ifølge selskapet er deres modeller lette, og krever betydelig mindre beregningskraft enn typiske store språkmodeller, samtidig som de leverer konkurrerende eller overlegen lydkvalitet i eksterne evalueringer.

Musikere i kjernen av teknologien

En av Mirelos definierende karakteristika er dens grunnleggende team. CEO CJ Simon-Gabriel og CTO Florian Wenzel er begge dyktige musikere samt erfarne AI-forskere. Simon-Gabriel har en PhD i maskinlæring og kausalinferens fra Max Planck-instituttet og fullførte en postdoktor-stipendiat ved ETH Zurich. Wenzel tok sin PhD i dyp læring fra Humboldt-universitetet og arbeidet tidligere som forsker ved Google Brain.

Musikk har vært en konstant parallell tråd i begges liv. Simon-Gabriel har utdannet seg i piano, orgel og komposisjon, og har talt åpent om å nesten ha fulgt en musikkarriere. Wenzel fortsatt å spille elektrisk gitar og produsere elektronisk musikk som en del av en Berlin-basert band.

Den doble bakgrunnen har formet Mirelos kultur og tekniske retning. I stedet for å behandle lyd som et sekundært utgangspunkt, tilnærmer teamet det som et primært kreativt medium, hvor matematisk presisjon og uttrykksfull nuanser må sameksistere.

Hva kommer neste for AI-generert lyd

Mirelos langsiktige ambisjon strekker seg langt utenfor enkel automatisering. Selskapet ser på sin teknologi som en måte å fjerne friksjon fra kreativt arbeid, håndtering av oppgaver som synkronisering og timing, så kunstnere og lyddesignere kan fokusere på uttrykk og fortelling.

Ettersom visuelt innhold blir mer personlig og interaktivt, vil lyd måtte utvikle seg sammen med det. Spill som tilpasser seg spillerens atferd, videoer generert på forespørsel og immersive virtuelle miljøer alle krever lyd som kan responderer dynamisk i stedet for å være fastlagt på forhånd.

I fremtiden kan teknologier som Mirelos omdefinere hvordan lyd skapes, deles og oppleves. I stedet for statiske soundtrack, kan lyd bli en levende komponent av visuelt innhold, generert i sanntid for å matche kontekst, emosjon og intensjon. I den fremtiden er lyd ikke lenger en ettertanke, men en integrert lag direkte inn i hvordan historier fortelles over video, spill, film og nye digitale verdener.

Antoine er en visjonær leder og grunnleggende partner i Unite.AI, drevet av en urokkelig lidenskap for å forme og fremme fremtiden for AI og robotikk. En seriegründer, han tror at AI vil være like disruptiv for samfunnet som elektrisitet, og blir ofte tatt i å tale om potensialet for disruptiv teknologi og AGI.
Som en futurist, er han dedikert til å utforske hvordan disse innovasjonene vil forme vår verden. I tillegg er han grunnleggeren av Securities.io, en plattform som fokuserer på å investere i banebrytende teknologier som omdefinerer fremtiden og omformer hele sektorer.