Finanțare
Mirelo strânge 41 de milioane de dolari într-o rundă de finanțare pentru a aduce sunetul generat de IA în videoclipuri, jocuri și dincolo

Compania berlineză Mirelo a strâns o rundă de finanțare de 41 de milioane de dolari, în timp ce își propune să rezolve una dintre cele mai persistente puncte oarbe în mass-media generativă: sunetul. Finanțarea a fost condusă de Index Ventures și Andreessen Horowitz, cu participarea Atlantic.vc și TriplePoint Capital, subliniind creșterea încrederii investitorilor că audio-ul este următoarea frontieră majoră pentru creativitatea condusă de IA.
În timp ce inteligența artificială a transformat rapid modul în care sunt produse textul, imaginile și videoclipurile, sunetul a rămas în urmă. Muzica, efectele sonore și sunetul ambiental rămân activități care necesită mult timp și efort, adesea adăugate târziu în procesul creativ, în ciuda influenței lor mari asupra modului în care este perceput conținutul. Ambiția Mirelo este să schimbe acest lucru, făcând sunetul de înaltă calitate, care rezonă emoțional, la fel de ușor de generat ca și imaginile.
De ce sunetul a fost lăsat în urmă
Sunetul are o capacitate unică de a modela emoția, tensiunea și atmosfera. Un videoclip mut, indiferent de cât de impresionant este din punct de vedere vizual, rareori se simte complet. Cu toate acestea, pentru majoritatea creatorilor, adăugarea de sunet înseamnă în continuare căutarea prin biblioteci de stoc, alinierea manuală a efectelor sonore și iterarea prin timeline-uri până când totul se simte corect.
Acest decalaj a devenit mai evident pe măsură ce crearea de videoclipuri accelerază. Videoclipurile generate de IA, conținutul scurt din rețelele sociale și mediile de joc adaptative se mișcă mai repede decât fluxurile de lucru audio tradiționale pot susține. Rezultatul este o creștere a decalajului dintre ceea ce creatorii pot imagina din punct de vedere vizual și ceea ce pot executa realistic din punct de vedere sonor.
Fondatorii Mirelo au văzut acest decalaj nu ca o limitare a creativității, ci ca o limitare a instrumentelor.
Construirea de modele de bază pentru audio
Înființată în 2023, Mirelo a dezvoltat propriile sale modele de bază, concepute special pentru sunet în videoclipuri. În loc să reutilizeze modele de limbaj mari sau sisteme bazate pe imagini, compania s-a concentrat pe audio de la zero. Un utilizator poate încărca un videoclip și, în câteva secunde, primi efecte sonore sincronizate care răspund la mișcare, timing și evenimente de pe ecran.
Acest abordare este deosebit de relevantă în medii în care conținutul este dinamic. Videoclipurile generate de IA, feed-urile sociale personalizate și jocurile video moderne beneficiază de audio care poate adapta în timp real. Sistemul Mirelo generează sunet mai rapid decât timpul real, permițându-i să țină pasul cu experiențele care se schimbă pe parcurs.
Compania a lansat recent Mirelo SFX v1.5, un model de sunet pentru videoclipuri, disponibil prin API-ul său self-service și aplicația web, Mirelo Studio. Conform companiei, modelele sale sunt ușoare, necesitând semnificativ mai puțină putere de calcul decât modelele de limbaj mari obișnuite, oferind o calitate a sunetului competitivă sau superioară în evaluări externe.
Muzicienii la baza tehnologiei
Una dintre caracteristicile definitorii ale Mirelo este echipa sa fondatoare. CEO-ul CJ Simon-Gabriel și CTO Florian Wenzel sunt amândoi muzicieni deosebiți, precum și cercetători AI experimentați. Simon-Gabriel deține un doctorat în învățare automată și inferență cauzală de la Institutul Max Planck și a finalizat o bursă postdoctorală la ETH Zurich. Wenzel a obținut doctoratul în învățare profundă de la Universitatea Humboldt și a lucrat anterior ca cercetător la Google Brain.
Muzica a fost o constantă în viața ambilor. Simon-Gabriel a fost instruit în pian, orgă și compoziție și a vorbit deschis despre faptul că a fost aproape de a urma o carieră muzicală. Wenzel continuă să cânte la chitară electrică și produce muzică electronică ca parte a unei trupe din Berlin.
Această dublă experiență a modelat cultura și direcția tehnică a Mirelo. În loc să trateze sunetul ca o ieșire secundară, echipa abordează sunetul ca un mediu creativ primar, în care precizia matematică și nuanța expresivă trebuie să coexiste.
Ce urmează pentru sunetul generat de IA
Ambiția pe termen lung a Mirelo se extinde mult dincolo de simpla automatizare. Compania consideră tehnologia sa ca o modalitate de a elimina fricțiunile din munca creativă, gestionând sarcini precum sincronizarea și temporizarea, astfel încât artiștii și designerii de sunet să se poată concentra pe expresie și povestire.
Pe măsură ce conținutul vizual devine mai personalizat și interactiv, sunetul va trebui să evolueze alături. Jocurile care se adaptează la comportamentul jucătorului, videoclipurile generate la cerere și mediile virtuale imersive necesită sunet care poate răspunde dinamic, în loc să fie fixat dinainte.
Privind spre viitor, tehnologii precum cea a Mirelo ar putea redesena modul în care sunetul este creat, partajat și experimentat. În loc de coloane sonore statice, sunetul poate deveni un component viu al mass-media vizuale, generat în timp real pentru a se potrivi cu contextul, emoția și intenția. În acel viitor, sunetul nu mai este o gândire ulterioară, ci un strat integrat direct în modul în care sunt spuse poveștile de-a lungul videoclipurilor, jocurilor, filmelor și lumilor digitale emergente.












