Finanziamenti
Mirelo raccoglie 41 milioni di dollari nella fase di seed per portare il suono generato da AI ai video, ai giochi e oltre

La società di Berlino Mirelo ha raccolto 41 milioni di dollari nella fase di seed mentre si prepara a risolvere uno dei punti ciechi più persistenti nei media generativi: il suono. Il finanziamento è stato cofinanziato da Index Ventures e Andreessen Horowitz, con la partecipazione di Atlantic.vc e TriplePoint Capital, sottolineando la crescente fiducia degli investitori che l’audio è il prossimo grande fronte per la creatività guidata da AI.
Mentre l’intelligenza artificiale ha rapidamente trasformato la produzione di testo, immagini e video, l’audio è rimasto indietro. La musica, gli effetti sonori e il suono ambientale rimangono lavori intensivi, spesso aggiunti tardi nel processo creativo nonostante la loro influenza sproporzionata su come il contenuto è percepito. L’ambizione di Mirelo è quella di cambiare questo stato di cose rendendo il suono di alta qualità e rissonante emotivamente facile da generare come le immagini.
Perché il suono è stato lasciato indietro
Il suono ha la capacità unica di plasmare l’emozione, la tensione e l’atmosfera. Un video silenzioso, non importa quanto visivamente impressionante, raramente sembra completo. Eppure, per la maggior parte dei creatori, aggiungere l’audio significa ancora cercare nelle librerie di stock, allineare manualmente gli effetti sonori e iterare attraverso le timeline fino a quando tutto non sembra giusto.
Questa mancanza di sincronia è diventata più evidente con l’aumento della creazione di video. I contenuti visivi generati da AI, i contenuti social a breve durata e gli ambienti di gioco adattivi si muovono più velocemente di quanto i flussi di lavoro audio tradizionali possano supportare. Il risultato è un divario crescente tra ciò che i creatori possono immaginare visivamente e ciò che possono realisticamente eseguire sonicamente.
I fondatori di Mirelo hanno visto questo divario non come una limitazione della creatività, ma come una limitazione degli strumenti.
Costruire modelli di base per l’audio
Fondata nel 2023, Mirelo ha sviluppato i propri modelli di base progettati specificamente per il suono nei video. Invece di riutilizzare grandi modelli linguistici o sistemi basati su immagini, la società si è concentrata sull’audio fin dall’inizio. Un utente può caricare un video e, in pochi secondi, ricevere effetti sonori sincronizzati che rispondono al movimento, al timing e agli eventi sullo schermo.
Questo approccio è particolarmente rilevante in ambienti in cui il contenuto è dinamico. I video generati da AI, i feed social personalizzati e i giochi moderni traggono tutti vantaggio dall’audio che può adattarsi in tempo reale. Il sistema di Mirelo genera il suono più velocemente del tempo reale, consentendogli di stare al passo con le esperienze che cambiano al volo.
La società ha recentemente rilasciato Mirelo SFX v1.5, un modello di video-per-effetto sonoro disponibile tramite la sua API self-service e l’applicazione web Mirelo Studio. Secondo la società, i suoi modelli sono leggeri, richiedendo significativamente meno calcolo dei tipici grandi modelli linguistici mentre offrono una qualità audio competitiva o superiore nelle valutazioni esterne.
I musicisti al cuore della tecnologia
Una delle caratteristiche distintive di Mirelo è il suo team di fondatori. Il CEO CJ Simon-Gabriel e il CTO Florian Wenzel sono entrambi musicisti di talento oltre che ricercatori di AI esperti. Simon-Gabriel detiene un dottorato in apprendimento automatico e inferenza causale presso l’Istituto Max Planck e ha completato un fellowship postdottorale presso l’ETH di Zurigo. Wenzel ha conseguito il dottorato in apprendimento profondo presso l’Università Humboldt e in precedenza ha lavorato come ricercatore presso Google Brain.
La musica è stata una costante filo parallelo nella vita di entrambi. Simon-Gabriel si è formato al pianoforte, all’organo e alla composizione e ha parlato apertamente di come avrebbe quasi intrapreso la carriera musicale professionale. Wenzel continua a suonare la chitarra elettrica e a produrre musica elettronica come parte di una band di Berlino.
Questa doppia formazione ha plasmato la cultura e la direzione tecnica di Mirelo. Invece di trattare il suono come un output secondario, il team lo affronta come un mezzo creativo primario, in cui la precisione matematica e la sfumatura espressiva devono coesistere.
Cosa viene dopo per il suono generato da AI
L’ambizione a lungo termine di Mirelo va ben oltre la semplice automazione. La società vede la sua tecnologia come un modo per rimuovere la frizione dal lavoro creativo, gestendo attività come la sincronizzazione e il timing in modo che gli artisti e i progettisti del suono possano concentrarsi sull’espressione e sulla narrazione.
Man mano che il contenuto visivo diventa più personalizzato e interattivo, l’audio dovrà evolversi insieme. I giochi che si adattano al comportamento del giocatore, i video generati su richiesta e gli ambienti virtuali immersivi richiedono tutti un suono che possa rispondere dinamicamente piuttosto che essere fisso in anticipo.
Guardando avanti, tecnologie come quelle di Mirelo potrebbero ridefinire come il suono viene creato, condiviso e sperimentato. Invece di colonne sonore statiche, l’audio potrebbe diventare un componente vivo dei media visivi, generato in tempo reale per corrispondere al contesto, all’emozione e all’intento. In quel futuro, il suono non è più un pensiero secondario, ma uno strato integrale tessuto direttamente nel modo in cui le storie vengono raccontate attraverso video, giochi, film e mondi digitali emergenti.












