Financement
Mirelo lĂšve 41 millions de dollars dans le cadre dâune augmentation de capital pour apporter des sons gĂ©nĂ©rĂ©s par lâIA aux vidĂ©os, jeux et au-delĂ

La société berlinoise Mirelo a levé 41 millions de dollars dans le cadre d’une augmentation de capital pour résoudre l’un des points aveugles les plus persistants dans les médias génératifs : le son. Le financement a été co-dirigé par Index Ventures et Andreessen Horowitz, avec la participation de Atlantic.vc et TriplePoint Capital, soulignant la confiance croissante des investisseurs que l’audio est la prochaine grande frontière pour la créativité pilotée par l’IA.
Alors que l’intelligence artificielle a rapidement transformé la façon dont le texte, les images et les vidéos sont produits, l’audio a accusé un retard. La musique, les effets sonores et les bruits ambiants restent des tâches fastidieuses, souvent ajoutés tard dans le processus créatif, malgré leur influence disproportionnée sur la façon dont le contenu est perçu. L’ambition de Mirelo est de changer cela en rendant la production de sons de haute qualité, émotionnellement résilients, aussi facile que la génération de visuels.
Pourquoi le son a-t-il été laissé pour compte
Le son a une capacité unique à façonner l’émotion, la tension et l’atmosphère. Une vidéo silencieuse, quelle que soit sa qualité visuelle, rarement ressemble à une œuvre complète. Pour la plupart des créateurs, ajouter de l’audio signifie encore aujourd’hui chercher dans les bibliothèques de stock, aligner manuellement les effets sonores et itérer à travers les chronologies jusqu’à ce que tout se sente juste.
Ce décalage est devenu plus évident à mesure que la création de vidéos s’accélère. Les visuels générés par l’IA, le contenu social à court terme et les environnements de jeux adaptatifs se déplacent plus rapidement que les flux de travail audio traditionnels ne peuvent les supporter. Le résultat est un écart croissant entre ce que les créateurs peuvent imaginer visuellement et ce qu’ils peuvent réaliser soniquement.
Les fondateurs de Mirelo ont vu cet écart non pas comme une limitation de la créativité, mais comme une limitation de l’outillage.
Construire des modèles de base pour l’audio
Fondée en 2023, Mirelo a développé ses propres modèles de base conçus spécifiquement pour le son dans la vidéo. Plutôt que de réutiliser de grands modèles de langage ou des systèmes basés sur les images, la société s’est concentrée sur l’audio dès le départ. Un utilisateur peut télécharger une vidéo et, en quelques secondes, recevoir des effets sonores synchronisés qui répondent au mouvement, au timing et aux événements à l’écran.
Cette approche est particulièrement pertinente dans les environnements où le contenu est dynamique. Les vidéos générées par l’IA, les flux sociaux personnalisés et les jeux vidéo modernes bénéficient tous de l’audio qui peut s’adapter en temps réel. Le système de Mirelo génère du son plus rapidement que en temps réel, lui permettant de suivre les expériences qui changent au fil du temps.
La société a récemment publié Mirelo SFX v1.5, un modèle de son à effet pour la vidéo disponible via son API autonome et son application Web, Mirelo Studio. Selon la société, ses modèles sont légers, nécessitant nettement moins de calculs que les modèles de langage typiques tout en offrant une qualité audio concurrentielle ou supérieure lors d’évaluations externes.
Les musiciens au cœur de la technologie
L’une des caractéristiques définissantes de Mirelo est son équipe fondatrice. Le PDG CJ Simon-Gabriel et le CTO Florian Wenzel sont tous deux musiciens accomplis ainsi que chercheurs expérimentés en IA. Simon-Gabriel est titulaire d’un doctorat en apprentissage automatique et inférence causale de l’Institut Max Planck et a terminé un poste de recherche postdoctoral à l’ETH Zurich. Wenzel a obtenu son doctorat en apprentissage profond de l’Université Humboldt et a précédemment travaillé en tant que chercheur à Google Brain.
La musique a été un fil conducteur constant dans leurs vies. Simon-Gabriel a été formé au piano, à l’orgue et à la composition et a parlé ouvertement de sa proximité avec une carrière musicale professionnelle. Wenzel continue de jouer de la guitare électrique et de produire de la musique électronique dans le cadre d’un groupe basé à Berlin.
Ce double bagage a façonné la culture et la direction technique de Mirelo. Plutôt que de traiter le son comme une sortie secondaire, l’équipe l’aborde comme un médium créatif principal, où la précision mathématique et la nuance expressive doivent coexister.
Que se passe-t-il ensuite pour le son généré par l’IA
L’ambition à long terme de Mirelo va bien au-delà de l’automatisation simple. La société considère sa technologie comme un moyen d’éliminer les frictions dans le travail créatif, en gérant des tâches telles que la synchronisation et le timing afin que les artistes et les concepteurs sonores puissent se concentrer sur l’expression et le récit.
<p À mesure que le contenu visuel devient plus personnalisé et interactif, l’audio devra évoluer en parallèle. Les jeux qui s’adaptent au comportement du joueur, les vidéos générées sur demande et les environnements virtuels immersifs nécessitent tous un son qui peut répondre dynamiquement plutôt que d’être fixé à l’avance.
En regardant vers l’avenir, des technologies comme celles de Mirelo pourraient redéfinir la façon dont le son est créé, partagé et vécu. Au lieu de bandes sonores statiques, l’audio peut devenir un élément vivant des médias visuels, généré en temps réel pour correspondre au contexte, à l’émotion et à l’intention. Dans cet avenir, le son n’est plus une après-pensée, mais une couche intégrale tissée directement dans la façon dont les histoires sont racontées à travers la vidéo, le jeu, le film et les mondes numériques émergents.












