Financiamento

A Mirelo Levanta $41 Milhões em Rodada de Sementes para Levar Som Gerado por IA para Vídeo, Jogos e Além

mm

A empresa de Berlim, Mirelo, levantou uma rodada de sementes de $41 milhões enquanto busca resolver um dos principais pontos cegos na mídia gerativa: o som. A financiamento foi co-liderado por Index Ventures e Andreessen Horowitz, com a participação de Atlantic.vc e TriplePoint Capital, destacando a crescente confiança dos investidores de que o áudio é a próxima grande fronteira para a criatividade impulsionada por IA.

Enquanto a inteligência artificial rapidamente transformou a forma como o texto, as imagens e os vídeos são produzidos, o áudio ficou para trás. A música, os efeitos sonoros e os sons ambientais ainda são trabalhosos, muitas vezes adicionados tarde no processo criativo, apesar de sua influência desproporcional sobre como o conteúdo é percebido. A ambição da Mirelo é mudar isso, tornando o som de alta qualidade e ressonante emocionalmente tão fácil de gerar quanto os visuais.

Por Que o Som Foi Deixado Para Trás

O som tem a capacidade única de moldar a emoção, a tensão e a atmosfera. Um vídeo silencioso, não importa quão visualmente impressionante, raramente parece completo. No entanto, para a maioria dos criadores, adicionar áudio ainda significa procurar em bibliotecas de estoque, alinhar manualmente os efeitos sonoros e iterar por meio de cronogramas até que tudo se sinta certo.

Essa discrepância se tornou mais óbvia à medida que a criação de vídeo acelera. Os visuais gerados por IA, o conteúdo de curta duração nas redes sociais e os ambientes de jogos adaptáveis se movem mais rápido do que os fluxos de trabalho de áudio tradicionais podem suportar. O resultado é uma lacuna crescente entre o que os criadores podem imaginar visualmente e o que eles podem executar realisticamente em termos sonoros.

Os fundadores da Mirelo viram essa lacuna não como uma limitação da criatividade, mas como uma limitação dos instrumentos.

Construindo Modelos de Fundação para Áudio

Fundada em 2023, a Mirelo desenvolveu seus próprios modelos de fundação projetados especificamente para som em vídeo. Em vez de reutilizar grandes modelos de linguagem ou sistemas baseados em imagens, a empresa se concentrou no áudio desde o início. Um usuário pode fazer upload de um vídeo e, em segundos, receber efeitos sonoros sincronizados que respondem ao movimento, tempo e eventos na tela.

Abordagem particularmente relevante em ambientes onde o conteúdo é dinâmico. Os vídeos gerados por IA, as feeds de mídia social personalizadas e os jogos de vídeo modernos todos se beneficiam do áudio que pode se adaptar em tempo real. O sistema da Mirelo gera som mais rápido do que em tempo real, permitindo que ele acompanhe experiências que mudam voando.

A empresa recentemente lançou o Mirelo SFX v1.5, um modelo de efeito sonoro de vídeo para som disponível por meio de sua API de autoatendimento e aplicativo web, Mirelo Studio. De acordo com a empresa, seus modelos são leves, exigindo significativamente menos computação do que os modelos de linguagem grandes típicos, enquanto entregam qualidade de áudio competitiva ou superior em avaliações externas.

Músicos no Núcleo da Tecnologia

Uma das características definidoras da Mirelo é sua equipe de fundadores. O CEO CJ Simon-Gabriel e o CTO Florian Wenzel são ambos músicos talentosos, bem como pesquisadores de IA experientes. Simon-Gabriel possui um PhD em aprendizado de máquina e inferência causal do Instituto Max Planck e completou uma bolsa de pós-doutorado na ETH Zurich. Wenzel obteve seu PhD em aprendizado profundo da Universidade Humboldt e anteriormente trabalhou como pesquisador no Google Brain.

A música tem sido uma constante linha paralela em ambas as suas vidas. Simon-Gabriel se formou em piano, órgão e composição e falou abertamente sobre quase seguir carreira profissional na música. Wenzel continua a tocar guitarra elétrica e produzir música eletrônica como parte de uma banda baseada em Berlim.

Essa dupla formação moldou a cultura e a direção técnica da Mirelo. Em vez de tratar o som como uma saída secundária, a equipe o aborda como um meio criativo primário, onde a precisão matemática e a nuances expressivas devem coexistir.

O Que Vem a Seguir para o Som Gerado por IA

A ambição de longo prazo da Mirelo se estende muito além da simples automação. A empresa vê sua tecnologia como uma forma de remover a fricção do trabalho criativo, lidando com tarefas como sincronização e temporização para que os artistas e designers de som possam se concentrar em expressão e narrativa.

À medida que o conteúdo visual se torna mais personalizado e interativo, o áudio precisará evoluir junto com ele. Jogos que se adaptam ao comportamento do jogador, vídeos gerados sob demanda e ambientes virtuais imersivos todos exigem som que possa responder dinamicamente em vez de ser fixo com antecedência.

Olhando para o futuro, tecnologias como a da Mirelo poderiam redefinir como o som é criado, compartilhado e experimentado. Em vez de trilhas sonoras estáticas, o áudio pode se tornar um componente vivo da mídia visual, gerado em tempo real para corresponder ao contexto, emoção e intenção. Nesse futuro, o som não é mais um afterthought, mas uma camada integral tecida diretamente na forma como as histórias são contadas em vídeo, jogos, cinema e mundos digitais emergentes.

Antoine é um líder visionário e sócio-fundador da Unite.AI, impulsionado por uma paixão inabalável em moldar e promover o futuro da IA e da robótica. Um empreendedor serial, ele acredita que a IA será tão disruptiva para a sociedade quanto a eletricidade, e é frequentemente pego falando sobre o potencial das tecnologias disruptivas e da AGI. Como um futurista, ele está dedicado a explorar como essas inovações moldarão nosso mundo. Além disso, ele é o fundador da Securities.io, uma plataforma focada em investir em tecnologias de ponta que estão redefinindo o futuro e remodelando setores inteiros.