Pendanaan
Mirelo Mengumpulkan $41 Juta Putaran Benih untuk Membawa Suara yang Dihasilkan AI ke Video, Game, dan Diluar

Perusahaan Berlin-based Mirelo telah mengumpulkan putaran benih sebesar $41 juta saat mereka berusaha untuk menyelesaikan salah satu blind spot yang paling persisten dalam media generatif: suara. Pendanaan ini dipimpin oleh Index Ventures dan Andreessen Horowitz, dengan partisipasi dari Atlantic.vc dan TriplePoint Capital, menekankan keyakinan investor yang tumbuh bahwa audio adalah frontier besar berikutnya untuk kreativitas yang didorong AI.
Sementara kecerdasan buatan telah dengan cepat mengubah cara teks, gambar, dan video diproduksi, suara telah tertinggal. Musik, efek suara, dan suara ambient tetap memerlukan kerja keras, sering ditambahkan terlambat dalam proses kreatif meskipun pengaruhnya yang besar terhadap bagaimana konten dipersepsikan. Ambisi Mirelo adalah untuk mengubah itu dengan membuat suara berkualitas tinggi, yang resonan secara emosional, sehingga mudah dihasilkan seperti visual.
Mengapa Suara Telah Ditinggalkan
Suara memiliki kemampuan unik untuk membentuk emosi, ketegangan, dan atmosfer. Sebuah video bisu, tidak peduli seberapa mengesankan secara visual, jarang terasa lengkap. Namun, bagi kebanyakan kreator, menambahkan audio masih berarti mencari melalui perpustakaan stok, memilih efek suara secara manual, dan mengulangi timeline sampai semuanya terasa benar.
Kesalahpahaman ini telah menjadi lebih jelas seiring percepatan pembuatan video. Visual yang dihasilkan AI, konten sosial berdurasi pendek, dan lingkungan game adaptif semua bergerak lebih cepat daripada alur kerja audio tradisional dapat mendukung. Hasilnya adalah celah yang tumbuh antara apa yang dapat dibayangkan kreator secara visual dan apa yang dapat mereka lakukan secara realistis secara sonik.
Pendiri Mirelo melihat celah ini bukan sebagai keterbatasan kreativitas, melainkan sebagai keterbatasan alat.
Membangun Model Fondasi untuk Audio
Didirikan pada 2023, Mirelo telah mengembangkan model fondasi mereka sendiri yang dirancang khusus untuk suara dalam video. Daripada menggunakan kembali model bahasa besar atau sistem berbasis gambar, perusahaan ini fokus pada audio dari awal. Seorang pengguna dapat mengunggah video dan, dalam beberapa detik, menerima efek suara yang disinkronkan yang merespons gerakan, waktu, dan peristiwa layar.
Pendekatan ini sangat relevan dalam lingkungan di mana konten dinamis. Video yang dihasilkan AI, umpan sosial pribadi, dan game video modern semua mendapat manfaat dari audio yang dapat beradaptasi secara real-time. Sistem Mirelo menghasilkan suara lebih cepat daripada waktu nyata, memungkinkan untuk mengikuti pengalaman yang berubah seiring waktu.
Perusahaan ini baru-baru ini merilis Mirelo SFX v1.5, model video-ke-efek suara yang tersedia melalui API mandiri dan aplikasi web, Mirelo Studio. Menurut perusahaan, model mereka ringan, memerlukan komputasi yang jauh lebih sedikit daripada model bahasa besar biasa sambil menyajikan kualitas audio yang kompetitif atau unggul dalam evaluasi eksternal.
Musisi di Inti Teknologi
Salah satu karakteristik Mirelo yang paling menonjol adalah tim pendirinya. CEO CJ Simon-Gabriel dan CTO Florian Wenzel keduanya adalah musisi berprestasi serta peneliti AI berpengalaman. Simon-Gabriel memegang gelar PhD dalam pembelajaran mesin dan inferensi kausal dari Max Planck Institute dan menyelesaikan fellowship pasca-doktoral di ETH Zurich. Wenzel meraih gelar PhD dalam pembelajaran dalam dari Universitas Humboldt dan sebelumnya bekerja sebagai peneliti di Google Brain.
Musik telah menjadi benang paralel konstan dalam kehidupan mereka berdua. Simon-Gabriel terlatih dalam piano, organ, dan komposisi dan telah berbicara secara terbuka tentang hampir mengejar karir profesional dalam musik. Wenzel terus memainkan gitar listrik dan memproduksi musik elektronik sebagai bagian dari sebuah band berbasis Berlin.
Latar belakang ganda ini telah membentuk budaya dan arah teknis Mirelo. Daripada memperlakukan suara sebagai output sekunder, tim ini mendekatinya sebagai medium kreatif primer, di mana presisi matematis dan nuansa ekspresif harus coexist.
Apa yang Datang Selanjutnya untuk Suara yang Dihasilkan AI
Ambisi jangka panjang Mirelo meluas jauh melampaui otomatisasi sederhana. Perusahaan ini melihat teknologinya sebagai cara untuk menghilangkan friksi dari pekerjaan kreatif, menangani tugas seperti sinkronisasi dan timing sehingga seniman dan desainer suara dapat fokus pada ekspresi dan storytelling.
Seiring konten visual menjadi lebih pribadi dan interaktif, audio akan perlu berkembang bersamanya. Game yang beradaptasi dengan perilaku pemain, video yang dihasilkan sesuai permintaan, dan lingkungan virtual yang imersif semua memerlukan suara yang dapat merespons secara dinamis daripada menjadi tetap sebelumnya.
Melihat ke depan, teknologi seperti Mirelo’s dapat mendefinisikan kembali bagaimana suara dibuat, dibagikan, dan dialami. Sebagai gantinya untuk soundtrack statis, audio mungkin menjadi komponen hidup dari media visual, dihasilkan secara real-time untuk mencocokkan konteks, emosi, dan niat. Di masa depan itu, suara tidak lagi menjadi pemikiran kedua, melainkan lapisan integral yang ditenun langsung ke dalam cara cerita diceritakan melintasi video, gaming, film, dan dunia digital yang muncul.












