ํŽ€๋”ฉ

Mirelo, 4์ฒœ๋งŒ ๋‹ฌ๋Ÿฌ์˜ ์‹œ๋“œ ๋ผ์šด๋“œ๋ฅผ ์œ ์น˜ํ•˜์—ฌ ๋น„๋””์˜ค, ๊ฒŒ์ž„, ๊ทธ ์ด์ƒ์˜ AI ์ƒ์„ฑ ์‚ฌ์šด๋“œ ๊ฐœ๋ฐœ์— ๋‚˜์„œ๋‹ค

mm

베를린에 본사를 둔 Mirelo는 생성 미디어에서 가장 지속적인 맹점 중 하나인 사운드를 해결하기 위해 4천만 달러의 시드 라운드를 유치했다. 이 자금은 Index VenturesAndreessen Horowitz가 공동으로 주도했으며, Atlantic.vcTriplePoint Capital이 참여했다. 이는 오디오가 AI 주도 창의성의 다음 주요 전선이라는 투자자의 신뢰를 강화한다.

인공지능은 텍스트, 이미지, 비디오의 생산을 빠르게 변화시키면서, 오디오는 뒤처졌다. 음악, 사운드 이펙트, 앰비언트 사운드 등은 여전히 노동 집약적이며, 종종 창의적 과정의 마지막에 추가되며, 내용이 어떻게 인식되는지에 대한 영향이 크다. Mirelo의 야망은 높은 품질의 감정적 공鳴을 가진 사운드를 생성하는 것을 쉽게 만드는 것이다.

사운드가 왜 뒤처지는가

사운드는 감정, 긴장, 분위기를 형성하는 고유한 능력을 가지고 있다. 시각적으로 인상적인 비디오라도 음성이 없으면 완전하지 않은 느낌이다. 그러나 대부분의 창작자들은 음성을 추가하는 것이 여전히 스톡 라이브러리를 검색하고, 사운드 이펙트를 수동으로 정렬하고, 타임라인을 반복적으로 수정하는 것을 의미한다.

이 불일치는 비디오 생성이 가속화됨에 따라 더 명백해졌다. AI 생성 비주얼, 소셜 미디어의 짧은 형식의 콘텐츠, 적응형 게임 환경 등은 전통적인 오디오 워크플로를 지원할 수 없다. 결과적으로 창작자가 시각적으로 상상할 수 있는 것과 실제로 실행할 수 있는 것 사이에 커지는 간격이 있다.

Mirelo의 창립자들은 이 간격을 창의성의 한계로 보지 않고, 도구의 한계로 보았다.

오디오를 위한 기초 모델 구축

2023년에 설립된 Mirelo는 비디오를 위한 사운드에 특화된 기초 모델을 개발했다. 대규모 언어 모델이나 이미지 기반 시스템을 재사용하는 대신, 회사는 오디오에서부터 시작했다. 사용자는 비디오를 업로드하고, 몇 초 내에 동기화된 사운드 이펙트를 받을 수 있다.

이 접근 방식은 콘텐츠가 동적인 환경에서 특히 관련이 있다. AI 생성 비디오, 개인화된 소셜 피드, 현대적인 비디오 게임 등은 실시간으로 적응할 수 있는 오디오를 이익으로 한다. Mirelo의 시스템은 실시간보다 빠르게 사운드를 생성하여 변경되는 경험과 함께 유지할 수 있다.

회사는 최근 Mirelo SFX v1.5를 출시했으며, 이는 비디오에서 사운드 이펙트로의 모델이다. 이 모델은 자체 API와 웹 애플리케이션인 Mirelo Studio를 통해 제공된다. 회사는 자신의 모델이 경량화되어 있으며, 일반적인 대규모 언어 모델보다 훨씬 적은 컴퓨팅 파워가 필요하다고 말한다.

기술의核心에 있는 음악가들

Mirelo의 특징 중 하나는 창립 팀이다. CEO CJ Simon-Gabriel과 CTO Florian Wenzel은 모두 유능한 음악가이자 경험 많은 AI 연구자이다. Simon-Gabriel은 마ックス 플랑크 연구소에서 기계 학습과 인과 추론에 대한 박사 학위를 받았으며, ETH 취리히에서 박사 후 연구원을 했다. Wenzel은 훔볼트 대학에서 심층 학습에 대한 박사 학위를 받았으며, 이전에 구글 브레인에서 연구원으로 일했다.

음악은 두 사람의 삶에서 항상 평행한 스레드였다. Simon-Gabriel은 피아노, 오르간, 작곡을 공부했으며, 거의 전문적으로 음악을 추구했다. Wenzel은 계속해서 일렉트릭 기타를 연주하고, 베를린 기반의 밴드에서 전자 음악을 제작한다.

이 쌍방향 배경은 Mirelo의 문화와 기술 방향을 형성했다. 사운드를 두번째 출력으로 다루지 않고, 주요 창의적 매체로 접근한다. 수학적 정밀도와 표현의 섬세함이 공존해야 한다.

AI 생성 사운드의 미래

Mirelo의 장기적인 야망은 단순한 자동화를 넘어선다. 회사는 기술을 창의적 작업에서 마찰을 제거하는 방법으로 본다. 동기화와 타이밍과 같은 작업을 처리하여 예술가와 사운드 디자이너가 표현과 스토리텔링에 집중할 수 있다.

시각적 콘텐츠가 더 개인화되고 상호작용성이 높아짐에 따라, 오디오도 함께 진화해야 한다. 플레이어의 행동에 따라 적응하는 게임, 요구에 따라 생성되는 비디오, 몰입형 가상 환경 등은 미리 고정된 것이 아니라 동적으로 반응할 수 있는 사운드를 필요로 한다.

미래를 내다보면, Mirelo와 같은 기술은 사운드가 생성, 공유, 경험되는 방식을 재정의할 수 있다. 정적인 사운드트랙 대신, 오디오는 시각적 미디어의 살아있는 구성 요소가 되어, 실시간으로 문맥, 감정, 의도에 맞게 생성될 수 있다. 그 미래에는 사운드가 더 이상 사후적인 생각이 아니며, 비디오, 게임, 영화, 새로운 디지털 세계에서 이야기하는 방식에 직접적으로 통합된 필수적인 계층이 된다.

์•™ํˆฌ์•ˆ์€ Unite.AI์˜ ๋น„์ „์žˆ๋Š” ๋ฆฌ๋”์ด์ž ๊ณต๋™ ์ฐฝ๋ฆฝ์ž๋กœ์„œ, AI์™€ ๋กœ๋ด‡๊ณตํ•™์˜ ๋ฏธ๋ž˜๋ฅผ ํ˜•์„ฑํ•˜๊ณ  ์ด‰์ง„ํ•˜๋Š” ๋ฐ ๋Œ€ํ•œ ๋ถˆ๋ณ€์˜ ์—ด์ •์— ์˜ํ•ด ์ถ”๋™๋ฉ๋‹ˆ๋‹ค. ์—ฐ์‡„์ ์ธ ๊ธฐ์—…๊ฐ€๋กœ์„œ, ๊ทธ๋Š” AI๊ฐ€ ์‚ฌํšŒ์— ๋Œ€ํ•œ ์ „๊ธฐ์™€ ๊ฐ™์€ ํŒŒ๊ดด๋ ฅ์„ ๊ฐ€์งˆ ๊ฒƒ์ด๋ผ๊ณ  ๋ฏฟ์œผ๋ฉฐ, ์ข…์ข… ํŒŒ๊ดด์ ์ธ ๊ธฐ์ˆ ๊ณผ AGI์˜ ์ž ์žฌ๋ ฅ์— ๋Œ€ํ•ด ์—ด๊ด‘ํ•ฉ๋‹ˆ๋‹ค.

ไฝœไธบ futurist, ๊ทธ๋Š” ์ด๋Ÿฌํ•œ ํ˜์‹ ์ด ์šฐ๋ฆฌ์˜ ์„ธ๊ณ„๋ฅผ ์–ด๋–ป๊ฒŒ ํ˜•์„ฑํ• ์ง€ ํƒ๊ตฌํ•˜๋Š” ๋ฐ ์ „๋…ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ๊ทธ๋Š” Securities.io์˜ ์ฐฝ๋ฆฝ์ž๋กœ์„œ, ๋ฏธ๋ž˜๋ฅผ ์žฌ์ •์˜ํ•˜๊ณ  ์ „์ฒด ๋ถ€๋ฌธ์„ ์žฌํ˜•์„ฑํ•˜๋Š” ์ตœ์ฒจ๋‹จ ๊ธฐ์ˆ ์— ํˆฌ์žํ•˜๋Š” ํ”Œ๋žซํผ์ž…๋‹ˆ๋‹ค.