การระดมทุน
Mirelo เปิดตัวเงินชุด种子มูลค่า 41 ล้านเหรียญสหรัฐฯ เพื่อนำเสียงที่สร้างโดย AI มาสู่วิดีโอ เกมส์ และอื่นๆ

บริษัท Mirelo ซึ่งตั้งอยู่ที่เบอร์ลิน ได้ระดมทุนชุด种子มูลค่า 41 ล้านเหรียญสหรัฐฯ ในขณะที่บริษัทตั้งเป้าหมายที่จะแก้ไขจุดบอดที่ยังคงอยู่ในสื่อสร้างสรรค์ ซึ่งก็คือ เสียง การระดมทุนนี้ได้รับการสนับสนุนร่วมกันโดย Index Ventures และ Andreessen Horowitz โดยมีการเข้าร่วมจาก Atlantic.vc และ TriplePoint Capital ซึ่งเน้นย้ำถึงความมั่นใจที่เพิ่มขึ้นของนักลงทุนที่ว่าเสียงเป็นแนวหน้าที่สำคัญถัดไปสำหรับความสร้างสรรค์ที่ขับเคลื่อนด้วย AI
ในขณะที่ปัญญาประดิษฐ์ได้เปลี่ยนแปลงวิธีการผลิตข้อความ ภาพ และวิดีโออย่างรวดเร็ว เสียงยังคงถูกทิ้งไว้ข้างหลัง ดนตรี เสียงประกอบ และเสียงพื้นหลังยังคงต้องใช้แรงงานมาก และมักถูกเพิ่มเข้ามาในขั้นตอนสุดท้ายของกระบวนการสร้างสรรค์ แม้ว่าจะมีอิทธิพลอย่างมากต่อวิธีที่ผู้ชมรับข้อมูลก็ตาม ความตั้งใจของ Mirelo คือการเปลี่ยนแปลงสิ่งนี้โดยการทำให้เสียงที่มีคุณภาพสูงและสร้างอารมณ์ได้ง่ายขึ้นในการสร้าง
ทำไมเสียงถึงถูกทิ้งไว้ข้างหลัง
เสียงมีความสามารถพิเศษในการสร้างอารมณ์ ความตึงเครียด และบรรยากาศ วิดีโอที่ไม่มีเสียง ไม่ว่าจะมีความน่าประทับใจทางภาพมากเพียงใด ก็ไม่เคยรู้สึกถึงความสมบูรณ์แบบ อย่างไรก็ตาม สำหรับผู้สร้างส่วนใหญ่ การเพิ่มเสียงยังคงต้องค้นหาในห้องสมุดสต็อก การจัดตำแหน่งเสียงประกอบด้วยมือ และการทำซ้ำผ่านไทม์ไลน์จนกว่าทุกอย่างจะรู้สึกถูกต้อง
ความไม่ตรงกันนี้ได้กลายเป็นเรื่องที่ชัดเจนมากขึ้นเมื่อการสร้างวิดีโอเร็วขึ้น วิดีโอที่สร้างโดย AI nội dungสั้นบนโซเชียลมีเดีย และสภาพแวดล้อมเกมที่ปรับเปลี่ยนได้ล้วนเคลื่อนที่เร็วกว่ากระบวนการทำงานเสียงแบบดั้งเดิมสามารถรองรับได้ ผลลัพธ์คือช่องว่างที่เพิ่มขึ้นระหว่างสิ่งที่ผู้สร้างสามารถจินตนาการได้ทางภาพและที่พวกเขาสามารถดำเนินการได้จริงทางเสียง
การสร้างแบบจำลองพื้นฐานสำหรับเสียง
Mirelo ก่อตั้งขึ้นในปี 2023 ได้พัฒนาแบบจำลองพื้นฐานของตนเองที่ออกแบบมาโดยเฉพาะสำหรับเสียงในวิดีโอ แทนที่จะนำแบบจำลองภาษาขนาดใหญ่หรือระบบที่ใช้ภาพมาใช้ บริษัทได้ให้ความสนใจกับเสียงตั้งแต่เริ่มต้น ผู้ใช้สามารถอัปโหลดวิดีโอและได้รับเสียงประกอบที่สอดคล้องกับการเคลื่อนไหว การจัดเวลา และเหตุการณ์บนหน้าจอภายในไม่กี่วินาที
แนวทางนี้มีความเกี่ยวข้องโดยเฉพาะในสภาพแวดล้อมที่มีการเปลี่ยนแปลงอย่างต่อเนื่อง วิดีโอที่สร้างโดย AI ฟีดโซเชียลที่ปรับเปลี่ยนได้ และเกมวิดีโอร่วมสมัยล้วนได้รับประโยชน์จากเสียงที่สามารถปรับเปลี่ยนได้ตามเวลาจริง ระบบของ Mirelo สร้างเสียงเร็วกว่าเวลาจริง ทำให้สามารถรองรับประสบการณ์ที่เปลี่ยนแปลงได้ตลอดเวลา
นักดนตรีอยู่ที่แกนกลางของเทคโนโลยี
หนึ่งในลักษณะที่กำหนด Mirelo คือทีมผู้ก่อตั้ง CEO CJ Simon-Gabriel และ CTO Florian Wenzel ทั้งคู่เป็นนักดนตรีที่มีความสามารถ以及นักวิจัย AI ที่มีประสบการณ์ Simon-Gabriel ได้รับ PhD ในการเรียนรู้ของเครื่องและผลกระทบสาเหตุจาก Max Planck Institute และทำการฝึกงานหลังปริญญาเอกที่ ETH Zurich Wenzel ได้รับ PhD ในการเรียนรู้ลึกจาก Humboldt University และ曾ทำงานเป็นนักวิจัยที่ Google Brain
ดนตรีเป็นเส้นทางที่สัมพันธ์กันตลอดชีวิตของทั้งสองคน Simon-Gabriel ได้รับการฝึกฝนเปียโน ออร์แกน และการประพันธ์เพลง และได้พูดถึงการตาม đuổiอาชีพนักดนตรี Wenzel ยังคงเล่นกีตาร์ไฟฟ้าและผลิตเพลงอิเล็กทรอนิกส์เป็นส่วนหนึ่งของวงดนตรีในเบอร์ลิน
สิ่งที่จะเกิดขึ้นต่อไปสำหรับเสียงที่สร้างโดย AI
ความตั้งใจในระยะยาวของ Mirelo ขยายออกไปไกลเกินกว่าการทำให้กระบวนการทำงานอัตโนมัติ บริษัทมองเห็นเทคโนโลยีของตนเองเป็นวิธีการในการลบความไม่สอดคล้องกันจากงานสร้างสรรค์ โดยจัดการกับงานเช่นการซิงค์โรไนซ์ และการกำหนดเวลา เพื่อให้ศิลปินและนักออกแบบเสียงสามารถมุ่งเน้นไปที่การแสดงออกและเล่าเรื่องราว
เมื่อเนื้อหาทางภาพกลายเป็นส่วนตัวและโต้ตอบมากขึ้น เสียงจะต้องพัฒนาไปพร้อมกัน เกมที่ปรับเปลี่ยนตามพฤติกรรมของผู้เล่น วิดีโอที่สร้างขึ้นตามคำขอ และสภาพแวดล้อมเสมือนจริงที่มีเอกลักษณ์เฉพาะตัวล้วนต้องการเสียงที่สามารถตอบสนองได้ตามเวลาจริงมากกว่าการกำหนดไว้ล่วงหน้า
เมื่อมองไปข้างหน้า เทคโนโลยีเช่น Mirelo อาจเปลี่ยนแปลงวิธีการสร้าง เสียงที่ถูกแบ่งปัน และประสบการณ์เสียง แทนที่จะเป็นเสียงพื้นหลังที่คงที่ เสียงอาจกลายเป็นส่วนประกอบที่มีชีวิตของสื่อทางภาพที่สร้างขึ้นตามเวลาจริงเพื่อให้ตรงกับบริบท อารมณ์ และความตั้งใจ ในอนาคต เสียงจะไม่ใช่เรื่องที่ถูกมองข้าม แต่เป็นชั้นที่ถูกถักทอเข้ากับวิธีการเล่าเรื่องราวทั่วทั้งวิดีโอ เกมส์ ภาพยนตร์ และโลกดิจิทัลที่กำลังเกิดขึ้น












