اتصل بنا للحصول على مزيد من المعلومات

شركة ميريلو تجمع 41 مليون دولار في جولة تمويل أولية لإدخال الصوت المُولّد بالذكاء الاصطناعي إلى الفيديو والألعاب وما وراء ذلك

التمويل:

شركة ميريلو تجمع 41 مليون دولار في جولة تمويل أولية لإدخال الصوت المُولّد بالذكاء الاصطناعي إلى الفيديو والألعاب وما وراء ذلك

mm
المؤسسان المشاركان لشركة ميريلو: فلوريان وينزل (المدير التقني) وسي جيه سيمون-غابرييل (الرئيس التنفيذي)

مقرها برلين ميريلو جمعت الشركة 41 مليون دولار أمريكي في جولة تمويل أولية، وذلك بهدف حل إحدى أكثر المشكلات استمراراً في مجال الوسائط التوليدية: الصوت. وقد شارك في قيادة جولة التمويل كل من: مؤشر فنتشرز و أندرسن هورويتز، بمشاركة من Atlantic.vc و شركة تريبل بوينت كابيتال، مما يؤكد ثقة المستثمرين المتزايدة بأن الصوت هو الأفق الرئيسي التالي للإبداع المدعوم بالذكاء الاصطناعي.

بينما أحدث الذكاء الاصطناعي تحولاً جذرياً في كيفية إنتاج النصوص والصور والفيديوهات، إلا أن الصوت لا يزال متأخراً. فالموسيقى والمؤثرات الصوتية والأصوات المحيطة لا تزال تتطلب جهداً كبيراً، وغالباً ما تُضاف في مراحل متأخرة من العملية الإبداعية، على الرغم من تأثيرها الكبير على كيفية استقبال المحتوى. يطمح مشروع ميريلو إلى تغيير هذا الواقع من خلال جعل إنتاج صوت عالي الجودة وذو صدى عاطفي سهلاً كسهولة إنتاج العناصر المرئية.

لماذا تم إهمال الصوت؟

يتمتع الصوت بقدرة فريدة على تشكيل المشاعر والتوتر والأجواء. الفيديو الصامت، مهما كان مذهلاً بصرياً، نادراً ما يبدو مكتملاً. ومع ذلك، بالنسبة لمعظم المبدعين، لا تزال إضافة الصوت تعني البحث في مكتبات الصوت الجاهزة، ومحاذاة المؤثرات الصوتية يدوياً، والتجربة والتعديل على الجداول الزمنية حتى يصبح كل شيء مثالياً.

أصبح هذا التباين أكثر وضوحًا مع تسارع وتيرة إنتاج الفيديو. فالمؤثرات البصرية المولدة بالذكاء الاصطناعي، والمحتوى الاجتماعي القصير، وبيئات الألعاب التفاعلية، كلها تتطور بوتيرة أسرع من قدرة عمليات معالجة الصوت التقليدية على استيعابها. والنتيجة هي فجوة متزايدة بين ما يتخيله المبدعون بصريًا وما يمكنهم تنفيذه صوتيًا على أرض الواقع.

لم يرَ مؤسسو شركة ميريلو هذه الفجوة على أنها قيد على الإبداع، بل على أنها قيد على الأدوات.

بناء نماذج أساسية للصوت

تأسست شركة ميريلو عام ٢٠٢٣، وطورت نماذجها الأساسية الخاصة المصممة خصيصًا للصوت في الفيديو. وبدلًا من إعادة استخدام نماذج لغوية ضخمة أو أنظمة تعتمد على الصور، ركزت الشركة على الصوت من الصفر. يمكن للمستخدم تحميل فيديو، وفي غضون ثوانٍ، يتلقى مؤثرات صوتية متزامنة تتفاعل مع الحركة والتوقيت والأحداث الظاهرة على الشاشة.

يُعدّ هذا النهج ذا أهمية خاصة في البيئات التي تتسم بديناميكية المحتوى. فمقاطع الفيديو المُولّدة بالذكاء الاصطناعي، وموجزات التواصل الاجتماعي المُخصصة، وألعاب الفيديو الحديثة، جميعها تستفيد من الصوت القادر على التكيف في الوقت الفعلي. يُولّد نظام ميريلو الصوت بسرعة تفوق سرعة الوقت الفعلي، مما يسمح له بمواكبة التجارب التي تتغير باستمرار.

أصدرت الشركة مؤخرًا Mirelo SFX v1.5، وهو نموذج لتحويل الفيديو إلى مؤثرات صوتية، متاح عبر واجهة برمجة التطبيقات (API) وتطبيق الويب Mirelo Studio. ووفقًا للشركة، تتميز نماذجها بخفتها، إذ تتطلب موارد حاسوبية أقل بكثير من نماذج اللغات الكبيرة التقليدية، مع تقديم جودة صوتية تنافسية أو حتى فائقة في التقييمات الخارجية.

الموسيقيون في صميم التكنولوجيا

من أبرز سمات شركة ميريلو فريقها المؤسس. الرئيس التنفيذي سي جيه سيمون-غابرييل و CTO فلوريان وينزل كلاهما موسيقيان بارعان وباحثان مخضرمان في مجال الذكاء الاصطناعي. يحمل سيمون-غابرييل شهادة دكتوراه في التعلم الآلي والاستدلال السببي من معهد ماكس بلانك، وأكمل زمالة ما بعد الدكتوراه في المعهد الفدرالي السويسري للتكنولوجيا في زيورخ. أما وينزل، فقد حصل على شهادة الدكتوراه في التعلم العميق من جامعة هومبولت، وعمل سابقًا باحثًا في جوجل برين.

لطالما شكّلت الموسيقى خيطًا متوازيًا في حياة كليهما. تدرب سيمون-غابرييل على البيانو والأورغ والتأليف الموسيقي، وتحدث بصراحة عن رغبته في احتراف الموسيقى. أما وينزل، فيواصل العزف على الغيتار الكهربائي وإنتاج الموسيقى الإلكترونية ضمن فرقة موسيقية مقرها برلين.

لقد شكّلت هذه الخلفية المزدوجة ثقافة شركة ميريلو وتوجهها التقني. فبدلاً من التعامل مع الصوت كمنتج ثانوي، يتعامل الفريق معه كوسيلة إبداعية أساسية، حيث يجب أن تتعايش الدقة الرياضية والفروق الدقيقة التعبيرية.

ما هو التالي بالنسبة للصوت المُولّد بالذكاء الاصطناعي

يتجاوز طموح شركة ميريلو على المدى البعيد مجرد الأتمتة البسيطة. إذ ترى الشركة في تقنيتها وسيلةً لإزالة العقبات من العمل الإبداعي، من خلال تولي مهام مثل المزامنة والتوقيت، حتى يتمكن الفنانون ومصممو الصوت من التركيز على التعبير وسرد القصص.

مع ازدياد تخصيص المحتوى المرئي وتفاعليته، سيحتاج الصوت إلى التطور بالتوازي معه. فالألعاب التي تتكيف مع سلوك اللاعب، والفيديوهات التي تُنشأ عند الطلب، والبيئات الافتراضية الغامرة، كلها تتطلب صوتاً يستجيب ديناميكياً بدلاً من أن يكون ثابتاً مسبقاً.

وبالنظر إلى المستقبل، فإن التقنيات مثل ميريلو قد يُعيد هذا تعريف كيفية إنشاء الصوت ومشاركته وتجربته. فبدلاً من المقاطع الصوتية الثابتة، قد يصبح الصوت عنصرًا حيويًا في الوسائط المرئية، يُولّد في الوقت الفعلي ليتناسب مع السياق والعاطفة والهدف. في ذلك المستقبل، لن يكون الصوت مجرد إضافة ثانوية، بل طبقة أساسية تُنسج مباشرةً في كيفية سرد القصص عبر الفيديو والألعاب والأفلام والعوالم الرقمية الناشئة.

أنطوان هو قائد صاحب رؤية وشريك مؤسس لشركة Unite.AI، مدفوعًا بشغف لا يتزعزع لتشكيل وتعزيز مستقبل الذكاء الاصطناعي والروبوتات. وهو رجل أعمال متسلسل، ويعتقد أن الذكاء الاصطناعي سيكون له نفس التأثير على المجتمع مثل الكهرباء، وغالبًا ما يتم ضبطه وهو يهذي عن إمكانات التقنيات المبتكرة والذكاء الاصطناعي العام.

ك المستقبليوهو مكرس لاستكشاف كيف ستشكل هذه الابتكارات عالمنا. بالإضافة إلى ذلك، فهو مؤسس Securities.io، وهي منصة تركز على الاستثمار في التقنيات المتطورة التي تعمل على إعادة تعريف المستقبل وإعادة تشكيل قطاعات بأكملها.