рдлрдВрдбрд┐рдВрдЧ

рдорд┐рд░реЗрд▓реЛ рдиреЗ рд╡реАрдбрд┐рдпреЛ, рдЧреЗрдореНрд╕ рдФрд░ рдЙрд╕рд╕реЗ рдкрд░реЗ рдХреЗ рд▓рд┐рдП рдПрдЖрдИ-рдЬрдирд░реЗрдЯреЗрдб рд╕рд╛рдЙрдВрдб рд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП $41 рдорд┐рд▓рд┐рдпрди рд╕реАрдб рд░рд╛рдЙрдВрдб рдЬреБрдЯрд╛рдпрд╛ рд╣реИ

mm

बर्लिन स्थित मिरेलो ने एक $41 मिलियन सीड राउंड जुटाया है क्योंकि यह जनरेटिव मीडिया में सबसे लगातार अंधे धब्बों में से एक को हल करने के लिए निकला है: ध्वनि। फंडिंग इंडेक्स वेंचर्स और एंड्रीसेन होरोविट्ज़ द्वारा संयुक्त रूप से नेतृत्व किया गया था, जिसमें अटलांटिक.वीसी और ट्रिपलपॉइंट कैपिटल ने भाग लिया था, जो यह दर्शाता है कि ऑडियो एआई-संचालित रचनात्मकता के लिए अगला बड़ा मोर्चा है।

जबकि कृत्रिम बुद्धिमत्ता ने तेजी से पाठ, छवियों और वीडियो के उत्पादन को बदल दिया है, ऑडियो पीछे रह गया है। संगीत, ध्वनि प्रभाव और परिवेशी ध्वनि श्रम-सघन बनी हुई हैं, अक्सर रचनात्मक प्रक्रिया के अंत में जोड़ी जाती हैं,尽管 उनका सामग्री की धारणा पर असमान प्रभाव पड़ता है। मिरेलो का उद्देश्य इसे बदलना है और उच्च गुणवत्ता वाली, भावनात्मक रूप से प्रतिध्वनित ध्वनि को उत्पन्न करना उतना ही आसान बनाना है जितना कि दृश्य।

ध्वनि को क्यों पीछे छोड़ दिया गया है

ध्वनि की एक अनोखी क्षमता है जो भावना, तनाव और वातावरण को आकार देती है। एक मूक वीडियो, चाहे वह कितना भी दृश्य रूप से प्रभावशाली क्यों न हो, शायद ही कभी पूरा लगता है। फिर भी, अधिकांश निर्माताओं के लिए, ऑडियो जोड़ने का अभी भी अर्थ है स्टॉक लाइब्रेरी के माध्यम से खोज करना, ध्वनि प्रभावों को मैन्युअल रूप से संरेखित करना और समयरेखा के माध्यम से पुनरावृत्ति करना जब तक कि सब कुछ सही महसूस न हो।

यह असंगति वीडियो निर्माण के त्वरण के साथ और अधिक स्पष्ट हो गई है। एआई-जनरेटेड दृश्य, शॉर्ट-फॉर्म सोशल सामग्री और अनुकूली गेम वातावरण सभी पारंपरिक ऑडियो कार्य प्रवाह से तेजी से आगे निकल जाते हैं। परिणाम यह है कि निर्माता जो दृश्य रूप से कल्पना कर सकते हैं और जो वे वास्तव में निष्पादित कर सकते हैं उसके बीच एक बढ़ती खाई है।

मिरेलो के संस्थापकों ने इस अंतर को रचनात्मकता की सीमा के रूप में नहीं, बल्कि टूलिंग की सीमा के रूप में देखा।

ऑडियो के लिए फाउंडेशन मॉडल बनाना

2023 में स्थापित, मिरेलो ने वीडियो में ध्वनि के लिए विशेष रूप से डिज़ाइन किए गए अपने फाउंडेशन मॉडल विकसित किए हैं। बड़े भाषा मॉडल या छवि-आधारित प्रणालियों को पुन: उपयोग करने के बजाय, कंपनी ने शुरू से ही ऑडियो पर ध्यान केंद्रित किया। एक उपयोगकर्ता एक वीडियो अपलोड कर सकता है और कुछ सेकंड के भीतर, गति, समय और ऑन-स्क्रीन घटनाओं के अनुरूप सिंक्रनाइज़ ध्वनि प्रभाव प्राप्त कर सकता है।

यह दृष्टिकोण गतिशील सामग्री वाले वातावरण में विशेष रूप से प्रासंगिक है। एआई-जनरेटेड वीडियो, व्यक्तिगत सोशल फीड और आधुनिक वीडियो गेम सभी वास्तविक समय में अनुकूलन करने में सक्षम ऑडियो से लाभान्वित होते हैं। मिरेलो की प्रणाली वास्तविक समय से तेजी से ध्वनि उत्पन्न करती है, जिससे यह बदलते अनुभवों के साथ तालमेल बिठा सकती है।

कंपनी ने हाल ही में मिरेलो एसएफएक्स वी1.5 जारी किया है, एक वीडियो-टू-साउंड-इफेक्ट मॉडल जो अपने स्व-सेवा एपीआई और वेब एप्लिकेशन, मिरेलो स्टूडियो के माध्यम से उपलब्ध है। कंपनी के अनुसार, इसके मॉडल हल्के हैं, जो टाइपिकल बड़े भाषा मॉडल की तुलना में काफी कम कंप्यूटे की आवश्यकता होती है, जबकि बाहरी मूल्यांकन में प्रतिस्पर्धी या उत्कृष्ट ऑडियो गुणवत्ता प्रदान करते हैं।

प्रौद्योगिकी के मूल में संगीतकार

मिरेलो की एक परिभाषित विशेषता इसकी संस्थापक टीम है। सीईओ सीजे साइमन-गेब्रियल और सीटीओ फ्लोरियन वेंजेल दोनों ही प्रतिष्ठित संगीतकार हैं और अनुभवी एआई शोधकर्ता हैं। साइमन-गेब्रियल के पास मैक्स प्लैंक इंस्टीट्यूट से मशीन लर्निंग और कारण संबंध में पीएचडी है और उन्होंने ईटीएच ज्यूरिख में एक पोस्टडॉक्टरल फेलोशिप पूरी की। वेंजेल ने हुम्बोल्ट विश्वविद्यालय से गहरे शिक्षण में पीएचडी की और पहले गूगल ब्रेन में एक शोधकर्ता के रूप में काम किया था।

संगीत दोनों के जीवन में एक निरंतर साथी धागा रहा है। साइमन-गेब्रियल ने पियानो, ऑर्गन और संरचना में प्रशिक्षण लिया और उन्होंने खुलकर बताया है कि उन्होंने लगभग पेशेवर रूप से संगीत का पीछा किया। वेंजेल अभी भी एक बर्लिन स्थित बैंड के हिस्से के रूप में इलेक्ट्रिक गिटार बजाते हैं और इलेक्ट्रॉनिक संगीत का निर्माण करते हैं।

दोनों की इस दोहरी पृष्ठभूमि ने मिरेलो की संस्कृति और तकनीकी दिशा को आकार दिया है। ध्वनि को एक माध्यम के रूप में नहीं बल्कि एक प्राथमिक रचनात्मक माध्यम के रूप में देखते हुए, जहां गणितीय सटीकता और अभिव्यंजक सूक्ष्मता को सह-अस्तित्व में रहना चाहिए।

एआई-जनरेटेड साउंड के लिए आगे क्या है

मिरेलो का दीर्घकालिक उद्देश्य सरल स्वचालन से बहुत आगे तक जाता है। कंपनी अपनी प्रौद्योगिकी को रचनात्मक कार्य से घर्षण को दूर करने के तरीके के रूप में देखती है, जैसे कि सिंक्रनाइजेशन और समय जैसे कार्यों को संभालना, ताकि कलाकार और साउंड डिज़ाइनर अभिव्यंजकता और कथा पर ध्यान केंद्रित कर सकें।

जैसे-जैसे दृश्य सामग्री अधिक व्यक्तिगत और इंटरैक्टिव होती जा रही है, ऑडियो को इसके साथ विकसित होने की आवश्यकता है। खिलाड़ी के व्यवहार के अनुसार अनुकूल गेम, मांग पर उत्पन्न वीडियो और इमर्सिव वर्चुअल वातावरण सभी को ऐसी ध्वनि की आवश्यकता होती है जो पहले से तय की गई नहीं है, बल्कि गतिशील रूप से प्रतिक्रिया कर सकती है।

आगे देखते हुए, मिरेलो जैसी प्रौद्योगिकियां ध्वनि के निर्माण, साझा करने और अनुभव करने के तरीके को पुनः परिभाषित कर सकती हैं। स्थिर साउंडट्रैक के बजाय, ऑडियो दृश्य मीडिया का एक जीवंत घटक बन सकता है, जो संदर्भ, भावना और इरादे से मेल खाने के लिए वास्तविक समय में उत्पन्न होता है। उस भविष्य में, ध्वनि अब एक उपेक्षित विचार नहीं है, बल्कि दृश्य, गेमिंग, फिल्म और उभरते डिजिटल दुनिया में कहानियों को सुनाने के तरीके में एक अभिन्न परत है।

рдПрдВрдЯреЛрдиреА рдПрдХ рджреВрд░рджрд░реНрд╢реА рдиреЗрддрд╛ рдФрд░ Unite.AI рдХреЗ рд╕рдВрд╕реНрдерд╛рдкрдХ рднрд╛рдЧреАрджрд╛рд░ рд╣реИрдВ, рдЬреЛ рдХрд┐ рдПрдЖрдИ рдФрд░ рд░реЛрдмреЛрдЯрд┐рдХреНрд╕ рдХреЗ рднрд╡рд┐рд╖реНрдп рдХреЛ рдЖрдХрд╛рд░ рджреЗрдиреЗ рдФрд░ рдмрдврд╝рд╛рд╡рд╛ рджреЗрдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдЕрдЯреВрдЯ рдЬреБрдиреВрди рд╕реЗ рдкреНрд░реЗрд░рд┐рдд рд╣реИрдВред рдПрдХ рд╢реНрд░реГрдВрдЦрд▓рд╛ рдЙрджреНрдпрдореА, рд╡рд╣ рдорд╛рдирддрд╛ рд╣реИ рдХрд┐ рдПрдЖрдИ рд╕рдорд╛рдЬ рдХреЗ рд▓рд┐рдП рдЙрддрдирд╛ рд╣реА рд╡рд┐рдШрдЯрдирдХрд╛рд░реА рд╣реЛрдЧрд╛ рдЬрд┐рддрдирд╛ рдХрд┐ рдмрд┐рдЬрд▓реА, рдФрд░ рдЕрдХреНрд╕рд░ рд╡рд┐рдШрдЯрдирдХрд╛рд░реА рдкреНрд░реМрджреНрдпреЛрдЧрд┐рдХрд┐рдпреЛрдВ рдФрд░ рдПрдЬреАрдЖрдИ рдХреА рд╕рдВрднрд╛рд╡рдирд╛ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдЙрддреНрд╕рд╛рд╣рд┐рдд рд╣реЛрддрд╛ рд╣реИред

рдПрдХ рдлреНрдпреВрдЪрд░рд┐рд╕реНрдЯ рдХреЗ рд░реВрдк рдореЗрдВ, рд╡рд╣ рдЗрди рдирд╡рд╛рдЪрд╛рд░реЛрдВ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рд╣рдорд╛рд░реА рджреБрдирд┐рдпрд╛ рдХреЛ рдЖрдХрд╛рд░ рджреЗрдиреЗ рдХреА рдЦреЛрдЬ рдореЗрдВ рд╕рдорд░реНрдкрд┐рдд рд╣реИред рдЗрд╕рдХреЗ рдЕрд▓рд╛рд╡рд╛, рд╡рд╣ рд╕рд┐рдХреНрдпреЛрд░рд┐рдЯреАрдЬрд╝.io рдХреЗ рд╕рдВрд╕реНрдерд╛рдкрдХ рд╣реИрдВ, рдПрдХ рдордВрдЪ рдЬреЛ рднрд╡рд┐рд╖реНрдп рдХреЛ рдлрд┐рд░ рд╕реЗ рдкрд░рд┐рднрд╛рд╖рд┐рдд рдХрд░рдиреЗ рдФрд░ рдкреВрд░реЗ рдХреНрд╖реЗрддреНрд░реЛрдВ рдХреЛ рдлрд┐рд░ рд╕реЗ рдЖрдХрд╛рд░ рджреЗрдиреЗ рд╡рд╛рд▓реА рдЕрддреНрдпрд╛рдзреБрдирд┐рдХ рдкреНрд░реМрджреНрдпреЛрдЧрд┐рдХрд┐рдпреЛрдВ рдореЗрдВ рдирд┐рд╡реЗрд╢ рдкрд░ рдХреЗрдВрджреНрд░рд┐рдд рд╣реИред