рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛
рд╕рдВрдЧреАрдд рдореЗрдВ рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдЕрдзрд┐рдХ рд╕реЗ рдЕрдзрд┐рдХ рдкрд░рд┐рд╖реНрдХреГрдд рд╣реЛрддрд╛ рдЬрд╛ рд░рд╣рд╛ рд╣реИ

संगीत में कृत्रिम बुद्धिमत्ता का अनुप्रयोग पिछले कुछ वर्षों से बढ़ रहा है। जैसा कि कुम्बा सेनार बताते हैं, संगीत उद्योग में कृत्रिम बुद्धिमत्ता के वर्तमान तीन अनुप्रयोग संगीत संरचना, संगीत स्ट्रीमिंग और संगीत मुद्रीकरण में हैं, जहां कृत्रिम बुद्धिमत्ता प्लेटफ़ॉर्म उपयोगकर्ता गतिविधि के आंकड़ों के आधार पर कलाकारों को उनकी संगीत सामग्री को मुद्रीकृत करने में मदद कर रहे हैं।
यह सब 1957 में शुरू हुआ जब लर्न हिलर और लियोनार्ड इसाक्सन ने इलियाक I को “इलियाक सूट फॉर स्ट्रिंग क्वार्टेट” बनाने के लिए प्रोग्राम किया, जो पूरी तरह से कृत्रिम बुद्धिमत्ता द्वारा लिखा गया पहला काम था, फिर 60 वर्ष बाद, यह पूरे एल्बम जैसे टेरिन साउथर्न एल्बम में बदल गया, जो 2017 में अम्पर म्यूज़िक द्वारा निर्मित था। वर्तमान में, साउथर्न के यूट्यूब पर 452 हज़ार से अधिक ग्राहक हैं और एल्बम का एक गीत “लवसिक” 45,000 से अधिक दर्शकों द्वारा सुना और देखा गया है।
लेकिन तब से, संगीत के क्षेत्र में कृत्रिम बुद्धिमत्ता का अनुप्रयोग अधिक परिष्कृत और व्यापक हो गया है। ओपन एआई ने म्यूज़नेट बनाया है, जैसा कि कंपनी बताती है, “एक गहरा न्यूरल नेटवर्क जो 4 मिनट की संगीत संरचना 10 विभिन्न वाद्यों के साथ उत्पन्न कर सकता है और देश से मोज़ार्ट से बीटल्स तक की शैलियों को मिला सकता है। म्यूज़नेट को विशेष रूप से हमारी संगीत समझ के साथ प्रोग्राम नहीं किया गया था, बल्कि यह सैकड़ों हज़ारों मिडी फ़ाइलों में अगले टोकन की भविष्यवाणी करने से सामंजस्य, लय और शैली के पैटर्न का पता लगाने के लिए सीखा। म्यूज़नेट जीपीटी-2 के समान सामान्य-उद्देश्य वाली अनपर्यवेक्षित प्रौद्योगिकी का उपयोग करता है, एक बड़े पैमाने पर ट्रांसफ़ॉर्मर मॉडल जो ऑडियो या पाठ के अनुक्रम में अगले टोकन की भविष्यवाणी करने के लिए प्रशिक्षित है।”
दूसरी ओर, जैसा कि जीकवायर बताता है, डॉ मिक ग्रियरसन, गोल्डस्मिथ्स, लंदन विश्वविद्यालय से कंप्यूटर वैज्ञानिक और संगीतकार को हाल ही में इतालवी कार निर्माता फ़िएट द्वारा एल्गोरिदम का उपयोग करके 50 सबसे प्रतिष्ठित पॉप गीतों की सूची तैयार करने के लिए कमीशन किया गया था। उनके विश्लेषणात्मक सॉफ़्टवेयर का उपयोग “गीतों को विशिष्ट बनाने वाले कारकों का निर्धारण करने के लिए किया गया था, जिसमें कुंजी, प्रति मिनट बीट की संख्या, कॉर्ड विविधता, गीतात्मक सामग्री, टिम्ब्रल विविधता और सोनिक विचलन शामिल हैं।”
उनके परिणामों के अनुसार, जिस गीत में इनमें से सबसे अच्छा मिश्रण था, वह निर्वाना का “स्मेल्स लाइक टीन स्पिरिट” था, जो यू2 के “वन” और जॉन लेनन के “इमेजिन” से आगे था। निर्वाना के गीत का उपयोग फ़िएट ने अपने नए फ़िएट 500 मॉडल को बढ़ावा देने के लिए किया था। ग्रियरसन ने बताया कि एल्गोरिदम ने दिखाया कि ‘इन गीतों में उपयोग किए जाने वाले ध्वनि और वे जिस तरह से जुड़े हुए हैं वह प्रत्येक मामले में अत्यधिक अनोखा है।’
एक अन्य अनुप्रयोग म्यूज़िकएनएन लाइब्रेरी द्वारा तैयार किया गया था, जैसा कि बताया गया है, जो गहरे कन्वोल्यूशनल न्यूरल नेटवर्क का उपयोग करके स्वचालित रूप से गीतों को टैग करता है। मॉडल “जो शामिल हैं सर्वोत्तम स्कोर प्राप्त करते हैं सार्वजनिक मूल्यांकन बेंचमार्क में।” संगीत (जैसे संगीतकार) और इसके सर्वश्रेष्ठ मॉडल को ओपन-सोर्स लाइब्रेरी के रूप में जारी किया गया है। परियोजना को म्यूज़िक टेक्नोलॉजी ग्रुप ऑफ़ द यूनिवर्सिटैट पोम्पेउ फ़ाब्रा द्वारा विकसित किया गया है, जो बार्सिलोना, स्पेन में स्थित है।
अनुप्रयोग के अपने विश्लेषण में, जोर्डी पोंस ने म्यूज़िकएनएन का उपयोग क्वीन के “बोहेमियन रैप्सोडी” जैसे एक और प्रतिष्ठित गीत का विश्लेषण और टैग करने के लिए किया। उन्होंने देखा कि फ़्रेडी मर्क्यूरी की गायन आवाज़ को एक महिला आवाज़ के रूप में टैग किया गया था, जबकि इसके अन्य पूर्वानुमान काफी सटीक थे। म्यूज़िकएनएन को ओपन-सोर्स के रूप में उपलब्ध कराने से टैगिंग प्रक्रिया को और अधिक परिष्कृत करना संभव हो जाता है।
संगीत में कृत्रिम बुद्धिमत्ता के उपयोग पर रिपोर्टिंग करते हुए, डिजिटल म्यूज़िक न्यूज़ निष्कर्ष निकालता है कि “कृत्रिम बुद्धिमत्ता और मशीन लर्निंग प्रौद्योगिकियों की शुरुआत ने संगीत सुनने के तरीके में बहुत सुधार किया है। कृत्रिम बुद्धिमत्ता और समान प्रौद्योगिकियों में तेजी से प्रगति के कारण, हम आने वाले वर्षों में संगीत में भविष्य के सुधार को देखने की संभावना है।”












