Connect with us

рд╢реЛрдзрдХрд░реНрддрд╛ ‘рдСрдбрд┐рдпреЛ’ рдПрдЖрдИ рд╡рд┐рдХрд╕рд┐рдд рдХрд░рддреЗ рд╣реИрдВ рдЬреЛ рдкрд┐рдпрд╛рдиреЛ рдмрдЬрд╛ рд╕рдХрддрд╛ рд╣реИ

рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛

рд╢реЛрдзрдХрд░реНрддрд╛ ‘рдСрдбрд┐рдпреЛ’ рдПрдЖрдИ рд╡рд┐рдХрд╕рд┐рдд рдХрд░рддреЗ рд╣реИрдВ рдЬреЛ рдкрд┐рдпрд╛рдиреЛ рдмрдЬрд╛ рд╕рдХрддрд╛ рд╣реИ

mm

वाशिंगटन विश्वविद्यालय में शोधकर्ताओं की एक टीम ने ऑडियो नामक एक कृत्रिम बुद्धिमत्ता (एआई) प्रणाली विकसित की है जो मौन पियानो प्रदर्शन से ऑडियो बना सकती है। परीक्षण चरण में साउंडहाउंड जैसे संगीत पहचान ऐप्स शामिल थे, जो ऑडियो से संगीत को लगभग 86% समय तक सही ढंग से पहचान सकते थे।

यह शोध 8 दिसंबर को न्यूरलपीएस 2020 सम्मेलन में प्रस्तुत किया गया था।

वरिष्ठ लेखक एली श्लिज़रमैन विश्वविद्यालय में अनुप्रयुक्त गणित और विद्युत और कंप्यूटर इंजीनियरिंग विभागों में एक सहायक प्रोफेसर हैं।

“एक संगीत प्रदर्शन में बजाए जाने वाले संगीत जैसा संगीत बनाना पहले असंभव माना जाता था,” श्लिज़रमैन ने कहा। “एक एल्गोरिदम को उन संकेतों या ‘विशेषताओं’ का पता लगाने की आवश्यकता है जो वीडियो फ्रेम में संगीत के साथ संबंधित हैं, और इसे वीडियो फ्रेम के बीच होने वाली ध्वनि की कल्पना करने की आवश्यकता है। इसके लिए एक ऐसी प्रणाली की आवश्यकता है जो सटीक और कल्पनाशील दोनों हो। यह तथ्य कि हमने जो संगीत बनाया वह काफी अच्छा लगा, यह एक आश्चर्य था। “

ऑडियो कैसे काम करता है

ऑडियो प्रणाली एक वीडियो को डिकोड करके और इसे संगीत में अनुवाद करके काम करती है। कई चरणों में से पहला वीडियो फ्रेम में दबाए गए कुंजियों का पता लगाने के लिए एआई के लिए है, और यह अंततः एक आरेख विकसित करता है। आरेख को तब अनुवादित किया जाता है ताकि एक संगीत सिंथेसाइज़र ध्वनियों को पहचान सके।

अगला चरण डेटा को साफ करना और अतिरिक्त जानकारी जोड़ना है। यह जानकारी प्रत्येक कुंजी दबाव और इसकी अवधि जैसी चीजों को शामिल कर सकती है।

“यदि हम केवल पहले चरण से संगीत को सिंथेसाइज़ करने का प्रयास करते हैं, तो हम पाएंगे कि संगीत की गुणवत्ता संतोषजनक नहीं है,” श्लिज़रमैन ने कहा। “दूसरा चरण एक शिक्षक की तरह है जो एक छात्र संगीतकार के संगीत पर जाने में मदद करता है और इसे बढ़ाता है।”

प्रणाली को यूट्यूब वीडियो के साथ प्रशिक्षित और परीक्षण किया गया था, जिसमें पियानोवादक पॉल बार्टन ने विभिन्न शास्त्रीय संगीतकारों जैसे मोजार्ट को बजाया था। ऑडियो को 19,000 फ्रेम के साथ परीक्षण किया गया था जिसमें बार्टन विभिन्न संगीत बजा रहे थे।

सिंथेसाइज़र

प्रशिक्षित होने के बाद, ऑडियो संगीत का एक प्रतिलेख उत्पन्न करता है, जिसे तब एक सिंथेसाइज़र को ध्वनि में अनुवादित करने के लिए खिलाया जाता है। संगीत प्रत्येक सिंथेसाइज़र के साथ अलग लगता है, जो एक इलेक्ट्रिक कीबोर्ड पर इंस्ट्रूमेंट सेटिंग बदलने के समान है।

टीम ने दो अलग-अलग सिंथेसाइज़र का उपयोग किया।

“फ्लूइडसिंथ मैकेनिकल-साउंडिंग पियानो साउंड बनाता है जिसे हम जानते हैं। वे थोड़े यांत्रिक लगते हैं लेकिन काफी सटीक हैं,” श्लिज़रमैन ने कहा। “हमने पर्फनेट का भी उपयोग किया, जो एक नया एआई सिंथेसाइज़र है जो समृद्ध और अधिक अभिव्यंजक संगीत बनाता है। लेकिन यह अधिक शोर भी उत्पन्न करता है। “

“इस अध्ययन का उद्देश्य यह देखना था कि क्या कृत्रिम बुद्धिमत्ता एक वीडियो रिकॉर्डिंग में एक पियानोवादक द्वारा बजाए गए संगीत का उत्पादन कर सकती है – हालांकि हम पॉल बार्टन की नकल करने का लक्ष्य नहीं रख रहे थे क्योंकि वह इतने महान हैं,” श्लिज़रमैन ने जारी रखा। “हमें आशा है कि हमारा अध्ययन संगीत के साथ बातचीत करने के नए तरीकों को सक्षम बनाता है। उदाहरण के लिए, एक भविष्य का अनुप्रयोग यह है कि ऑडियो को एक आभासी पियानो में विस्तारित किया जा सकता है जिसमें केवल एक व्यक्ति के हाथों को रिकॉर्ड करने वाला कैमरा है। इसके अलावा, एक वास्तविक पियानो पर एक कैमरा रखने से ऑडियो छात्रों को सिखाने के नए तरीकों में मदद कर सकता है। “

कुंग सू और ज़ीलोंग लियू, इलेक्ट्रिकल और कंप्यूटर इंजीनियरिंग में डॉक्टरेट छात्र, कागज़ के सह-लेखक थे।

рдПрд▓реЗрдХреНрд╕ рдореИрдХрдлрд╛рд░рд▓реИрдВрдб рдПрдХ рдПрдЖрдИ рдкрддреНрд░рдХрд╛рд░ рдФрд░ рд▓реЗрдЦрдХ рд╣реИрдВ рдЬреЛ рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛ рдореЗрдВ рдирд╡реАрдирддрдо рд╡рд┐рдХрд╛рд╕реЛрдВ рдХрд╛ рдЕрдиреНрд╡реЗрд╖рдг рдХрд░ рд░рд╣реЗ рд╣реИрдВред рдЙрдиреНрд╣реЛрдВрдиреЗ рд╡рд┐рд╢реНрд╡рднрд░ рдХреЗ рдХрдИ рдПрдЖрдИ рд╕реНрдЯрд╛рд░реНрдЯрдЕрдкреНрд╕ рдФрд░ рдкреНрд░рдХрд╛рд╢рдиреЛрдВ рдХреЗ рд╕рд╛рде рд╕рд╣рдпреЛрдЧ рдХрд┐рдпрд╛ рд╣реИред