рд╡рд┐рдЪрд╛рд░ рдиреЗрддрд╛
2023 рдореЗрдВ рд╡реНрдпрд╡рд╕рд╛рдп рдХреЗ рд▓рд┐рдП рдЬреЗрдирд░реЗрдЯрд┐рд╡ рдПрдЖрдИ рд╡реЙрдЗрд╕ рдХрд╛ рдиреИрддрд┐рдХ рд░реВрдк рд╕реЗ рдЙрдкрдпреЛрдЧ рдХреИрд╕реЗ рдХрд░реЗрдВ

2022 के अंत में एआई प्रौद्योगिकियों ने ओपनएआई और चैटजीपीटी की आश्चर्यजनक लोकप्रियता के कारण व्यापक रूप से अपनाया जाना शुरू किया। पहली बार, एआई ने अपनी उपयोगिता और व्यवसायिक परिणामों को बनाने में अपने मूल्य को साबित करके जन-सामान्य में आकर्षण प्राप्त किया।
बहुत सारी एआई प्रौद्योगिकियां जो 2023 में सामान्य लोगों के लिए क्रांति जैसी लगती हैं, वास्तव में कई वर्षों से बड़े व्यवसायों और मीडिया द्वारा सक्रिय रूप से उपयोग की जा रही हैं। मुझे उन समाधानों को शक्ति प्रदान करने वाली प्रौद्योगिकी की जांच करने के लिए शामिल हों – विशेष रूप से, वॉइस क्लोनिंग के लिए जेनरेटिव एआई सिस्टम, इसके व्यवसायिक लाभ, और एआई का उपयोग करने के लिए नैतिक दृष्टिकोण।
वॉइस क्लोनिंग कैसे काम करती है?
संक्षेप में, वॉइस क्लोनिंग एक व्यक्ति को दूसरे व्यक्ति की आवाज में बोलने की अनुमति देती है।
यह जेनरेटिव एआई प्रौद्योगिकी का उपयोग करके एक व्यक्ति की आवाज की रिकॉर्डिंग बनाती है और उसी व्यक्ति की आवाज में नए ऑडियो सामग्री बनाने के लिए उनका उपयोग करती है। यह मूल रूप से लोगों को यह सुनने की अनुमति देता है कि कोई व्यक्ति क्या कहेगा, भले ही उन्होंने खुद ऐसा नहीं कहा हो।
तकनीकी पक्ष से, चीजें बहुत जटिल नहीं लगती हैं। लेकिन अगर आप थोड़ा गहराई से जाते हैं, तो शुरू करने के लिए कुछ न्यूनतम आवश्यकताएं हैं:
- आपको स्रोत आवाज को क्लोन करने के लिए कम से कम 5 मिनट की उच्च गुणवत्ता वाली रिकॉर्ड की गई ऑडियो की आवश्यकता है। ये रिकॉर्डिंग स्पष्ट और पृष्ठभूमि शोर या अन्य विकृतियों से मुक्त होनी चाहिए, क्योंकि किसी भी खामियों का मॉडल के आउटपुट की सटीकता पर प्रभाव पड़ सकता है।
- उसके बाद, इन रिकॉर्डिंग को एक जेनरेटिव एआई मॉडल में फीड करें ताकि एक “वॉइस अवतार” बनाया जा सके।
- फिर, मॉडल को पिच और टाइमिंग में भाषण पैटर्न को सटीक रूप से पुन: उत्पन्न करने के लिए प्रशिक्षित करें।
- एक बार पूरा हो जाने के बाद, यह प्रशिक्षित मॉडल किसी भी अन्य व्यक्ति की स्रोत आवाज का उपयोग करके असीमित सामग्री बनाने में सक्षम हो जाता है, वास्तविक ध्वनि वाली प्रतिकृति आवाज बनाने के लिए एक प्रभावी उपकरण बन जाता है।
यह वह बिंदु है जहां कई लोग नैतिक चिंताएं उठाते हैं। जब हम किसी अन्य व्यक्ति के मुंह में कोई भी पाठ डाल सकते हैं और यह बताना असंभव है कि वे शब्द वास्तविक या नकली हैं?
हां, यह संभावना पहले से ही वास्तविकता बन गई है। जैसा कि ओपनएआई और चैटजीपीटी के मामले में, हम वर्तमान में कई नैतिक मुद्दों का सामना कर रहे हैं जिन्हें नजरअंदाज नहीं किया जा सकता है।
एआई में नैतिक मानक
जैसा कि कई अन्य नए प्रौद्योगिकियों के साथ उनके अपनाये जाने के प्रारंभिक चरण में, मुख्य खतरा प्रौद्योगिकी के आसपास एक नकारात्मक प्रतिष्ठा बनाना है, न कि खतरों को चर्चा और मूल्यवान ज्ञान के स्रोत के रूप में स्वीकार करना। महत्वपूर्ण बात यह है कि बुरे अभिनेताओं द्वारा प्रौद्योगिकी और इसके उत्पादों का दुरुपयोग करने के तरीकों को उजागर करना, कम करने वाले उपकरण लागू करना, और सीखना जारी रखना।
आज हमारे पास जेनरेटिव एआई के उपयोग से संबंधित नैतिक मानकों के लिए तीन परतों के ढांचे हैं। राष्ट्रीय और अंतरराष्ट्रीय नियामक परतें अपने विकास के प्रारंभिक चरण में हैं। नीति दुनिया उभरती प्रौद्योगिकी के विकास की गति के साथ तालमेल नहीं रख सकती है, लेकिन हम पहले से ही यूरोपीय संघ को एआई विनियमन पर यूरोपीय संघ के प्रस्ताव और भ्रामक सूचना पर 2022 के अभ्यास कोड के साथ आगे बढ़ते हुए देख सकते हैं जो बड़े प्रौद्योगिकी कंपनियों से दुर्भाग्यपूर्ण एआई मैनिपुलेटेड सामग्री के प्रसार से निपटने की उम्मीद करता है। राष्ट्रीय स्तर पर, हम देखते हैं कि यूएस और यूके द्वारा इस मुद्दे से निपटने के लिए नियामक पहले कदम, यूएस के नेशनल डीपफेक और डिजिटल प्रोवेनेंस टास्क फोर्स और यूके के ऑनलाइन सुरक्षा बिल के साथ।
प्रौद्योगिकी उद्योग की परत तेजी से आगे बढ़ रही है क्योंकि कंपनियां और प्रौद्योगिकीविद् इस नए वास्तविकता को स्वीकार कर रहे हैं जैसा कि यह उभरती प्रौद्योगिकियों और उनके प्रभाव पर सामाजिक सुरक्षा और गोपनीयता के संबंध में है। जेनरेटिव एआई के नैतिकता पर संवाद जीवंत है और जेनरेटिव एआई के उपयोग के लिए आचार संहिता (जैसे सिंथेटिक मीडिया के लिए पार्टनरशिप ऑन एआई कोड ऑफ कंडक्ट) के आसपास उद्योग पहल के विकास की ओर ले जाता है और विभिन्न कंपनियों द्वारा जारी नैतिक बयान। सवाल यह है कि आचरण को व्यावहारिक बनाने के लिए कैसे? और क्या वे उत्पादों, विशिष्ट विशेषताओं और टीमों की प्रक्रियाओं को प्रभावित करने में सक्षम हैं?
मीडिया और मनोरंजन, साइबर सुरक्षा और एआई नैतिकता समुदायों के साथ इस समस्या पर काम करने के बाद, मैंने एआई सामग्री और विशेष रूप से आवाज के साथ काम करने के लिए कुछ व्यावहारिक सिद्धांतों का गठन किया है:
- आईपी मालिक और जो कंपनी क्लोन्ड आवाज का उपयोग करती है वह मूल आवाज का उपयोग करने से जुड़ी संभावित जटिलताओं से बचने के लिए कानूनी समझौते पर हस्ताक्षर कर सकते हैं।
- परियोजना के मालिक को सुनने वालों को गुमराह न करने के लिए क्लोन्ड आवाज के उपयोग का खुलासा करना चाहिए।
- वॉइस के लिए एआई प्रौद्योगिकी पर काम करने वाली कंपनियों को एआई-जनित सामग्री का पता लगाने और पहचानने में सक्षम प्रौद्योगिकी विकसित करने के लिए संसाधनों का एक प्रतिशत आवंटित करना चाहिए।
- एआई-जनित सामग्री को वॉटरमार्क के साथ लेबल करने से वॉइस प्रमाणीकरण संभव हो जाता है।
- प्रत्येक एआई सेवा प्रदाता को सामाजिक, व्यावसायिक और गोपनीयता स्तर पर परियोजना के प्रभाव की समीक्षा करनी चाहिए trước कि वह इसके लिए काम करने पर सहमत हो।
बिल्कुल, एआई में नैतिकता के सिद्धांत घरेलू डीपफेक्स के ऑनलाइन प्रसार को प्रभावित नहीं करेंगे। हालांकि, वे सार्वजनिक बाजार से ग्रे परियोजनाओं को बाहर कर देंगे।
2021-22 में, एआई आवाजों का उपयोग विभिन्न मुख्यधारा परियोजनाओं में किया गया था जिनमें नैतिकता और समाज के लिए भारी निहितार्थ थे। इनमें मंडलोरियन श्रृंखला के लिए युवा ल्यूक स्काईवॉकर की आवाज की क्लोनिंग, गॉड ऑफ वॉर 2 के लिए एआई वॉइस, और ऐतिहासिक ‘इन इवेंट ऑफ मून डिजास्टर’ के लिए रिचर्ड निक्सन की आवाज शामिल थीं।
प्रौद्योगिकी में विश्वास मीडिया और मनोरंजन से परे बढ़ रहा है। विभिन्न उद्योगों में पारंपरिक व्यवसाय अपनी परियोजनाओं में क्लोन्ड आवाज का उपयोग कर रहे हैं। यहाँ कुछ सबसे प्रमुख उपयोग के मामले हैं:
उद्योग उपयोग के मामले
2023 में, वॉइस क्लोनिंग विभिन्न व्यवसायों के साथ अपनी वृद्धि जारी रखेगी जो इसके कई लाभों का लाभ उठाने के लिए तैयार हैं। स्वास्थ्य सेवा और विपणन से लेकर ग्राहक सेवा और विज्ञापन उद्योग तक, वॉइस क्लोनिंग संगठनों को अपने ग्राहकों के साथ संबंध बनाने और अपने कार्य प्रवाह को सुव्यवस्थित करने के तरीके को क्रांतिकारी बना रही है।
वॉइस क्लोनिंग स्वास्थ्य पेशेवरों और सामाजिक कार्यकर्ताओं को लाभान्वित करती है जो ऑनलाइन वातावरण में काम करते हैं। चिकित्सा पेशेवरों के समान आवाज वाले डिजिटल अवतार रोगियों के साथ मजबूत बंधन बनाते हैं, विश्वास बढ़ाते हैं और ग्राहकों को बनाए रखते हैं।
फिल्म और मनोरंजन उद्योग में सामग्री को कई भाषाओं में डबिंग करने, बच्चों और वयस्कों के अतिरिक्त संवाद प्रतिस्थापन (एडीआर), और अनंत अनुकूलन विकल्पों के लिए वॉइस क्लोनिंग के आवेदन व्यापक हैं।
इसी तरह, ऑपरेशनल क्षेत्र में, एआई-संचालित वॉइस क्लोनिंग इंटरएक्टिव वॉइस रिस्पांस सिस्टम या कॉर्पोरेट प्रशिक्षण वीडियो के लिए लागत-कुशल समाधान की आवश्यकता वाले ब्रांडों के लिए उत्कृष्ट परिणाम प्रदान कर सकती है। वॉइस सिंथेसिस प्रौद्योगिकी के साथ, अभिनेता अपनी पहुंच बढ़ा सकते हैं और रिकॉर्डिंग से रॉयल्टी कमाने की उनकी क्षमता बढ़ा सकते हैं।
अंत में, विज्ञापन उत्पादन स्टूडियो में, वॉइस क्लोनिंग के उद्भव ने व्यावसायिक उत्पादन से जुड़े समय और लागत को काफी कम कर दिया है। जब तक कि क्लोनिंग के लिए उच्च गुणवत्ता वाली रिकॉर्डिंग उपलब्ध हो (यहां तक कि अनुपलब्ध अभिनेताओं से भी), विज्ञापनों का निर्माण तेजी से और पहले से अधिक रचनात्मक तरीके से किया जा सकता है।
दिलचस्प बात यह है कि उद्यम और एसएमबी वॉइस क्लोनिंग का उपयोग करके अपने ब्रांड के लिए कुछ अनोखा बना सकते हैं। बड़ी परियोजनाएं अपने सबसे महत्वाकांक्षी योजनाओं को महसूस कर सकती हैं, जबकि छोटे व्यवसाय पहले से ही लागत-प्रतिबंधित मॉडल तक पहुंच प्राप्त कर सकते हैं। यही सच्चा लोकतंत्रीकरण है।
निष्कर्ष
एआई वॉइस क्लोनिंग व्यवसायों को गेम-चेंजिंग लाभ प्रदान करती है, जैसे कि अद्वितीय ग्राहक अनुभव बनाना, अपने उत्पादों और सेवाओं में प्राकृतिक भाषा प्रसंस्करण क्षमताओं को एकीकृत करना, और पूरी तरह से वास्तविक ध्वनि वाली आवाजों की बारीकियों का अनुकरण करना।
2023 में अपनी प्रतिस्पर्धी बढ़त बनाए रखने के लिए व्यवसायों को एआई वॉइस क्लोनिंग में देखना चाहिए। कंपनियां इस प्रौद्योगिकी का उपयोग करके नए अवसरों की एक श्रृंखला को अनलॉक कर सकती हैं और ग्राहकों को बनाए रखने के दौरान बाजार हिस्सेदारी जीतने के लिए, और नैतिक रूप से जिम्मेदार तरीके से ऐसा करने के लिए।












