рд╡рд┐рдЪрд╛рд░ рдиреЗрддрд╛

2023 рдореЗрдВ рд╡реНрдпрд╡рд╕рд╛рдп рдХреЗ рд▓рд┐рдП рдЬреЗрдирд░реЗрдЯрд┐рд╡ рдПрдЖрдИ рд╡реЙрдЗрд╕ рдХрд╛ рдиреИрддрд┐рдХ рд░реВрдк рд╕реЗ рдЙрдкрдпреЛрдЧ рдХреИрд╕реЗ рдХрд░реЗрдВ

mm

2022 के अंत में एआई प्रौद्योगिकियों ने ओपनएआई और चैटजीपीटी की आश्चर्यजनक लोकप्रियता के कारण व्यापक रूप से अपनाया जाना शुरू किया। पहली बार, एआई ने अपनी उपयोगिता और व्यवसायिक परिणामों को बनाने में अपने मूल्य को साबित करके जन-सामान्य में आकर्षण प्राप्त किया।

बहुत सारी एआई प्रौद्योगिकियां जो 2023 में सामान्य लोगों के लिए क्रांति जैसी लगती हैं, वास्तव में कई वर्षों से बड़े व्यवसायों और मीडिया द्वारा सक्रिय रूप से उपयोग की जा रही हैं। मुझे उन समाधानों को शक्ति प्रदान करने वाली प्रौद्योगिकी की जांच करने के लिए शामिल हों – विशेष रूप से, वॉइस क्लोनिंग के लिए जेनरेटिव एआई सिस्टम, इसके व्यवसायिक लाभ, और एआई का उपयोग करने के लिए नैतिक दृष्टिकोण।

वॉइस क्लोनिंग कैसे काम करती है?

संक्षेप में, वॉइस क्लोनिंग एक व्यक्ति को दूसरे व्यक्ति की आवाज में बोलने की अनुमति देती है।

यह जेनरेटिव एआई प्रौद्योगिकी का उपयोग करके एक व्यक्ति की आवाज की रिकॉर्डिंग बनाती है और उसी व्यक्ति की आवाज में नए ऑडियो सामग्री बनाने के लिए उनका उपयोग करती है। यह मूल रूप से लोगों को यह सुनने की अनुमति देता है कि कोई व्यक्ति क्या कहेगा, भले ही उन्होंने खुद ऐसा नहीं कहा हो।

तकनीकी पक्ष से, चीजें बहुत जटिल नहीं लगती हैं। लेकिन अगर आप थोड़ा गहराई से जाते हैं, तो शुरू करने के लिए कुछ न्यूनतम आवश्यकताएं हैं:

  1. आपको स्रोत आवाज को क्लोन करने के लिए कम से कम 5 मिनट की उच्च गुणवत्ता वाली रिकॉर्ड की गई ऑडियो की आवश्यकता है। ये रिकॉर्डिंग स्पष्ट और पृष्ठभूमि शोर या अन्य विकृतियों से मुक्त होनी चाहिए, क्योंकि किसी भी खामियों का मॉडल के आउटपुट की सटीकता पर प्रभाव पड़ सकता है।
  2. उसके बाद, इन रिकॉर्डिंग को एक जेनरेटिव एआई मॉडल में फीड करें ताकि एक “वॉइस अवतार” बनाया जा सके।
  3. फिर, मॉडल को पिच और टाइमिंग में भाषण पैटर्न को सटीक रूप से पुन: उत्पन्न करने के लिए प्रशिक्षित करें।
  4. एक बार पूरा हो जाने के बाद, यह प्रशिक्षित मॉडल किसी भी अन्य व्यक्ति की स्रोत आवाज का उपयोग करके असीमित सामग्री बनाने में सक्षम हो जाता है, वास्तविक ध्वनि वाली प्रतिकृति आवाज बनाने के लिए एक प्रभावी उपकरण बन जाता है।

यह वह बिंदु है जहां कई लोग नैतिक चिंताएं उठाते हैं। जब हम किसी अन्य व्यक्ति के मुंह में कोई भी पाठ डाल सकते हैं और यह बताना असंभव है कि वे शब्द वास्तविक या नकली हैं?

हां, यह संभावना पहले से ही वास्तविकता बन गई है। जैसा कि ओपनएआई और चैटजीपीटी के मामले में, हम वर्तमान में कई नैतिक मुद्दों का सामना कर रहे हैं जिन्हें नजरअंदाज नहीं किया जा सकता है।

एआई में नैतिक मानक

जैसा कि कई अन्य नए प्रौद्योगिकियों के साथ उनके अपनाये जाने के प्रारंभिक चरण में, मुख्य खतरा प्रौद्योगिकी के आसपास एक नकारात्मक प्रतिष्ठा बनाना है, न कि खतरों को चर्चा और मूल्यवान ज्ञान के स्रोत के रूप में स्वीकार करना। महत्वपूर्ण बात यह है कि बुरे अभिनेताओं द्वारा प्रौद्योगिकी और इसके उत्पादों का दुरुपयोग करने के तरीकों को उजागर करना, कम करने वाले उपकरण लागू करना, और सीखना जारी रखना।

आज हमारे पास जेनरेटिव एआई के उपयोग से संबंधित नैतिक मानकों के लिए तीन परतों के ढांचे हैं। राष्ट्रीय और अंतरराष्ट्रीय नियामक परतें अपने विकास के प्रारंभिक चरण में हैं। नीति दुनिया उभरती प्रौद्योगिकी के विकास की गति के साथ तालमेल नहीं रख सकती है, लेकिन हम पहले से ही यूरोपीय संघ को एआई विनियमन पर यूरोपीय संघ के प्रस्ताव और भ्रामक सूचना पर 2022 के अभ्यास कोड के साथ आगे बढ़ते हुए देख सकते हैं जो बड़े प्रौद्योगिकी कंपनियों से दुर्भाग्यपूर्ण एआई मैनिपुलेटेड सामग्री के प्रसार से निपटने की उम्मीद करता है। राष्ट्रीय स्तर पर, हम देखते हैं कि यूएस और यूके द्वारा इस मुद्दे से निपटने के लिए नियामक पहले कदम, यूएस के नेशनल डीपफेक और डिजिटल प्रोवेनेंस टास्क फोर्स और यूके के ऑनलाइन सुरक्षा बिल के साथ।

प्रौद्योगिकी उद्योग की परत तेजी से आगे बढ़ रही है क्योंकि कंपनियां और प्रौद्योगिकीविद् इस नए वास्तविकता को स्वीकार कर रहे हैं जैसा कि यह उभरती प्रौद्योगिकियों और उनके प्रभाव पर सामाजिक सुरक्षा और गोपनीयता के संबंध में है। जेनरेटिव एआई के नैतिकता पर संवाद जीवंत है और जेनरेटिव एआई के उपयोग के लिए आचार संहिता (जैसे सिंथेटिक मीडिया के लिए पार्टनरशिप ऑन एआई कोड ऑफ कंडक्ट) के आसपास उद्योग पहल के विकास की ओर ले जाता है और विभिन्न कंपनियों द्वारा जारी नैतिक बयान। सवाल यह है कि आचरण को व्यावहारिक बनाने के लिए कैसे? और क्या वे उत्पादों, विशिष्ट विशेषताओं और टीमों की प्रक्रियाओं को प्रभावित करने में सक्षम हैं?

मीडिया और मनोरंजन, साइबर सुरक्षा और एआई नैतिकता समुदायों के साथ इस समस्या पर काम करने के बाद, मैंने एआई सामग्री और विशेष रूप से आवाज के साथ काम करने के लिए कुछ व्यावहारिक सिद्धांतों का गठन किया है:

  1. आईपी मालिक और जो कंपनी क्लोन्ड आवाज का उपयोग करती है वह मूल आवाज का उपयोग करने से जुड़ी संभावित जटिलताओं से बचने के लिए कानूनी समझौते पर हस्ताक्षर कर सकते हैं।
  2. परियोजना के मालिक को सुनने वालों को गुमराह न करने के लिए क्लोन्ड आवाज के उपयोग का खुलासा करना चाहिए।
  3. वॉइस के लिए एआई प्रौद्योगिकी पर काम करने वाली कंपनियों को एआई-जनित सामग्री का पता लगाने और पहचानने में सक्षम प्रौद्योगिकी विकसित करने के लिए संसाधनों का एक प्रतिशत आवंटित करना चाहिए।
  4. एआई-जनित सामग्री को वॉटरमार्क के साथ लेबल करने से वॉइस प्रमाणीकरण संभव हो जाता है।
  5. प्रत्येक एआई सेवा प्रदाता को सामाजिक, व्यावसायिक और गोपनीयता स्तर पर परियोजना के प्रभाव की समीक्षा करनी चाहिए trước कि वह इसके लिए काम करने पर सहमत हो।

बिल्कुल, एआई में नैतिकता के सिद्धांत घरेलू डीपफेक्स के ऑनलाइन प्रसार को प्रभावित नहीं करेंगे। हालांकि, वे सार्वजनिक बाजार से ग्रे परियोजनाओं को बाहर कर देंगे।

2021-22 में, एआई आवाजों का उपयोग विभिन्न मुख्यधारा परियोजनाओं में किया गया था जिनमें नैतिकता और समाज के लिए भारी निहितार्थ थे। इनमें मंडलोरियन श्रृंखला के लिए युवा ल्यूक स्काईवॉकर की आवाज की क्लोनिंग, गॉड ऑफ वॉर 2 के लिए एआई वॉइस, और ऐतिहासिक ‘इन इवेंट ऑफ मून डिजास्टर’ के लिए रिचर्ड निक्सन की आवाज शामिल थीं।

प्रौद्योगिकी में विश्वास मीडिया और मनोरंजन से परे बढ़ रहा है। विभिन्न उद्योगों में पारंपरिक व्यवसाय अपनी परियोजनाओं में क्लोन्ड आवाज का उपयोग कर रहे हैं। यहाँ कुछ सबसे प्रमुख उपयोग के मामले हैं:

उद्योग उपयोग के मामले

2023 में, वॉइस क्लोनिंग विभिन्न व्यवसायों के साथ अपनी वृद्धि जारी रखेगी जो इसके कई लाभों का लाभ उठाने के लिए तैयार हैं। स्वास्थ्य सेवा और विपणन से लेकर ग्राहक सेवा और विज्ञापन उद्योग तक, वॉइस क्लोनिंग संगठनों को अपने ग्राहकों के साथ संबंध बनाने और अपने कार्य प्रवाह को सुव्यवस्थित करने के तरीके को क्रांतिकारी बना रही है।

वॉइस क्लोनिंग स्वास्थ्य पेशेवरों और सामाजिक कार्यकर्ताओं को लाभान्वित करती है जो ऑनलाइन वातावरण में काम करते हैं। चिकित्सा पेशेवरों के समान आवाज वाले डिजिटल अवतार रोगियों के साथ मजबूत बंधन बनाते हैं, विश्वास बढ़ाते हैं और ग्राहकों को बनाए रखते हैं।

फिल्म और मनोरंजन उद्योग में सामग्री को कई भाषाओं में डबिंग करने, बच्चों और वयस्कों के अतिरिक्त संवाद प्रतिस्थापन (एडीआर), और अनंत अनुकूलन विकल्पों के लिए वॉइस क्लोनिंग के आवेदन व्यापक हैं।

इसी तरह, ऑपरेशनल क्षेत्र में, एआई-संचालित वॉइस क्लोनिंग इंटरएक्टिव वॉइस रिस्पांस सिस्टम या कॉर्पोरेट प्रशिक्षण वीडियो के लिए लागत-कुशल समाधान की आवश्यकता वाले ब्रांडों के लिए उत्कृष्ट परिणाम प्रदान कर सकती है। वॉइस सिंथेसिस प्रौद्योगिकी के साथ, अभिनेता अपनी पहुंच बढ़ा सकते हैं और रिकॉर्डिंग से रॉयल्टी कमाने की उनकी क्षमता बढ़ा सकते हैं।

अंत में, विज्ञापन उत्पादन स्टूडियो में, वॉइस क्लोनिंग के उद्भव ने व्यावसायिक उत्पादन से जुड़े समय और लागत को काफी कम कर दिया है। जब तक कि क्लोनिंग के लिए उच्च गुणवत्ता वाली रिकॉर्डिंग उपलब्ध हो (यहां तक कि अनुपलब्ध अभिनेताओं से भी), विज्ञापनों का निर्माण तेजी से और पहले से अधिक रचनात्मक तरीके से किया जा सकता है।

दिलचस्प बात यह है कि उद्यम और एसएमबी वॉइस क्लोनिंग का उपयोग करके अपने ब्रांड के लिए कुछ अनोखा बना सकते हैं। बड़ी परियोजनाएं अपने सबसे महत्वाकांक्षी योजनाओं को महसूस कर सकती हैं, जबकि छोटे व्यवसाय पहले से ही लागत-प्रतिबंधित मॉडल तक पहुंच प्राप्त कर सकते हैं। यही सच्चा लोकतंत्रीकरण है।

निष्कर्ष

एआई वॉइस क्लोनिंग व्यवसायों को गेम-चेंजिंग लाभ प्रदान करती है, जैसे कि अद्वितीय ग्राहक अनुभव बनाना, अपने उत्पादों और सेवाओं में प्राकृतिक भाषा प्रसंस्करण क्षमताओं को एकीकृत करना, और पूरी तरह से वास्तविक ध्वनि वाली आवाजों की बारीकियों का अनुकरण करना।

2023 में अपनी प्रतिस्पर्धी बढ़त बनाए रखने के लिए व्यवसायों को एआई वॉइस क्लोनिंग में देखना चाहिए। कंपनियां इस प्रौद्योगिकी का उपयोग करके नए अवसरों की एक श्रृंखला को अनलॉक कर सकती हैं और ग्राहकों को बनाए रखने के दौरान बाजार हिस्सेदारी जीतने के लिए, और नैतिक रूप से जिम्मेदार तरीके से ऐसा करने के लिए।

рдЕрдиреНрдирд╛ рд░реЗрд╕реНрдкреАрдЪрд░ рдореЗрдВ рдиреИрддрд┐рдХрддрд╛ рдФрд░ рд╕рд╛рдЭреЗрджрд╛рд░реА рдХреА рдкреНрд░рдореБрдЦ рд╣реИ, рдЬреЛ рдпреВрдХреНрд░реЗрди рдореЗрдВ рд╕реНрдерд┐рдд рдПрдХ рдПрдореА рдкреБрд░рд╕реНрдХрд╛рд░ рд╡рд┐рдЬреЗрддрд╛ рд╡реЙрдЗрд╕ рдХреНрд▓реЛрдирд┐рдВрдЧ рддрдХрдиреАрдХ рд╣реИред рдЕрдиреНрдирд╛ рд░реАрдлреЗрд╕ рдореЗрдВ рдПрдХ рдкреВрд░реНрд╡ рдиреАрддрд┐ рд╕рд▓рд╛рд╣рдХрд╛рд░ рд╣реИрдВ, рдЬреЛ рдПрдХ рдПрдЖрдИ рд╕рдВрдЪрд╛рд▓рд┐рдд рд╕рд┐рдВрдереЗрдЯрд┐рдХ рдореАрдбрд┐рдпрд╛ рдРрдк рд╣реИ рдФрд░ рдХреИрдкреНрдЪрд░ рдирд╛рдордХ рдПрдХ рдХрд╛рдЙрдВрдЯрд░ рдбрд┐рд╕рдЗрдиреНрдлреЙрд░реНрдореЗрд╢рди рдЯреВрд▓ рдХреА рддрдХрдиреАрдХреА рд╕рд╣-рд╕рдВрд╕реНрдерд╛рдкрдХ рд╣реИ, рдЬрд┐рд╕реЗ рд╕реНрдЯрд╛рд░реНрдЯрдЕрдк рд╡рд╛рдЗрдЬ рдЧрд╛рдЗрдЬ рдПрдХреНрд╕реЗрд▓рд░реЗрдЯрд░ рдкреНрд░реЛрдЧреНрд░рд╛рдо рджреНрд╡рд╛рд░рд╛ рд╡рд┐рддреНрдд рдкреЛрд╖рд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдЕрдиреНрдирд╛ рдХреЗ рдкрд╛рд╕ рд╕реБрд░рдХреНрд╖рд╛ рдФрд░ рд░рдХреНрд╖рд╛ рдиреАрддрд┐рдпреЛрдВ, рдкреНрд░реМрджреНрдпреЛрдЧрд┐рдХрд┐рдпреЛрдВ рдФрд░ рд▓рдЪреАрд▓рд╛рдкрди рдирд┐рд░реНрдорд╛рдг рдореЗрдВ 11 рд╡рд░реНрд╖реЛрдВ рдХрд╛ рдЕрдиреБрднрд╡ рд╣реИред рд╡рд╣ рдЯреИрд▓рд┐рдиреНрди рдФрд░ рдкреНрд░рд╛рдЧ рд╕реБрд░рдХреНрд╖рд╛ рдЕрдзреНрдпрдпрди рд╕рдВрд╕реНрдерд╛рди рдореЗрдВ рдЕрдВрддрд░реНрд░рд╛рд╖реНрдЯреНрд░реАрдп рд░рдХреНрд╖рд╛ рдФрд░ рд╕реБрд░рдХреНрд╖рд╛ рдХреЗрдВрджреНрд░ рдореЗрдВ рдПрдХ рдкреВрд░реНрд╡ рд╢реЛрдз рд╕рд╣рдпреЛрдЧреА рд╣реИрдВред рдЙрдиреНрд╣реЛрдВрдиреЗ рдХреАрд╡ рд╕реНрдХреВрд▓ рдСрдл рдЗрдХреЛрдиреЙрдорд┐рдХреНрд╕ рдореЗрдВ рд╣рд╛рдЗрдмреНрд░рд┐рдб рдпреБрджреНрдз рдЯрд╛рд╕реНрдХ рдлреЛрд░реНрд╕ рдХреЗ рд╣рд┐рд╕реНрд╕реЗ рдХреЗ рд░реВрдк рдореЗрдВ рдкреНрд░рдореБрдЦ рдпреВрдХреНрд░реЗрдиреА рдХрдВрдкрдирд┐рдпреЛрдВ рдХреЛ рд▓рдЪреАрд▓рд╛рдкрди рдирд┐рд░реНрдорд╛рдг рдкрд░ рд╕рд▓рд╛рд╣ рджреА рд╣реИред