ठूंठ पावेल ओसोकिन, एएमएआई के सह-संस्थापक और सीईओ - साक्षात्कार श्रृंखला - यूनाइट.एआई
हमसे जुडे

साक्षात्कार

पावेल ओसोकिन, एएमएआई के सह-संस्थापक और सीईओ - साक्षात्कार श्रृंखला

mm

प्रकाशित

 on

पावेल ओसोकिन के सह-संस्थापक और सीईओ हैं Amai, एक सैन फ्रांसिस्को-आधारित स्टार्टअप जो एआई वॉयस इंजन का उत्पादन करता है। पावेल दुनिया के हर फोन में अपनी वॉयस तकनीक स्थापित करने की पेशेवर महत्वाकांक्षा के साथ अमाई के संचालन और रणनीति का नेतृत्व कर रहे हैं। एएमएआई में उन्होंने एक एआई आवाज विकसित की जिसे 97% उपयोगकर्ता वास्तविक मानव भाषण से नहीं पहचान सकते।

आप 13 साल की उम्र में अपनी पहली कंपनी शुरू करने वाले आजीवन उद्यमी रहे हैं, व्यवसाय में आपका पहला प्रयास क्या था और आप इस उद्यमशीलता मानसिकता से किससे प्रेरित महसूस करते हैं?

मैंने वास्तव में इसे कंपनी नहीं कहा, लेकिन मैंने अपना पहला पैसा कुछ चीज़ों को दोबारा बेचकर या सड़क पर बाल्टी से कारें धोकर कमाया। मेरी प्रेरणा यह थी कि मुझे कोक या स्निकर्स चाहिए था, और मेरे माता-पिता के पास पैसे नहीं थे। मैं या तो पैसे आने का इंतजार कर सकता था या इसे खुद कमा सकता था। इंतज़ार करना मुझे अच्छा नहीं लगता.

क्या आप एएमएआई के पीछे की उत्पत्ति की कहानी साझा कर सकते हैं?

मैंने अपने साथी से पूछा, "दुनिया भर की कंपनियों को क्या चाहिए?" उस बातचीत में, मुझे एहसास हुआ कि हर व्यवसाय "बिक्री" की तलाश में है। हमने ऐसे रोबोट बनाना शुरू किया जो ग्राहकों से संपर्क कर सकें और मेल और मैसेंजर के माध्यम से उत्पाद बेच सकें। दूसरी ओर, यह कुछ खास नया नहीं था क्योंकि कई चैटबॉट उपलब्ध हैं। इसलिए, हमने सोचा कि अगर ये रोबोट कॉल भी कर सकें, तो बहुत अच्छा होगा। चूँकि बाज़ार में कुछ अच्छे समाधान नहीं थे, हमने अपनी स्वयं की संश्लेषित आवाज़ का एक प्रोटोटाइप बनाया और पहली बिक्री के बाद, रोबोट को छोड़ दिया और टीटीएस पर ध्यान केंद्रित किया।

एएमएआई का विशेष रूप से क्या मतलब है? 

इसका मतलब है कि मैं एआई हूं (मैं कृत्रिम बुद्धि हूं)।

क्या आप अत्याधुनिक टेक्स्ट-टू-स्पीच तकनीक को डिज़ाइन करने के पीछे की कुछ चुनौतियों पर चर्चा कर सकते हैं?

अत्याधुनिक टीटीएस को डिज़ाइन करना कई चुनौतियाँ पेश करता है। पहला डेटासेट एकत्र करना है। तंत्रिका नेटवर्क को प्रशिक्षित करने के लिए अलग-अलग उम्र की महिला और पुरुष आवाज़ों की आवश्यकता होती है, और जितना अधिक, उतना बेहतर। दूसरा, आपको प्राकृतिक आवाज़ के साथ बहुत करीबी समानता हासिल करने की ज़रूरत है। सबसे अच्छा तरीका विभिन्न मशीन लर्निंग मॉडल का परीक्षण करना और आवाज के उपयोग के विभिन्न मामलों के साथ लगातार प्रयोग करना है: विशेष रूप से, आपको सबसे समस्याग्रस्त नमूना ढूंढना होगा और इसे अलग से संसाधित करना होगा। दीर्घकालिक चुनौतियों की बात करें तो यह आकलन करना मुश्किल हो सकता है कि आवाज बेहतर हुई है या खराब, और इसमें किस दिशा में सुधार किया जाना चाहिए।

जब मनुष्यों के एएमएआई आवाज एआई के साथ बातचीत करने की बात आती है तो वाक् पहचान के पीछे कुछ चुनौतियाँ क्या हैं?

ध्वनि पहचान पर सैकड़ों कंपनियां काम कर रही हैं क्योंकि इसे विकसित करना आसान है। जिस समस्या का फिलहाल कोई समाधान नहीं है वह है बच्चे की आवाज पहचानना। कम उम्र में बच्चों में बोलने की कई विशेषताएं होती हैं, इसलिए उन सभी को ध्यान में रखना कठिन होता है। बहरहाल, हम इस समस्या के समाधान पर काम कर रहे हैं, और हम परिणाम घोषित करने के बहुत करीब हैं - इतनी जल्दी, हमारे एआई को न केवल वयस्कों के साथ, बल्कि बच्चों के साथ भी बातचीत करने में कोई समस्या नहीं होगी।

एएमएआई के लिए कुछ लोकप्रिय उपयोग के मामले क्या हैं?

अभी, यह ऑडियोबुक डबिंग और कॉल सेंटरों में एंटरप्राइज़ उपयोग है।

वर्तमान में कौन सी भाषाएँ पेश की जाती हैं, और वर्तमान में किन भाषाओं पर काम किया जा रहा है?

हमारे मल्टी-स्पीकर सिस्टम में दो भाषाएँ शामिल हैं, रूसी और अंग्रेजी। विचार यह है कि एक भाषा में बनी आवाज हमारे मॉडल में अन्य सभी भाषाएं भी बोल सकती है। वर्तमान में, हम 40 और भाषाओं के लिए डेटा एकत्र कर रहे हैं, और बहुत जल्द हमारे पास 42 भाषाएँ होंगी।

एआई वॉयस असिस्टेंट के भविष्य के बारे में आपका दृष्टिकोण क्या है?

यह मेरा विश्वास है कि वॉयस असिस्टेंट मेटावर्स में चले जाएंगे, और हम अभी इन अवसरों का अध्ययन कर रहे हैं। यदि आप सहायक को स्मार्ट स्पीकर या वेब ब्राउज़र के साथ एकीकृत करते हैं, तो अधिक लोग ध्वनि खोज का उपयोग करेंगे और हर दिन सहायक के साथ बातचीत करेंगे। आप अपने रेफ्रिजरेटर या टीवी से बात कर सकते हैं।

क्या एएमएआई के बारे में कुछ और है जो आप साझा करना चाहेंगे?

एएमएआई केवल अपनी स्वामित्व प्रौद्योगिकियों का उपयोग करता है।

साक्षात्कार के लिए धन्यवाद, जो पाठक अधिक जानना चाहते हैं उन्हें अवश्य आना चाहिए Amai.

Unity.AI का संस्थापक भागीदार और सदस्य फोर्ब्स प्रौद्योगिकी परिषद, एंटोनी एक है भविष्यवादी जो एआई और रोबोटिक्स के भविष्य को लेकर उत्साहित हैं।

के संस्थापक भी हैं सिक्योरिटीज.io, एक वेबसाइट जो विघटनकारी प्रौद्योगिकी में निवेश पर केंद्रित है।