Connect with us

निक लाहोइका, वोकल इमेज के सह-संस्थापक और सीईओ – साक्षात्कार श्रृंखला

साक्षात्कार

निक लाहोइका, वोकल इमेज के सह-संस्थापक और सीईओ – साक्षात्कार श्रृंखला

mm

निक लाहोइका वोकल इमेज के सह-संस्थापक और सीईओ हैं, जो एक कोचिंग स्टार्टअप है जो लोगों को सoft स्किल्स विकसित करने में मदद करता है। एक सीरियल उद्यमी जिसके पास 10 साल से अधिक का आईटी और व्यवसाय विकास का अनुभव है, निक ने वोकल इमेज बनाने से पहले दो उद्यमों को सफलतापूर्वक बाहर निकाला। निक की यात्रा गहराई से व्यक्तिगत है; उन्हें स्कूल में अस्पष्ट उच्चारण के लिए परेशान किया गया था, जिसने उन्हें लोगों को बेहतर संवाद करने में मदद करने के लिए प्रेरित किया।

2020 की क्रांति के बाद अपने घरेलू देश से भागने के लिए मजबूर होने के बाद, निक एस्टोनिया में अंग्रेजी की न्यूनतम कमान के साथ पहुंचे और अपने पहले दौर के वित्तपोषण को छह महीने के भीतर ही अपने ऐप का उपयोग करके अपनी आवाज़ को प्रशिक्षित किया। एएवाई एआई चैलेंज और मेटा एक्स हगिंग फेस यूरोपीय एआई स्टार्टअप प्रोग्राम के विजेता, वोकल इमेज ने हाल ही में 3.6 मिलियन डॉलर का बीज दौर बढ़ाया है, जिसका नेतृत्व एडुकैपिटल (फ्रांस) ने किया है और 14 मिलियन डॉलर के वार्षिक राजस्व तक पहुंच गया है।

आपने 2021 में वोकल इमेज की स्थापना की। आपको एक एआई सॉफ्ट स्किल्स कोच बनाने के लिए क्या प्रेरित किया, और आप शुरुआत में किस समस्या का समाधान करने की कोशिश कर रहे थे?

बोलने में चिंता मेरे जीवन का एक हिस्सा था। मुझे स्कूल में अस्पष्ट उच्चारण के लिए परेशान किया गया था, और वह अनुभव वास्तव में मुझे चिपका रहा। बाद में, एक आईटी छात्र इंटर्न के रूप में, मुझे उच्च-स्तरीय ग्राहकों के सामने प्रस्तुत करना पड़ा, और उसी डर ने मुझे फिर से पकड़ लिया।

फिर 2021 में, बेलारूस में विफल क्रांति के बाद, मुझे रातोंरात यूरोप में जाना पड़ा। अचानक मैं निवेशकों के सामने अंग्रेजी में पिच कर रहा था, एक भाषा जिसे मैं कम बोलता था। यह डरावना था, लेकिन कोई विकल्प नहीं था। मैंने हर दिन अपने उच्चारण का अभ्यास करने में घंटों बिताए, जो बाद में वोकल इमेज बन गया। यहां तक कि मुझे अपनी खुद की कंपनी का नाम कहने के लिए “वी” ध्वनि को सही से उच्चार करने में हफ्तों लग गए।

हमने एक ऐप के साथ शुरुआत की जो मूल रूप से यूट्यूब की तरह था, लेकिन एक निर्मित आवाज रिकॉर्डर और एक टिप्पणी सुविधा के साथ। उपयोगकर्ता वीडियो देख सकते थे, पंक्तियों को दोहराने का अभ्यास कर सकते थे, और फिर अपने स्वयं के रिकॉर्डिंग सुन सकते थे। इसका उपयोग करने वाले लोगों को देखकर, हमें जल्द ही एहसास हुआ कि उन्हें तुरंत प्रतिक्रिया की आवश्यकता थी। हमारे शुरुआती उपयोगकर्ताओं ने हमें दिखाया कि सामग्री का सेवन करना पर्याप्त नहीं था; उन्हें तुरंत प्रतिक्रिया की आवश्यकता थी। हमने मानव कोचों के माध्यम से प्रतिक्रिया प्रदान करने का प्रयास किया, लेकिन यह दृष्टिकोण स्केलेबल नहीं था, जो हमें एआई का उपयोग करने के लिए ले गया।

यह मेरी व्यक्तिगत अंतर्दृष्टि थी कि मेरे लिए यह आसान था कि मैं अपने पहले पिच का अभ्यास हमारे प्लेटफ़ॉर्म के साथ कर सकता था, न कि किसी व्यक्ति के साथ। वहाँ कोई दबाव नहीं था, कोई निर्णय नहीं था। उस स्वतंत्रता ने मेरे लिए सब कुछ बदल दिया। एक बार जब मैंने अपनी समस्या का समाधान किया, तो मुझे एहसास हुआ कि कितने लोग उसी समस्या का सामना करते हैं। 200 मिलियन से अधिक लोग बोलने में चिंता से जूझते हैं।

वोकल इमेज से पहले, आपने एक नृत्य स्टूडियो चलाया। आपके द्वारा आंदोलन और अभिव्यक्ति में पृष्ठभूमि ने आपके संचार और वोकल आत्मविश्वास के दृष्टिकोण को कैसे प्रभावित किया?

मैं एक नृत्यकर्ता नहीं था; मैंने वास्तव में एक व्यवसाय बनाया जो आत्म-व्यक्ति और लोगों पर केंद्रित था। यह उस काम के माध्यम से था कि मुझे एहसास हुआ कि आप एक व्यक्ति के बारे में बहुत कुछ बता सकते हैं कि वे कैसे नृत्य करते हैं।

आंदोलन भी आपके द्वारा खुद को व्यक्त करने में एक बड़ी भूमिका निभाता है। आपके द्वारा किया जाने वाला तरीका, आपका मुद्रा, आपकी सांस, यह सभी संचार का हिस्सा है। यही वह जगह है जहां एआई कोचिंग शक्तिशाली हो जाती है, क्योंकि यह लोगों को एक ही स्थान पर उन सभी क्षेत्रों में प्रशिक्षित करने में मदद कर सकती है।

इससे पहले, कंपनियों को अलग-अलग कोच नियुक्त करना पड़ता था। एक सार्वजनिक बोलने के लिए, एक शरीर की भाषा के लिए, एक आत्मविश्वास के लिए। अब, एआई के साथ, यह सभी जुड़ा हुआ है। आप संचार का पूरा चित्र बना सकते हैं, न कि इसका केवल एक हिस्सा।

अधिकांश एआई संचार उपकरणों के विपरीत, आपने अपने कोच के लिए चैटजीपीटी का उपयोग नहीं करने का निर्णय लिया। इस निर्णय के पीछे क्या था?

चैटजीपीटी के आसपास का हंगामा वास्तव में एक बड़ा मोड़ बन गया है। जब यह मुख्यधारा में आया, तो यह एआई पर विश्वास में एक बड़ा उछाल पैदा किया, और हम इसका लाभ उठाने में सक्षम थे ताकि लोगों को हमारी अपनी प्रौद्योगिकी में विश्वास हो।

लेकिन यह बात है: हमने इसे अपने आधार के रूप में उपयोग करने के लिए कभी नहीं चुना। हमारा लक्ष्य शुरू से ही अपने अनूठे मॉडल का उपयोग करके लोगों की आवाज और भाषण पैटर्न का मूल्यांकन करना था। हम बड़े भाषा मॉडल जैसे जेमिनी, क्लाउड और चैटजीपीटी और संचार साहित्य से सुझाव और तरकीबें उपयोग करते हैं, लेकिन वे हमारे प्रतिक्रिया तंत्र का मूल नहीं हैं। वास्तविक प्रतिक्रिया का आधार मानव इनपुट है।

एआई कोचिंग के रोबोटिक महसूस करने का डर वास्तविक है। इसका मुकाबला करने के लिए, हमने वोकल इमेज के भीतर एक समुदाय को बढ़ावा दिया जहां उपयोगकर्ता तुरंत जुड़ सकते हैं, संचार में सुधार के सामान्य लक्ष्य को साझा कर सकते हैं, और एक दूसरे की यात्रा का समर्थन कर सकते हैं। और यह समुदाय निरंतर बढ़ रहा है और हमारे एआई को बेहतर बना रहा है।

मानव आवाजों पर अपने एआई को विशेष रूप से प्रशिक्षित करने से पारंपरिक एलएलएम-आधारित दृष्टिकोणों में परिणाम और प्रामाणिकता के संदर्भ में कैसे अंतर है?

हम बड़े भाषा मॉडल का उपयोग मूल्यांकन और संदर्भ के हिस्से के रूप में करते हैं, लेकिन हमारे सिस्टम का वास्तविक आधार डेटा है जो इसके पीछे है। हमारा मूल मॉडल हमारे समुदाय पर प्रशिक्षित किया गया था, जो लोगों से बना था जो विशेष रूप से अपने संचार कौशल में सुधार करने के लिए एक साथ आए थे।

एआई उतना ही अच्छा है जितना कि यह मानव से सीखता है। हमारे प्रोप्राइटरी डेटासेट में अब एक मिलियन से अधिक अद्वितीय मानव आवाजें शामिल हैं, प्रत्येक में स्वर, लय और भावना है, जो सभी संचार के वास्तविक सार का प्रतिनिधित्व करते हैं।

आपके डेटासेट में एक मिलियन से अधिक मानव आवाजें शामिल हैं। ऐसे एक अद्वितीय कॉर्पस को बनाने और लेबल करने में आपको किन चुनौतियों का सामना करना पड़ा?

आप हर डेटा बिंदु पर समान रूप से भरोसा नहीं कर सकते। कुछ उपयोगकर्ता सावधानी से दर्जा देते हैं, अन्य बस क्लिक करते हैं। हमें एक प्रणाली डिज़ाइन करनी थी जो सोच-समझकर दी गई प्रतिक्रिया को शोर से अलग कर सके। समय के साथ, हमने सीखा कि निरंतर भागीदारी और विश्वसनीय निर्णय वाले उपयोगकर्ताओं को अधिक महत्व दें, जबकि यादृच्छिक इनपुट को फिल्टर आउट किया जाए।

सबसे कठिन हिस्सा परिचालन था, जिसमें एक रेटिंग पारिस्थितिकी तंत्र का निर्माण शामिल था जो गुणवत्ता को मात्रा से ऊपर रखता है। यही वह जगह है जहां हमारा समुदाय अमूल्य बन गया। ये यादृच्छिक इंटरनेट उपयोगकर्ता नहीं हैं; वे वास्तव में अपने सॉफ्ट स्किल्स में सुधार करने और दूसरों की मदद करने के लिए प्रयास कर रहे हैं। सभी रेटिंग गुमनाम हैं, जो प्रतिक्रिया को निष्पक्ष और प्रामाणिक बनाए रखने में मदद करती हैं।

समुदाय-संचालित “टिंडर-जैसी” मूल्यांकन तंत्र दिलचस्प है – यह प्रतिक्रिया लूप आपके एआई के निरंतर शिक्षण को कैसे आकार देता है?

प्रत्येक रेटिंग, प्रत्येक भाषा में, हमारे मॉडल को परिष्कृत करने वाली बुद्धिमत्ता का एक छोटा सा टुकड़ा बन जाती है। यह एक जीवित प्रतिक्रिया लूप है। जितने अधिक लोग प्रशिक्षण लेते हैं और मूल्यांकन करते हैं, सिस्टम भाषण और भावना की बारीकियों को पहचानने में उतना ही अधिक चतुर हो जाता है, सीखता है कि लोग वास्तव में विश्वास, गर्मजोशी, या अधिकार को विभिन्न संस्कृतियों में कैसे महसूस करते हैं।

सॉफ्ट स्किल्स पर केंद्रित एक एआई मॉडल विकसित करते समय क्या मुख्य सबक सीखे गए, न कि तकनीकी क्षमता?

मुख्य चुनौती माप थी। “विश्वसनीय” या “आकर्षक” के लिए कोई सार्वभौमिक मीट्रिक नहीं है। हमें अपना खुद का बनाना पड़ा।

यह वह जगह है जहां लार्ज नंबर्स का नियम आया। यदि 100,000 लोग इस बात से सहमत हैं कि एक bestimmte आवाज विश्वासपात्र या संवेदनशील लगती है, तो आप उस सामूहिक धारणा पर विश्वास करना शुरू कर सकते हैं। समय के साथ, हमने अपने एआई को विषयगत गुणों की भविष्यवाणी करना सिखाया, जो सरल सही या गलत के साथ ग्रेड नहीं किया जा सकता है। यह वह突破 था: असंगत को मात्रा में बदलना सीखना।

14 मिलियन डॉलर के वार्षिक राजस्व और 3.6 मिलियन डॉलर के ताज़ा बीज दौर के साथ, आपके लिए अगले चरण में विकास के लिए मुख्य प्राथमिकताएं क्या हैं – चाहे वह एआई मॉडल को आगे बढ़ाना हो, उपयोगकर्ता आधार का विस्तार करना हो, या समुदाय के अनुभव को गहरा करना हो?

हमारा मिशन हमेशा मानव-केंद्रित रहा है। हम लोगों को अधिक आत्मविश्वास और प्रामाणिकता के साथ संवाद करने में मदद करते हैं।

अगला चरण उस प्रभाव को वैश्विक स्तर पर बढ़ाने के बारे में है। हम नए भाषाओं और भौगोलिक क्षेत्रों में विस्तार कर रहे हैं, और वार्ता जैसे नए सॉफ्ट-स्किल मॉड्यूल विकसित कर रहे हैं, सक्रिय सुनवाई और अभिवादन।

कई उपयोगकर्ता कहते हैं कि एआई कोच रोबोटिक या व्यक्तिगत महसूस नहीं कराते हैं। आप यह सुनिश्चित कैसे करते हैं कि वोकल इमेज भावनात्मक रूप से प्रतिध्वनित और संदर्भ-जागरूक प्रतिक्रिया प्रदान करता है?

हम हाइपर-व्यक्तिगतीकरण पर ध्यान केंद्रित करते हैं। पहली बातचीत से, हम जानते हैं कि आप कौन हैं, आपकी उच्चारण, आयु, पेशेवर संदर्भ, और बोलने के पैटर्न। समय के साथ, हमें याद रहता है कि आपने कैसे सुधार किया है, जहां आप संघर्ष करते हैं, और कौन सी प्रतिक्रिया सबसे ज्यादा प्रतिध्वनित होती है।

यह एआई को गतिशील रूप से अनुकूल बनाता है। अनुभव व्यक्तिगत लगता है क्योंकि यह वास्तव में व्यक्तिगत है। यह पूरी तरह से आपके डेटा और आपकी यात्रा द्वारा आकार दिया गया है, न कि किसी सामान्य स्क्रिप्ट द्वारा।

आगे देखते हुए, आप एआई सॉफ्ट स्किल्स कोचिंग को कैसे विकसित होते हुए देखते हैं क्योंकि जनरेटिव और भावनात्मक एआई और परिपक्व होती है?

मानव विकास हमेशा प्रकृति और पोषण का मिश्रण रहा है। विज्ञान बताता है कि नेतृत्व लगभग आधा अंतर्निहित है, आधा सीखा है। सीखा हुआ आधा हिस्सा पहले केवल उन कार्यकारियों के लिए आरक्षित था जो महंगे कोचों को वहन कर सकते थे। लंबे समय से, कंपनियों को एक नेता को प्रशिक्षित करने के लिए प्रति वर्ष 7,000 से 25,000 डॉलर का भुगतान करना पड़ता था। एआई इसे बदल देता है।

इसके अलावा, मानव प्रशिक्षकों के साथ जुड़ने से कई अलग-अलग कोचों को बनाए रखने की आवश्यकता होगी, जबकि एक एआई कोच उन सभी को बदल सकता है।

वर्तमान में, हम विभिन्न पहलुओं का विश्लेषण करने के लिए विभिन्न मॉडलों की एक पाइपलाइन का उपयोग करते हैं, लेकिन भविष्य एक एकल, एकीकृत प्रणाली है जो आपको समग्र रूप से मूल्यांकन और मार्गदर्शन करती है। यह प्रौद्योगिकी विकास को लोकतांत्रिक बनाएगी। आपको आकर्षक होने या बड़े कॉर्पोरेट बजट के साथ पैदा होने की आवश्यकता नहीं होगी ताकि आप संचार में महारत हासिल कर सकें। आपको केवल जिज्ञासा और पहुंच की आवश्यकता होगी, और उस वातावरण को बनाने के लिए जो पनपने के लिए आवश्यक है, यही मुझे हर दिन प्रेरित करता है।

साक्षात्कार के लिए धन्यवाद, पाठक जो अधिक जानना चाहते हैं उन्हें वोकल इमेज पर जाना चाहिए。

एंटोनी एक दूरदर्शी नेता और Unite.AI के संस्थापक भागीदार हैं, जो कि एआई और रोबोटिक्स के भविष्य को आकार देने और बढ़ावा देने के लिए एक अटूट जुनून से प्रेरित हैं। एक श्रृंखला उद्यमी, वह मानता है कि एआई समाज के लिए उतना ही विघटनकारी होगा जितना कि बिजली, और अक्सर विघटनकारी प्रौद्योगिकियों और एजीआई की संभावना के बारे में उत्साहित होता है।

एक फ्यूचरिस्ट के रूप में, वह इन नवाचारों के माध्यम से हमारी दुनिया को आकार देने की खोज में समर्पित है। इसके अलावा, वह सिक्योरिटीज़.io के संस्थापक हैं, एक मंच जो भविष्य को फिर से परिभाषित करने और पूरे क्षेत्रों को फिर से आकार देने वाली अत्याधुनिक प्रौद्योगिकियों में निवेश पर केंद्रित है।