साक्षात्कार

मैनुअल रोमेरो, मैसा के सह-संस्थापक और मुख्य वैज्ञानिक अधिकारी – साक्षात्कार श्रृंखला

Published March 19, 2026

Updated May 16, 2026

Antoine Tardif, CEO & Founder of Unite.AI

मैनुअल रोमेरो, मैसा के सह-संस्थापक और मुख्य वैज्ञानिक अधिकारी, एक एआई अनुसंधानकर्ता और इंजीनियर हैं जो विश्वसनीय, उद्यम-ग्रेड कृत्रिम बुद्धिमत्ता प्रणालियों को विकसित करने पर केंद्रित हैं। उन्होंने 2024 में मैसा की स्थापना की ताकि जवाबदेह एआई बनाया जा सके जो पारदर्शिता और नियंत्रण के साथ जटिल व्यवसायिक प्रक्रियाओं को निष्पादित कर सके। मैसा से पहले, रोमेरो ने क्लिब्रेन और नैरेटिवा जैसी कंपनियों में वरिष्ठ एआई इंजीनियरिंग और मशीन लर्निंग भूमिकाएं निभाईं, जहां उन्होंने प्राकृतिक भाषा प्रसंस्करण और बड़े पैमाने पर एआई प्रणालियों में विशेषज्ञता प्राप्त की। अपने करियर की शुरुआत में, उन्होंने एक फुल-स्टैक सॉफ्टवेयर इंजीनियर और डेवओप्स विशेषज्ञ के रूप में काम किया और फिर उन्नत एआई अनुसंधान और विकास में स्थानांतरित हो गए, जिससे खुले स्रोत एआई पारिस्थितिकी तंत्र में एक सक्रिय योगदानकर्ता बने।

मैसा एआई स्वायत्त “डिजिटल कार्यकर्ताओं” का विकास करता है, जो एआई एजेंट हैं जो जटिल उद्यम कार्यप्रवाह को स्वचालित करने के लिए डिज़ाइन किए गए हैं जबकि ट्रेसबिलिटी, शासन और विश्वसनीयता बनाए रखते हैं। प्लेटफ़ॉर्म संगठनों को प्राकृतिक भाषा का उपयोग करके एआई एजेंट बनाने और तैनात करने की अनुमति देता है, जिससे आंतरिक प्रणालियों और डेटा स्रोतों के साथ स्वचालन की अनुमति मिलती है बिना व्यापक कोडिंग के। वेरिफ़ाइड रीज़निंग और संरचित निष्पादन पर ध्यान केंद्रित करके, मैसा सामान्य रूप से जनरेटिव एआई प्रणालियों से जुड़ी सामान्य सीमाओं को पार करने और उद्यमों को सुरक्षित रूप से बड़े पैमाने पर स्वायत्त एआई तैनात करने में मदद करने का लक्ष्य रखता है।

आपने अक्सर एआई प्रणालियों के पीछे के गहरे “क्यों” को समझने पर ध्यान केंद्रित किया है। एक तकनीकी दृष्टिकोण से, आपको 2024 में मैसा की स्थापना करने के लिए क्या प्रेरित किया, और आपने कौन सा उद्यम एआई वास्तुकला में अंतराल नहीं देखा?

मैसा की स्थापना के पीछे का प्रेरणा यह थी कि अधिकांश उद्यम एआई स्टैक मॉडल के चारों ओर बनाए गए थे, न कि प्रणालियों के चारों ओर।

जनरेटिव एआई बूम के दौरान, कई कंपनियों ने मौजूदा कार्यप्रवाह में बड़े भाषा मॉडल एकीकृत करने पर ध्यान केंद्रित किया। हालांकि, ये प्रणालियां अक्सर नाजुक, अपारदर्शी और पैमाने पर संचालित करने में कठिन थीं। उनमें:

जहां यह मायने रखता है वहां निर्धारित निष्पादन।
मजबूत अवलोकनीयता, ट्रेसबिलिटी
पुनरुत्पादकता

हमने जो अंतराल देखा वह वास्तविक एआई बुनियादी ढांचे की अनुपस्थिति थी। कंपनियां एलएलएम एपीआई के चारों ओर अनुप्रयोग बना रही थीं, लेकिन उनके पास ज्ञान कार्य के लिए कंप्यूटर वास्तुकला के बराबर कुछ नहीं था।

मैसा को उस अंतराल को पूरा करने के लिए डिज़ाइन किया गया था जो ज्ञान प्रसंस्करण इकाई (केपीयू) के चारों ओर एक वास्तुकला को डिज़ाइन करके, जो प्रणाली एआई को वास्तविक उद्यम कार्यप्रवाह के अंदर विश्वसनीय रूप से संचालित करने की अनुमति देती है।

आपने उन्नत प्राकृतिक भाषा प्रसंस्करण और जनरेटिव प्रणालियों पर काम करने से पहले मैसा की स्थापना की। उन अनुभवों ने प्लेटफ़ॉर्म के पीछे वास्तुकला विकल्पों को कैसे आकार दिया?

प्राकृतिक भाषा प्रसंस्करण और प्राकृतिक भाषा पीढ़ी में मेरे अनुभव, विशेष रूप से भाषा मॉडल और बाद में बड़े भाषा मॉडल (सैकड़ों) के प्रशिक्षण और पूर्व-प्रशिक्षण में, मुझे यह स्पष्ट कर दिया कि जब वास्तविक प्रणालियों को उनके ऊपर बनाने की कोशिश की जा रही है, तो यह बहुत स्पष्ट है। ट्रांसफ़ॉर्मर वास्तुकला बहुत शक्तिशाली है, लेकिन यह कम से कम तीन मूलभूत सीमाओं के साथ आती है जिन्हें उत्पादन में विश्वसनीय रूप से उपयोग करने के लिए संबोधित किया जाना चाहिए।

पहली है हॉलुसिनेशन। ये मॉडल संभाव्यतः पाठ उत्पन्न करते हैं और ऐसे आउटपुट उत्पन्न कर सकते हैं जो सही लगते हैं लेकिन सत्यापित जानकारी में आधारित नहीं हैं।

दूसरा है संदर्भ सीमाएं। यहां तक कि बड़े संदर्भ विंडो के साथ, मॉडल एक सीमित टोकन स्थान के भीतर संचालित होते हैं, जो बड़े या जटिल ज्ञान निकायों पर कारण करना मुश्किल बनाता है।

तीसरा है अद्यतन जानकारी। पूर्व-प्रशिक्षित मॉडल प्रशिक्षण समय में ज्ञान का एक स्नैपशॉट प्रस्तुत करते हैं, जबकि उद्यम वातावरण में प्रणालियों की आवश्यकता होती है जो लगातार बदलती जानकारी पर कारण कर सकती हैं।

इन प्रतिबंधों को पहचानने से मैसा के पीछे कई वास्तुकला निर्णयों को आकार मिला। मॉडल पर भरोसा करने के बजाय, हम एक प्रणाली बनाने पर ध्यान केंद्रित किया जो ज्ञान तक संरचित पहुंच, सत्यापन तंत्र और नियंत्रित निष्पादन प्रदान करता है ताकि एआई वास्तविक उद्यम कार्यप्रवाह में विश्वसनीय रूप से संचालित हो सके।

कई उद्यम जनरेटिव एआई के साथ प्रयोग करते हैं लेकिन पायलट से परे जाने में संघर्ष करते हैं। एक प्रणाली डिज़ाइन दृष्टिकोण से, इतने सारे संगठनों में स्केलिंग विफल होने का मूल कारण क्या है?

कई उद्यम जनरेटिव एआई पायलट से परे जाने में संघर्ष करते हैं क्योंकि अधिकांश तैनाती प्रयोग के रूप में बनाई गई हैं और मजबूत प्रणालियों के रूप में नहीं। प्रारंभिक प्रोटोटाइप अक्सर प्रॉम्प्ट इंजीनियरिंग, हल्के ऑर्केस्ट्रेशन और सरल रिट्रीवल पाइपलाइनों पर निर्भर करते हैं, जो मूल्य प्रदर्शित कर सकते हैं लेकिन उत्पादन वातावरण के लिए आवश्यक विश्वसनीयता, अवलोकनीयता या नियंत्रण प्रदान नहीं करते हैं। जैसे ही संगठन इन प्रणालियों को स्केल करने का प्रयास करते हैं, वे असंगत आउटपुट, ट्रेसबिलिटी की कमी, उद्यम कार्यप्रवाह के साथ एकीकरण करने में कठिनाई और एआई के व्यवहार पर शासन की सीमितता जैसी समस्याओं का सामना करते हैं। इसका मूल कारण यह है कि बड़े भाषा मॉडल संभाव्यतः जनरेटर हैं, जबकि उद्यम प्रक्रियाओं को अनुमानित और लेखा परीक्षित व्यवहार की आवश्यकता होती है। नियंत्रित निष्पादन, सत्यापन और निगरानी के आसपास संरचना जोड़ने के बिना, जनरेटिव एआई प्रणालियां अलग-अलग उपयोग के मामलों से परे स्केल करना मुश्किल बनी हुई हैं।

मैसा के डिजिटल वर्कर्स को लेखा परीक्षित और संरचित होने के लिए डिज़ाइन किया गया है, न कि केवल संभाव्यतः। व्यावसायिक उपयोग के लिए एआई का मूल्यांकन करने वाले उद्यमों के लिए इसका क्या अर्थ है?

जब हम कहते हैं कि मैसा के डिजिटल वर्कर्स लेखा परीक्षित और संरचित हैं, न कि केवल संभाव्यतः, तो हमारा मतलब है कि एआई एक नियंत्रित प्रणाली के भीतर संचालित होता है जहां इसके कार्य और तर्क को ट्रेस और शासित किया जा सकता है। मॉडल को स्वतंत्र रूप से आउटपुट और निर्णय उत्पन्न करने की अनुमति देने के बजाय, प्रणाली यह संरचित करती है कि एआई डेटा, टूल और कार्यप्रवाह के साथ कैसे बातचीत करता है। प्रक्रिया में प्रत्येक चरण लॉग, निरीक्षण और सत्यापन किया जा सकता है, और कार्यों को परिभाषित इंटरफेस के माध्यम से निष्पादित किया जाता है, न कि सीधे मॉडल आउटपुट से। उद्यमों के लिए, इसका मतलब है कि एआई प्रणालियों को महत्वपूर्ण प्रक्रियाओं में एकीकृत किया जा सकता है और अधिक विश्वास के साथ निगरानी और लेखा परीक्षित किया जा सकता है। यह एआई को एक काले बॉक्स सहायक से एक प्रणाली में बदलता है जिसका व्यवहार समझा जा सकता है, नियंत्रित किया जा सकता है और उत्पादन वातावरण में विश्वास किया जा सकता है।

ज्ञान प्रसंस्करण इकाई के वास्तुकार के रूप में, यह एक आम ऑर्केस्ट्रेशन परत या बड़े भाषा मॉडल के चारों ओर निर्मित कार्यप्रवाह इंजन से कैसे भिन्न है?

ज्ञान प्रसंस्करण इकाई एक आम ऑर्केस्ट्रेशन परत से भिन्न है क्योंकि यह केवल प्रॉम्प्ट और मॉडल कॉल को समन्वयित करने वाले एक कार्यप्रवाह प्रबंधक के रूप में कार्य नहीं करती है। अधिकांश ऑर्केस्ट्रेशन फ्रेमवर्क प्रत्येक चरण के रूप में पुनर्प्राप्ति, प्रॉम्प्टिंग और टूल निष्पादन जैसे कार्यों को श्रृंखला में जोड़ते हैं। जेपीयू एक गहरे वास्तुकला स्तर पर कार्य करता है जो यह संरचित करता है कि ज्ञान कैसे एक्सेस किया जाता है, कैसे तर्क किया जाता है और कार्यों को प्रणाली के भीतर कैसे निष्पादित किया जाता है। यह ज्ञान प्रसंस्करण को एक मूलभूत गणना परत के रूप में मानता है, जो स्मृति, सत्यापन और नियंत्रित निष्पादन को एकीकृत करता है ताकि एआई जटिल उद्यम कार्यप्रवाह के भीतर विश्वसनीय रूप से संचालित हो सके, न कि केवल प्रतिक्रियाओं का उत्पादन कर सके।

नियंत्रित उद्योगों में, जोखिम सहनशीलता कम है। आपने एआई आउटपुट को विश्वसनीय बनाए रखने और जटिल कार्यप्रवाह में त्रुटियों को प्रसारित नहीं करने के लिए कौन से विशिष्ट डिज़ाइन निर्णय लिए?

नियंत्रित उद्योगों में, विश्वसनीयता और नियंत्रण आवश्यक हैं, इसलिए हमने कई सुरक्षा उपायों के साथ प्रणाली को डिज़ाइन किया ताकि एआई आउटपुट विश्वसनीय बने रहें। एक मुख्य सिद्धांत संरचित निष्पादन है, जहां एआई नियंत्रित इंटरफेस के माध्यम से गुजरे बिना महत्वपूर्ण कार्यों को सीधे ट्रिगर नहीं कर सकता है। हमने मॉडल आउटपुट को स्कीमा, नियमों या द्वितीयक तंत्रों के खिलाफ सत्यापन परतें भी एकीकृत की हैं जो स्वीकार किए जाने से पहले जांचती हैं। इसके अलावा, प्रणाली पूर्ण अवलोकनीयता बनाए रखती है, तर्क चरणों, टूल इंटरैक्शन और निर्णयों को रिकॉर्ड करती है ताकि वे ट्रेस और लेखा परीक्षित किए जा सकें। साथ में, ये डिज़ाइन विकल्प कार्यप्रवाह के माध्यम से त्रुटियों को प्रसारित होने से रोकने में मदद करते हैं और नियंत्रित वातावरण में संगठनों को एआई प्रणालियों को संचालित करने की अनुमति देते हैं।

आपको सबसे प्रेरक प्रारंभिक उपयोग के मामले कहां दिखाई दिए हैं जहां डिजिटल वर्कर्स मार्गदर्शक सहायता से पूरी तरह से संचालित एआई-चालित निष्पादन में चले गए हैं?

कुछ सबसे प्रेरक प्रारंभिक उपयोग के मामले ज्ञान-गहन कार्यप्रवाह में दिखाई देते हैं जहां प्रक्रियाएं अच्छी तरह से परिभाषित होती हैं लेकिन अभी भी महत्वपूर्ण विश्लेषण और निर्णय लेने की आवश्यकता होती है। अनुपालन समीक्षा, तकनीकी सहायता संचालन और आंतरिक ज्ञान प्रबंधन जैसे क्षेत्रों में, डिजिटल वर्कर्स मानव सहायता से परे जा सकते हैं और संरचित कार्यों को सिर से अंत तक निष्पादित करना शुरू कर सकते हैं। वे बड़े पैमाने पर आंतरिक जानकारी प्राप्त और विश्लेषण कर सकते हैं, परिभाषित प्रक्रियाओं को लागू कर सकते हैं, नियंत्रित टूल के माध्यम से उद्यम प्रणालियों के साथ बातचीत कर सकते हैं और संचालन कार्यप्रवाह में सीधे खिलाने वाले आउटपुट का उत्पादन कर सकते हैं। मुख्य बदलाव तब होता है जब एआई न केवल सुझाव उत्पन्न कर रहा होता है, बल्कि एक शासित प्रणाली के भीतर परिभाषित कार्यों को विश्वसनीय रूप से निष्पादित करने में सक्षम होता है, जिससे संगठनों को जटिल ज्ञान कार्य के हिस्सों को स्वचालित करने की अनुमति मिलती है, न कि केवल इसे बढ़ाने की।

एआई के चारों ओर नियामक जांच बढ़ने के साथ, आप कैसे देखते हैं कि मूल एआई बुनियादी ढांचा नियामक आवश्यकताओं को पूरा करने के लिए विकसित हो रहा है बिना नवाचार को सीमित किए?

एआई के चारों ओर नियामक जांच बढ़ने के साथ, मुझे लगता है कि हम मॉडल प्रदाता एपीआई को बुलाने वाली वास्तुकला से दूर जाने की ओर बढ़ रहे हैं और उन्हें अंधाधुंध विश्वास करते हैं। उद्यम और नियामकों को अब उन प्रणालियों की मांग करने की संभावना है जहां एआई व्यवहार अवलोकनीय, लेखा परीक्षित और शासित है। यह वह जगह है जहां ज्ञान प्रसंस्करण इकाई जैसी वास्तुकला महत्वपूर्ण हो जाती है। इस प्रकार की वास्तुकला संगठनों को नियंत्रण लागू करने, निर्णयों को ट्रेस करने और यह सुनिश्चित करने की अनुमति देती है कि एआई आउटपुट वास्तविक प्रक्रियाओं को प्रभावित करने से पहले विश्वसनीय हैं। समय के साथ, मुझे उम्मीद है कि इस तरह की प्रणालियां विश्वसनीय एआई बुनियादी ढांचे के लिए मानक आधार बन जाएंगी।

आपने अपने तकनीकी कार्य के साथ-साथ नैतिकता और जवाबदेही के बारे में भी बात की है। वे दृष्टिकोण आपके दृष्टिकोण को कैसे प्रभावित करते हैं और पारदर्शी एआई प्रणालियों का निर्माण करते हैं?

नैतिकता और जवाबदेही, मेरे लिए, सीधे प्रणाली डिज़ाइन विकल्पों में अनुवाद करते हैं। यदि एआई प्रणालियां वास्तविक ऑपरेशनल कार्यप्रवाह में भाग लेने जा रही हैं, तो वे ऐसे अपारदर्शी ब्लैक बॉक्स के रूप में कार्य नहीं कर सकती हैं जिनका व्यवहार निरीक्षण या समझा नहीं जा सकता है। यह दृष्टिकोण मुझे यह सुनिश्चित करने के लिए प्रेरित करता है कि पारदर्शिता, ट्रेसबिलिटी और मानव पर्यवेक्षण प्रणाली के आर्किटेक्चर में शामिल हों। जब ये सिद्धांत बुनियादी ढांचे के स्तर पर एम्बेडेड होते हैं, तो एआई प्रणालियां न केवल अधिक विश्वसनीय हो जाती हैं, बल्कि संगठनों के लिए उन्हें जिम्मेदारी से शासित करना भी आसान हो जाता है।

आगे देखते हुए, क्या आप मानते हैं कि एजेंटिक एआई बुनियादी ढांचा क्लाउड बुनियादी ढांचे की तरह ही मूलभूत हो जाएगा – और इस बदलाव को साकार करने के लिए क्या तकनीकी रूप से होने की आवश्यकता है?

मुझे लगता है कि एजेंटिक एआई बुनियादी ढांचा पिछले दशक में क्लाउड बुनियादी ढांचे की तरह ही मूलभूत हो जाएगा। जैसे ही संगठन ज्ञान कार्य को स्वचालित करने की मांग करते हैं, उन्हें ऐसी प्रणालियों की आवश्यकता होगी जो तर्क, स्मृति और निष्पादन को कई कार्यों और डेटा स्रोतों में समन्वयित कर सकें। हालांकि, इस बदलाव को साकार करने के लिए, अंतर्निहित वास्तुकला को मॉडल एकीकरण से परे परिपक्व होने की आवश्यकता है। हमें ऐसा बुनियादी ढांचा चाहिए जो संरचित तर्क, विश्वसनीय उद्यम ज्ञान तक पहुंच, मजबूत अवलोकनीयता और नियंत्रित निष्पादन प्रदान करता हो। जब ये क्षमताएं मूल प्रणाली में निर्मित होती हैं, तो एजेंटिक एआई प्रयोगात्मक उपकरणों से विश्वसनीय बुनियादी ढांचे में विकसित हो सकता है जिस पर संगठन महत्वपूर्ण संचालन चलाने के लिए भरोसा कर सकते हैं।

साक्षात्कार के लिए धन्यवाद, पाठक जो अधिक जानना चाहते हैं उन्हें मैसा एआई पर जाना चाहिए।

Antoine Tardif, CEO & Founder of Unite.AI

एंटोनी एक दूरदर्शी नेता और Unite.AI के संस्थापक भागीदार हैं, जो कि एआई और रोबोटिक्स के भविष्य को आकार देने और बढ़ावा देने के लिए एक अटूट जुनून से प्रेरित हैं। एक श्रृंखला उद्यमी, वह मानता है कि एआई समाज के लिए उतना ही विघटनकारी होगा जितना कि बिजली, और अक्सर विघटनकारी प्रौद्योगिकियों और एजीआई की संभावना के बारे में उत्साहित होता है।

एक फ्यूचरिस्ट के रूप में, वह इन नवाचारों के माध्यम से हमारी दुनिया को आकार देने की खोज में समर्पित है। इसके अलावा, वह सिक्योरिटीज़.io के संस्थापक हैं, एक मंच जो भविष्य को फिर से परिभाषित करने और पूरे क्षेत्रों को फिर से आकार देने वाली अत्याधुनिक प्रौद्योगिकियों में निवेश पर केंद्रित है।

Unite.AI

मैनुअल रोमेरो, मैसा के सह-संस्थापक और मुख्य वैज्ञानिक अधिकारी – साक्षात्कार श्रृंखला

You may like