साक्षात्कार
मैनुअल रोमेरो, मैसा के सह-संस्थापक और मुख्य वैज्ञानिक अधिकारी – साक्षात्कार श्रृंखला

मैनुअल रोमेरो, मैसा के सह-संस्थापक और मुख्य वैज्ञानिक अधिकारी, एक एआई शोधकर्ता और इंजीनियर हैं जो विश्वसनीय, एंटरप्राइज़-ग्रेड कृत्रिम बुद्धिमत्ता प्रणालियों के विकास पर केंद्रित हैं। उन्होंने 2024 में जवाबदेह एआई बनाने के लिए मैसा की सह-स्थापना की, जो पारदर्शिता और नियंत्रण के साथ जटिल व्यावसायिक प्रक्रियाओं को निष्पादित करने में सक्षम है। मैसा से पहले, रोमेरो ने क्लिब्रेन और नैरेटिवा जैसी कंपनियों में वरिष्ठ एआई इंजीनियरिंग और मशीन लर्निंग की भूमिकाएँ निभाईं, जहाँ उन्होंने प्राकृतिक भाषा प्रसंस्करण और बड़े पैमाने की एआई प्रणालियों में विशेषज्ञता हासिल की। अपने करियर की शुरुआत में उन्होंने एक फुल-स्टैक सॉफ्टवेयर इंजीनियर और डेवऑप्स विशेषज्ञ के रूप में काम किया, इससे पहले कि वे उन्नत एआई अनुसंधान और विकास में संक्रमण करते, और ओपन-सोर्स एआई पारिस्थितिकी तंत्र के एक सक्रिय योगदानकर्ता बन गए। मैसा एआई स्वायत्त “डिजिटल कर्मचारियों” का विकास करती है, ये एआई एजेंट जटिल एंटरप्राइज़ वर्कफ़्लो को स्वचालित करने के लिए डिज़ाइन किए गए हैं, जबकि ट्रेसबिलिटी, गवर्नेंस और विश्वसनीयता बनाए रखते हैं। यह प्लेटफ़ॉर्म संगठनों को प्राकृतिक भाषा का उपयोग करके एआई एजेंट बनाने और तैनात करने की अनुमति देता है, जिससे व्यापक कोडिंग के बिना आंतरिक सिस्टम और डेटा स्रोतों में स्वचालन सक्षम होता है। सत्यापन योग्य तर्क और संरचित निष्पादन पर ध्यान केंद्रित करके, मैसा का लक्ष्य जेनरेटिव एआई सिस्टम से जुड़ी सामान्य सीमाओं को दूर करना और उद्यमों को बड़े पैमाने पर स्वायत्त एआई को सुरक्षित रूप से तैनात करने में मदद करना है। आपने अक्सर एआई सिस्टम के पीछे गहरे “क्यों” को समझने पर ध्यान केंद्रित किया है। तकनीकी दृष्टिकोण से, 2024 में मैसा की सह-स्थापना करने के लिए आपको किस चीज़ ने प्रेरित किया, और एंटरप्राइज़ एआई आर्किटेक्चर में आपको कौन सा अंतर दिखा जिसे संबोधित नहीं किया जा रहा था? मैसा की स्थापना की प्रेरणा इस अहसास से आई कि अधिकांश एंटरप्राइज़ एआई स्टैक सिस्टम के बजाय मॉडलों के इर्द-गिर्द बने थे। जेनरेटिव एआई के उछाल के दौरान, कई कंपनियों ने मौजूदा वर्कफ़्लो में बड़े भाषा मॉडल को एकीकृत करने पर ध्यान केंद्रित किया। हालाँकि, ये सिस्टम अक्सर नाजुक, अपारदर्शी और बड़े पैमाने पर संचालित करने में कठिन थे। उनमें कमी थी:
- निर्धारक निष्पादन जहाँ इसकी आवश्यकता थी।
- मजबूत अवलोकन क्षमता, ट्रेसबिलिटी
- पुनरुत्पादन क्षमता
हमें जो अंतर दिखा वह उद्यमों के लिए वास्तविक एआई बुनियादी ढाँचे की अनुपस्थिति थी। कंपनियाँ एलएलएम एपीआई के आसपास अनुप्रयोग बना रही थीं, लेकिन उनके पास ज्ञान कार्य के लिए कंप्यूटर आर्किटेक्चर के समकक्ष कुछ भी नहीं था। मैसा को उस अंतर को संबोधित करने के लिए बनाया गया था, ज्ञान प्रसंस्करण इकाई (केपीयू) के इर्द-गिर्द केंद्रित एक आर्किटेक्चर को डिजाइन करके, एक ऐसी प्रणाली जो एआई को वास्तविक एंटरप्राइज़ वर्कफ़्लो के भीतर विश्वसनीय रूप से काम करने में सक्षम बनाती है। मैसा की स्थापना से पहले आपने उन्नत प्राकृतिक भाषा प्रसंस्करण और जेनरेटिव सिस्टम में काम किया है। उन अनुभवों ने प्लेटफ़ॉर्म के पीछे के वास्तुशिल्प विकल्पों को कैसे आकार दिया? एनएलपी और एनएलजी में काम करने के मेरे अनुभव, विशेष रूप से भाषा मॉडल और बाद में बड़े भाषा मॉडल (सैकड़ों) के प्रशिक्षण और पूर्व-प्रशिक्षण के आसपास, ने उनके ऊपर वास्तविक सिस्टम बनाने की कोशिश करते समय एक बात बहुत स्पष्ट कर दी। ट्रांसफॉर्मर आर्किटेक्चर अत्यंत शक्तिशाली है, लेकिन इसमें कम से कम तीन मौलिक सीमाएँ हैं जिन्हें उत्पादन में विश्वसनीय रूप से उपयोग करने के लिए संबोधित किया जाना चाहिए। पहली है भ्रम। ये मॉडल संभाव्य रूप से पाठ उत्पन्न करते हैं और ऐसे आउटपुट पैदा कर सकते हैं जो सही लगते हैं लेकिन सत्यापित जानकारी पर आधारित नहीं होते। दूसरी है संदर्भ सीमाएँ। बड़ी संदर्भ विंडो के साथ भी, मॉडल एक सीमित टोकन स्पेस के भीतर काम करते हैं, जो बड़े या जटिल ज्ञान निकायों पर तर्क करना मुश्किल बना देता है। तीसरी है नवीनतम जानकारी। पूर्व-प्रशिक्षित मॉडल प्रशिक्षण के समय ज्ञान का एक स्नैपशॉट दर्शाते हैं, जबकि एंटरप्राइज़ वातावरण को ऐसी प्रणालियों की आवश्यकता होती है जो लगातार बदलती जानकारी पर तर्क कर सकें। इन बाधाओं को पहचानने ने मैसा के पीछे कई वास्तुशिल्प निर्णयों को आकार दिया। अकेले मॉडल पर निर्भर रहने के बजाय, हमने एक ऐसी प्रणाली बनाने पर ध्यान केंद्रित किया जो संरचित ज्ञान तक पहुँच, सत्यापन तंत्र और नियंत्रित निष्पादन प्रदान करती है ताकि एआई वास्तविक एंटरप्राइज़ वर्कफ़्लो में विश्वसनीय रूप से काम कर सके। कई उद्यम जेनरेटिव एआई के साथ प्रयोग करते हैं लेकिन पायलट परियोजनाओं से आगे बढ़ने में संघर्ष करते हैं। सिस्टम डिज़ाइन के दृष्टिकोण से, इतने सारे संगठनों में स्केलिंग विफल होने का मूल कारण क्या है? कई उद्यम जेनरेटिव एआई पायलट से आगे बढ़ने में संघर्ष करते हैं क्योंकि अधिकांश तैनाती मजबूत सिस्टम के बजाय प्रयोगों के रूप में बनाई जाती हैं। प्रारंभिक प्रोटोटाइप अक्सर प्रॉम्प्ट इंजीनियरिंग, हल्के ऑर्केस्ट्रेशन और सरल पुनर्प्राप्ति पाइपलाइनों पर निर्भर करते हैं, जो मूल्य प्रदर्शित कर सकते हैं लेकिन उत्पादन वातावरण के लिए आवश्यक विश्वसनीयता, अवलोकन क्षमता या नियंत्रण प्रदान नहीं करते हैं। जैसे-जैसे संगठन इन सिस्टम को स्केल करने का प्रयास करते हैं, उन्हें असंगत आउटपुट, ट्रेसबिलिटी की कमी, एंटरप्राइज़ वर्कफ़्लो के साथ एकीकरण में कठिनाई और एआई के व्यवहार पर सीमित शासन जैसी समस्याओं का सामना करना पड़ता है। इसके मूल में, समस्या यह है कि बड़े भाषा मॉडल संभाव्य जनरेटर हैं, जबकि एंटरप्राइज़ प्रक्रियाओं को अनुमानित और ऑडिट योग्य व्यवहार की आवश्यकता होती है। एक ऐसी आर्किटेक्चर के बिना जो तर्क, सत्यापन, निष्पादन और निगरानी के चारों ओर संरचना जोड़ती है, जेनरेटिव एआई सिस्टम अलग-थलग उपयोग मामलों से परे स्केल करना मुश्किल बने रहते हैं। मैसा के डिजिटल कर्मचारियों को विशुद्ध रूप से संभाव्य होने के बजाय ऑडिट योग्य और संरचित होने के लिए डिज़ाइन किया गया है। उत्पादन उपयोग के लिए एआई का मूल्यांकन करने वाले उद्यमों के लिए व्यावहारिक रूप से इसका क्या अर्थ है? जब हम कहते हैं कि मैसा के डिजिटल कर्मचारी विशुद्ध रूप से संभाव्य होने के बजाय ऑडिट योग्य और संरचित हैं, तो हमारा मतलब है कि एआई एक नियंत्रित प्रणाली के भीतर काम करता है जहाँ इसकी कार्रवाइयों और तर्क का पता लगाया और शासित किया जा सकता है। किसी मॉडल को स्वतंत्र रूप से आउटपुट और निर्णय उत्पन्न करने की अनुमति देने के बजाय, सिस्टम यह संरचित करता है कि एआई डेटा, टूल और वर्कफ़्लो के साथ कैसे इंटरैक्ट करता है। प्रक्रिया के प्रत्येक चरण को लॉग, निरीक्षण और सत्यापित किया जा सकता है, और कार्रवाइयों को सीधे मॉडल आउटपुट से नहीं बल्कि परिभाषित इंटरफेस के माध्यम से निष्पादित किया जाता है। उद्यमों के लिए, इसका मतलब है कि एआई सिस्टम को अधिक आत्मविश्वास के साथ निगरानी, ऑडिट और महत्वपूर्ण प्रक्रियाओं में एकीकृत किया जा सकता है। यह एआई को एक ब्लैक-बॉक्स सहायक से एक ऐसी प्रणाली में बदल देता है जिसके व्यवहार को उत्पादन वातावरण में समझा, नियंत्रित और भरोसा किया जा सकता है। ज्ञान प्रसंस्करण इकाई के वास्तुकार के रूप में, यह बड़े भाषा मॉडल के आसपास बने एक सामान्य ऑर्केस्ट्रेशन लेयर या वर्कफ़्लो इंजन से कैसे भिन्न है? ज्ञान प्रसंस्करण इकाई सामान्य ऑर्केस्ट्रेशन परतों से इसलिए भिन्न है क्योंकि इसे केवल प्रॉम्प्ट और मॉडल कॉल को समन्वयित करने के बजाय एआई-संचालित तर्क के पूर्ण जीवनचक्र को प्रबंधित करने के लिए डिज़ाइन किया गया है। अधिकांश ऑर्केस्ट्रेशन फ्रेमवर्क वर्कफ़्लो प्रबंधक के रूप में कार्य करते हैं जो पुनर्प्राप्ति, प्रॉम्प्टिंग और टूल निष्पादन जैसे चरणों को एक साथ जोड़ते हैं। केपीयू एक गहरे वास्तुशिल्प स्तर पर काम करता है, यह संरचित करके कि ज्ञान तक कैसे पहुँचा जाता है, तर्क कैसे किया जाता है और सिस्टम के भीतर कार्रवाइयाँ कैसे निष्पादित की जाती हैं। यह ज्ञान प्रसंस्करण को एक मूल कम्प्यूटेशनल परत के रूप में मानता है, स्मृति, सत्यापन और नियंत्रित निष्पाद












