рдШреЛрд╖рдгрд╛рдПрдБ
Kumo рдиреЗ KumoRFM-2 рд▓реЙрдиреНрдЪ рдХрд┐рдпрд╛, рдПрдХ рдлрд╛рдЙрдВрдбреЗрд╢рди рдореЙрдбрд▓ рдЬреЛ рдкрд╛рд░рдВрдкрд░рд┐рдХ рдПрдВрдЯрд░рдкреНрд░рд╛рдЗрдЬ рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдХреЛ рдмрджрд▓рдиреЗ рдХреЗ рд▓рд┐рдП рдмрдирд╛рдпрд╛ рдЧрдпрд╛ рд╣реИ

कुमो ने कुमोरएफएम-2 लॉन्च किया है, एक अगली पीढ़ी का फाउंडेशन मॉडल जो विशेष रूप से संरचित एंटरप्राइज डेटा के लिए डिज़ाइन किया गया है – जो डेटा वेयरहाउस से पूर्वानुमान उत्पन्न करने के तरीके में एक मूलभूत परिवर्तन को चिह्नित करता है। पारंपरिक मशीन लर्निंग पाइपलाइनों के विपरीत, जिन्हें फीचर इंजीनियरिंग और कस्टम मॉडल विकास के महीनों की आवश्यकता होती है, कुमोरएफएम-2 टीमों को प्राकृतिक भाषा का उपयोग करके तुरंत पूर्वानुमान उत्पन्न करने में सक्षम बनाता है, बिना प्रशिक्षण या विशेषज्ञता के।
इसके मूल में, मॉडल एक新的 श्रेणी का प्रतिनिधित्व करता है: एक संबंधपरक फाउंडेशन मॉडल जो एंटरप्राइज डेटा संरचनाओं पर सीधे काम करता है, उन्हें सरलीकृत तालिकाओं में समतल करने के बजाय। यह अंतर एंटरप्राइज एआई में सबसे लगातार सीमाओं में से एक को संबोधित करता है, जहां डेटासेट के बीच मूल्यवान संबंध अक्सर मॉडलिंग शुरू होने से पहले ही खो जाते हैं।
स्टेटिक पाइपलाइन से रियल-टाइम प्रेडिक्टिव सिस्टम तक
एंटरप्राइज प्रेडिक्टिव एनालिटिक्स ऐतिहासिक रूप से धीमी और संसाधन-गहन रही है। प्रत्येक नए उपयोग के मामले – चाहे वह ग्राहक पलायन की भविष्यवाणी हो, धोखाधड़ी का पता लगाना हो, या मांग की भविष्यवाणी हो – आमतौर पर एक अलग पाइपलाइन की आवश्यकता होती है, जिसमें डेटा क्लीनिंग, फीचर इंजीनियरिंग, मॉडल प्रशिक्षण और ट्यूनिंग शामिल होती है।
कुमोरएफएम-2 पूरे वर्कफ्लो को एकल, पूर्व-प्रशिक्षित प्रणाली से बदल देता है।
इसके बजाय मॉडल बनाने, उपयोगकर्ता यह परिभाषित करते हैं कि वे क्या भविष्यवाणी करना चाहते हैं। मॉडल अनुरोध की व्याख्या करता है, अंतर्निहित डेटाबेस से आवश्यक संदर्भ का निर्माण करता है, और एक ही पास में भविष्यवाणियां उत्पन्न करता है। यह इन-कॉन्टेक्स्ट लर्निंग और प्रेडिक्टिव क्वेरी लैंग्वेज (पीक्यूएल) नामक एक घोषणात्मक इंटरफेस के संयोजन के माध्यम से संभव है, जहां उपयोगकर्ता गणना करने के लिए आवश्यक चरणों के बजाय परिणाम के बारे में व्यक्त करते हैं जिसकी उन्हें परवाह है।
परिणाम एक बदलाव है जो “मॉडल बनाने” से “प्रश्न पूछने” में स्थानांतरित हो जाता है – एक परिवर्तन जो संगठन भर में प्रेडिक्टिव एआई का उपयोग करने के लिए बाधा को काफी कम कर देता है।
संबंधपरक डेटा इतना कठिन क्यों रहा है
मौजूदा अधिकांश एआई सिस्टम संरचित एंटरप्राइज डेटा के साथ संघर्ष करते हैं एक सरल कारण से: वे इसे गलत तरीके से व्यवहार करते हैं।
पारंपरिक मॉडल, जिनमें कई टेबुलर एआई सिस्टम और यहां तक कि बड़े भाषा मॉडल भी शामिल हैं, डेटा को एकल तालिका में समतल करने पर निर्भर करते हैं। लेकिन वास्तविक दुनिया का एंटरप्राइज डेटा जुड़े हुए सिस्टम के रूप में मौजूद होता है – ग्राहक लेनदेन से जुड़े होते हैं, लेनदेन उत्पादों से जुड़े होते हैं, उत्पाद इन्वेंट्री से जुड़े होते हैं, सभी समय के साथ विकसित होते हैं।
इस संरचना को समतल करने से अक्सर सबसे मूल्यवान प्रेडिक्टिव सिग्नल वाले संबंध हट जाते हैं। यह टीमों को मैन्युअल रूप से इन संकेतों को फीचर इंजीनियरिंग के माध्यम से पुनः बनाने के लिए मजबूर करता है, जो एक समय लेने वाली और त्रुटि के लिए अतिसंवेदनशील प्रक्रिया है।
कुमोरएफएम-2 इसे पूरी तरह से टाल देता है संबंधपरक डेटाबेस पर सीधे काम करके, तालिकाओं, टाइमस्टैम्प और इकाइयों के पार संबंधों को संरक्षित करता है।
आर्किटेक्चर के अंदर: कुमोरएफएम-2 कैसे काम करता है
कुमोरएफएम-2 के पीछे मुख्य नवाचार इसका स्तरीय संबंधपरक ग्राफ ट्रांसफॉर्मर आर्किटेक्चर है, जो एक ही समय में कई स्तरों पर डेटा को संसाधित करता है।
पहले स्तर पर, मॉडल विशिष्ट तालिकाओं का विश्लेषण पंक्ति और कॉलम ध्यान के संयोजन का उपयोग करके करता है। यह इसे तालिका के भीतर विशेषताओं के संबंधों को समझने की अनुमति देता है, जबकि प्रारंभिक चरण में ही अप्रासंगिक या शोर डेटा को फिल्टर आउट करता है। महत्वपूर्ण रूप से, भविष्यवाणी लक्ष्य इस चरण में पेश किया जाता है, जिसका अर्थ है कि मॉडल शुरू से ही कार्य से सशस्त्र होता है।
दूसरे स्तर पर, मॉडल विदेशी कुंजी संबंधों का उपयोग करके तालिकाओं के पार ग्राफ-आधारित तर्क करता है – जैसे कि एक ग्राहक प्रोफ़ाइल को खरीदारी इतिहास या व्यवहार पैटर्न से जोड़ना – और क्रॉस-टेबल सिग्नल की पहचान करता है जो अन्यथा खो जाएंगे।
तीसरे स्तर पर, मॉडल क्रॉस-नमूना ध्यान को एकीकृत करता है, जिससे यह एक ही समय में कई उदाहरणों से सीखने में सक्षम हो जाता है। इससे यह एक छोटी संख्या में संदर्भ उदाहरणों से सामान्यीकरण करने में सक्षम हो जाता है, पूर्ण प्रशिक्षण डेटासेट की आवश्यकता के बजाय।
यह चरणबद्ध डिज़ाइन महत्वपूर्ण है। यह एक ही समय में प्रत्येक डेटा बिंदु को संसाधित करने से आने वाले गणनात्मक विस्फोट से बचता है, जबकि शोर को गहरे तर्क से पहले फिल्टर करके सटीकता में सुधार करता है।
इन-कॉन्टेक्स्ट लर्निंग पारंपरिक प्रशिक्षण को बदल देती है
कुमोरएफएम-2 की एक परिभाषित विशेषता इसकी पारंपरिक प्रशिक्षण के बजाय इन-कॉन्टेक्स्ट लर्निंग पर निर्भरता है।
इसके बजाय प्रत्येक कार्य के लिए एक मॉडल को प्रशिक्षित करने के, कुमोरएफएम-2 को एक बार एक बड़े मिश्रण पर पूर्व-प्रशिक्षित किया जाता है सिंथेटिक और वास्तविक दुनिया के संबंधपरक डेटा। जब एक उपयोगकर्ता एक भविष्यवाणी अनुरोध सबमिट करता है, तो प्रणाली स्वचालित रूप से एक सेट कонтेक्स्ट उदाहरणों का उत्पादन करती है – डेटाबेस के छोटे उपग्राफ जो ज्ञात परिणामों के साथ जोड़े जाते हैं।
इन उदाहरणों का उपयोग मॉडल के लिए मार्गदर्शन के रूप में किया जाता है, जिससे यह पैटर्न का अनुमान लगा सकता है और अपने वजन को अपडेट किए बिना भविष्यवाणियां कर सकता है। अभ्यास में, इसका अर्थ है:
- कार्य-विशिष्ट प्रशिक्षण नहीं
- फीचर इंजीनियरिंग नहीं
- मॉडल ट्यूनिंग नहीं
आम तौर पर पर्यवेक्षित लर्निंग के लिए आवश्यक डेटा का केवल 0.2% के साथ, मॉडल राज्य-оф-द-आर्ट प्रदर्शन प्राप्त कर सकता है।
वास्तविक दुनिया के बेंचमार्क पर प्रदर्शन
कुमोरएफएम-2 का 41 प्रेडिक्टिव कार्यों पर मूल्यांकन किया गया है जो ई-कॉमर्स, स्वास्थ्य सेवा, सामाजिक प्लेटफार्मों और एंटरप्राइज सिस्टम जैसे उद्योगों को कवर करते हैं।
मॉडल पारंपरिक पर्यवेक्षित मशीन लर्निंग दृष्टिकोणों को लगातार बेहतर बनाता है, जिनमें इंजीनियर्ड एन्सेम्बल और संबंधपरक गहरे शिक्षण प्रणाली शामिल हैं। एंटरप्राइज बेंचमार्क पर, यह व्यापक रूप से उपयोग की जाने वाली समाधानों से महत्वपूर्ण मार्जिन से बेहतर प्रदर्शन करता है, और जब समायोजित किया जाता है तो और भी बेहतर प्रदर्शन करता है।
कच्ची सटीकता से परे, मॉडल मजबूत लचीलापन प्रदर्शित करता है:
- संबंधपरक लिंक के बड़े हिस्से गायब होने पर भी प्रदर्शन बनाए रखता है
- शोर या अपूर्ण डेटा के साथ न्यूनतम क्षय को संभालता है
- historical डेटा सीमित होने पर ठंड शुरू करने वाले दृश्यों में अच्छा प्रदर्शन करता है
यह लचीलापन विशेष रूप से एंटरप्राइज वातावरण में महत्वपूर्ण है, जहां डेटा गुणवत्ता अक्सर असंगत होती है।
स्केल के लिए निर्मित: 500 अरब पंक्तियों तक
कुमोरएफएम-2 आधुनिक डेटा इन्फ्रास्ट्रक्चर के पैमाने पर काम करने के लिए डिज़ाइन किया गया है।
प्रणाली डेटाबेस-मूल निष्पादन के साथ एक कस्टम ग्राफ इंजन को जोड़कर 500 अरब पंक्तियों से अधिक के डेटासेट को संसाधित कर सकती है जो उच्च-थ्रूपुट डेटा एक्सेस के लिए सक्षम है। एक अलग एमएल सिस्टम में डेटा ले जाने के बजाय, गणना सीधे डेटा का निवास स्थान पर धक्का दी जाती है – चाहे वह एसक्यूएल डेटाबेस में हो या क्लाउड डेटा वेयरहाउस में।
इस दृष्टिकोण से विलंबता कम हो जाती है, तैनाती को सरल बनाया जाता है, और संगठनों को मौजूदा कार्यप्रवाह में सीधे प्रेडिक्टिव क्षमताओं को एकीकृत करने की अनुमति मिलती है।
प्राकृतिक भाषा के रूप में इंटरफेस
एक और परिभाषित विशेषता मॉडल का प्राकृतिक भाषा इंटरफेस है।
उपयोगकर्ता प्रश्न पूछ सकते हैं:
- अगले 30 दिनों में कौन से ग्राहक पलायन करने की संभावना है?
- कौन से लीड सबसे अधिक रूपांतरण की संभावना है?
- कौन से उत्पादों को मांग में वृद्धि देखने को मिलेगी?
प्रणाली इन प्रश्नों को संरचित प्रेडिक्टिव तर्क में अनुवादित करती है, उन्हें अंतर्निहित डेटा पर निष्पादित करती है, और भविष्यवाणियों के साथ-साथ स्पष्टीकरण भी लौटाती है।
यह न केवल प्रेडिक्टिव एनालिटिक्स को अधिक सुलभ बनाता है, बल्कि एआई एजेंटों के साथ एकीकरण को भी सक्षम बनाता है, जहां भविष्यवाणियां स्वचालित निर्णय लेने वाले कार्यप्रवाह में एम्बेड की जा सकती हैं।
एजेंट-ड्रिवन एंटरप्राइज इंटेलिजेंस की ओर
कुमोरएफएम-2 एजेंटों के साथ डिज़ाइन किया गया है।
इसकी प्रेडिक्टिव क्षमताएं “कौशल” के रूप में उजागर की जा सकती हैं जो एआई एजेंट बड़े कार्यप्रवाह के हिस्से के रूप में कॉल कर सकते हैं। इससे प्रेडिक्टिव मॉडलिंग को स्वचालित प्रणालियों में एक मॉड्यूलर बिल्डिंग ब्लॉक में बदल दिया जाता है – कुछ ऐसा जो पुनर्प्राप्ति, तर्क और निष्पादन के साथ संयुक्त किया जा सकता है।
इस संदर्भ में, मॉडल विश्लेषकों के लिए एक उपकरण नहीं है, बल्कि अगली पीढ़ी के एंटरप्राइज ऑटोमेशन के लिए एक आधारभूत परत है।
डेटा विज्ञान की भूमिका को पुनर्परिभाषित करना
कुमोरएफएम-2 यह संकेत देता है कि संगठन डेटा विज्ञान के दृष्टिकोण में एक व्यापक बदलाव है।
इसके बजाय कई कार्य-विशिष्ट मॉडल बनाने और बनाए रखने के, टीमें एकल, सामान्य-उद्देश्य प्रणाली पर भरोसा कर सकती हैं जो तुरंत नए समस्याओं के अनुकूल हो जाती है। इससे विशेषज्ञता की आवश्यकता कम हो जाती है फीचर इंजीनियरिंग और मॉडल ट्यूनिंग में, जबकि तेजी से प्रयोग और पुनरावृत्ति को सक्षम बनाता है।
कई संगठनों के लिए, इसका अर्थ एक केंद्रीकृत डेटा विज्ञान कार्य से एक अधिक वितरित मॉडल में स्थानांतरण हो सकता है, जहां प्रेडिक्टिव अंतर्दृष्टि कई विभागों में सुलभ हैं।
फाउंडेशन मॉडल की एक नई श्रेणी
जबकि फाउंडेशन मॉडल पहले से ही भाषा और दृष्टि जैसे डोमेन को बदल दिया है, संरचित एंटरप्राइज डेटा अभी भी एक अछूते क्षेत्र रहा है।
कुमोरएफएम-2 संरचित डेटा के लिए विशेषज्ञता वाले फाउंडेशन मॉडल के क्या हासिल कर सकते हैं, इसका एक प्रारंभिक उदाहरण प्रस्तुत करता है। संबंधपरक तर्क, इन-कॉन्टेक्स्ट लर्निंग और प्राकृतिक भाषा इंटरैक्शन को जोड़कर, यह प्रेडिक्टिव एआई के लिए एक नया परिदृश्य पेश करता है।
यदि व्यापक रूप से अपनाया जाता है, तो यह दृष्टिकोण व्यवसायों को उनके डेटा के साथ कैसे बातचीत करते हैं, इसे परिभाषित कर सकता है – प्रेडिक्टिव एनालिटिक्स को एक जटिल, देरी वाली प्रक्रिया से एक वास्तविक समय, संगठन व्यापी क्षमता में बदल देता है।










