Connect with us

рдбреЗрдЯрд╛ рдЧреБрдгрд╡рддреНрддрд╛ рдпрд╣ рддрдп рдХрд░рддреА рд╣реИ рдХрд┐ рдПрдВрдЯрд░рдкреНрд░рд╛рдЗрдЬрд╝ рдПрдЖрдИ рд╕рдлрд▓ рд╣реЛрддрд╛ рд╣реИ рдпрд╛ рд╡рд┐рдлрд▓

рд╡рд┐рдЪрд╛рд░ рдиреЗрддрд╛

рдбреЗрдЯрд╛ рдЧреБрдгрд╡рддреНрддрд╛ рдпрд╣ рддрдп рдХрд░рддреА рд╣реИ рдХрд┐ рдПрдВрдЯрд░рдкреНрд░рд╛рдЗрдЬрд╝ рдПрдЖрдИ рд╕рдлрд▓ рд╣реЛрддрд╛ рд╣реИ рдпрд╛ рд╡рд┐рдлрд▓

mm

ओपनएआई के चैटजीपीटी के 2022 के अंत में डेब्यू के बाद, हर कंपनी एआई के साथ तेजी से आगे बढ़ने के लिए होड़ कर रही है। बड़े हार्डवेयर प्लेयर जैसे एनवीडिया कभी के सबसे अधिक जीपीयू बेच रहे हैं, जबकि बड़े मॉडल बिल्डर जैसे ओपनएआई और एंथ्रोपिक लगातार बड़े और बड़े मॉडल बना रहे हैं।

फिर भी, सबसे उन्नत मॉडल और सबसे बड़े बजट के साथ, कई एआई परियोजनाएं अभी भी कम पड़ जाती हैं। हमने स्वास्थ्य सेवा से लेकर परिवहन से लेकर वित्त और अधिक जैसे उद्योगों में यह होते हुए देखा है। कारण दूर की कौड़ी नहीं है: एआई उतना ही अच्छा है जितना डेटा इसे प्रशिक्षित किया जाता है और जो वास्तविक समय में प्राप्त करता है। जब वह डेटा खराब लेबल वाला, पुराना या अधूरा होता है, तो कोई मॉडल सुसंगत या विश्वसनीय परिणाम नहीं दे सकता है।

और यह बड़ी समस्या है जिसका सामना आज कई कंपनियों को करना पड़ रहा है। वे एआई टूल्स में भारी निवेश करते हैं, जबकि उनके डेटा सिस्टम बिखरे हुए और अविश्वसनीय रहते हैं। परिणाम प्रगति का भ्रम है। जबकि मॉडल प्रभावशाली उत्तर देते हैं, अंतर्दृष्टि अक्सर कमजोर आधार पर आधारित होती है। एआई सफलता के लिए वास्तविक बाधा मॉडल प्रदर्शन नहीं है। यह डेटा गुणवत्ता है।

अच्छा डेटा वास्तव में क्या है

उच्च गुणवत्ता वाला डेटा केवल सटीकता के बारे में नहीं है। इसका अर्थ है जानकारी जो वर्तमान, पूर्ण और हाथ में समस्या के लिए प्रासंगिक है। कल्पना कीजिए कि एक ग्राहक ई-कॉमर्स साइट पर ऑर्डर रद्द करने की कोशिश कर रहा है। सिस्टम को ऑर्डर विवरण, शिपिंग स्थिति और भुगतान रिकॉर्ड की जांच करने की आवश्यकता है। यदि उनमें से कोई भी डेटा बिंदु अलग-अलग सिस्टम में रहते हैं जो एक दूसरे से बात नहीं करते हैं, तो एआई सहायक उपयोगी उत्तर देने में विफल रहेगा।

अच्छा डेटा इन बिंदुओं को तुरंत जोड़ता है। यह एआई को पूरी तस्वीर देखने की अनुमति देता है, न कि इसके टुकड़े। खराब डेटा, दूसरी ओर, मॉडल को अनुमान लगाने के लिए मजबूर करता है। और जब एआई अनुमान लगाना शुरू करता है, तो यह गलतियां करता है जो पैसे की लागत और विश्वास को नुकसान पहुंचाती हैं। हाल के उदाहरणों से पता चलता है कि ऐसे अनुमान कितने खतरनाक हो सकते हैं।

न्यू यॉर्क सिटी का एआई चैटबॉट पुरानी या अधूरी कानूनी जानकारी से गलत सलाह देता है। एयर कैनाडा का ग्राहक-सेवा बॉट कंपनी की नीति से संदर्भ की कमी के कारण गलत रिफंड दावे करता है। यहां तक कि बड़े भर्ती प्रणाली ने भी पक्षपातपूर्ण या गलत लेबल वाले डेटा के कारण उम्मीदवारों को गलत तरीके से फ़िल्टर किया है, जैसा कि ईईओसी के पहले एआई से संबंधित समझौते में देखा गया है। ये विफलताएं केवल तकनीकी नहीं हैं। वे प्रतिष्ठा और वित्तीय हैं, और वे एआई प्रणालियों से उत्पन्न होती हैं जिन्हें अविश्वसनीय डेटा पर प्रशिक्षित किया गया था।

उद्योग के अध्ययन इस मुद्दे के पैमाने की पुष्टि करते हैं। गार्टनर की रिपोर्ट है कि 80 प्रतिशत एआई परियोजनाएं डेटा गुणवत्ता और शासन की खराबी के कारण स्केल करने में विफल रहती हैं। इसी तरह, एमआईटी स्लोन मैनेजमेंट रिव्यू सर्वेक्षण में पाया गया कि डेटा समस्याएं, एल्गोरिदम नहीं, उद्यम एआई परियोजनाओं के पतन का शीर्ष कारण हैं।

संस्कृति कोड के रूप में महत्वपूर्ण है

डेटा गुणवत्ता में सुधार करना कुछ ऐसा नहीं है जिसे आप एक ही टूल या कमांड के साथ ठीक कर सकते हैं। इसके लिए सांस्कृतिक परिवर्तन की आवश्यकता है। यही कारण है कि व्यवसायिक नेताओं को डेटा को एक जीवित प्रणाली के रूप में मानना चाहिए जिसे देखभाल और जवाबदेही की आवश्यकता है। यह केवल यह घोषित करने के बारे में नहीं है कि आप “डेटा को बेहतर बनाना चाहते हैं” – यह पर्याप्त नहीं है। संगठन के हर हिस्से को यह समझने की आवश्यकता है कि जानकारी कैसे चलती है, इसका मालिक कौन है, और जब यह बदलता है तो क्या होता है।

हमने देखा है कि यह वास्तविक दुनिया की प्रणालियों में कैसे खेलता है। कई एआई अनुप्रयोग रात के समय डेटा अपडेट पर निर्भर करते हैं। यदि आपका डेटाबेस प्रतिदिन एक बार ताज़ा होता है, तो आपके मॉडल का ज्ञान वास्तविकता से हमेशा पीछे रहेगा। तेजी से बदलते वातावरण में, यह देरी पुरानी अंतर्दृष्टि और खराब निर्णयों का कारण बन सकती है। कंपनियों को अपने पूरे डेटा प्रवाह को फिर से सोचने की आवश्यकता है – जानकारी कैसे एकत्र की जाती है, यह मॉडल तक कैसे पहुंचाई जाती है।

इसे अच्छी तरह से करने से बड़ा समय और लागत बच सकती है। जब डेटा पाइपलाइनें स्पष्टता और उद्देश्य के साथ डिज़ाइन की जाती हैं, तो एआई सिस्टम सबसे हाल की और प्रासंगिक जानकारी पर सीख और कार्य कर सकते हैं। जब वे नहीं होते हैं, तो टीमें डेटा को साफ करने में अधिक समय बिताती हैं niż इसका उपयोग करने में।

डेटा प्रबंधन में विशेषज्ञ अक्सर यह इंगित करते हैं कि मजबूत डेटा गुणवत्ता की कुंजी लोगों, प्रक्रियाओं और प्लेटफ़ॉर्म के बीच फीडबैक लूप है। उस लूप के बिना, जानकारी स्टेल हो जाती है और मॉडल वास्तविक दुनिया की स्थितियों से संपर्क खो देते हैं – एक समस्या जिसे कभी-कभी डेटा ड्रिफ्ट कहा जाता है।

गति के साथ एकता का संतुलन

आमतौर पर तेजी से आगे बढ़ने और सटीक रहने के बीच तनाव होता है। कई संगठन अपने एआई निवेश से तुरंत परिणाम चाहते हैं, लेकिन जल्दबाजी बाद में बड़ी समस्याएं पैदा कर सकती है। लक्ष्य डेटा लचीलापन के साथ अखंडता होना चाहिए। दूसरे शब्दों में, ऐसे सिस्टम बनाना जो तेजी से चले बिना सटीकता खोए।

इस बिंदु पर, हर कंपनी को डेटा के लिए स्पष्ट मार्ग निर्धारित करना चाहिए ताकि यह मॉडल तक वास्तविक समय में पहुंच सके। यह भी मदद करता है कि किस प्रकार की जानकारी की अनुमति है और क्या बाहर रहना चाहिए। संवेदनशील या निजी डेटा को मॉडल तक कभी नहीं पहुंचना चाहिए, भले ही उपयोगकर्ता के पास तकनीकी रूप से इसकी पहुंच हो। इस सीमा की रक्षा करने से विश्वास बनता है और एआई सिस्टम को रिसाव या जानकारी का दुरुपयोग करने से रोकता है।

जैसे-जैसे एआई अधिक स्वायत्त होता जा रहा है, मानव पर्यवेक्षण महत्वपूर्ण बना हुआ है। मॉडल को व्यवसायिक क्रियाओं पर पूर्ण नियंत्रण नहीं होना चाहिए। यह निर्णय लेने के लिए भी नहीं होना चाहिए। इसके बजाय, यह अनुरोध करना चाहिए। अधिक महत्वपूर्ण बात, मानवों को हमेशा इसकी क्रियाओं की समीक्षा और अनुमोदन करना चाहिए ताकि यह सुनिश्चित किया जा सके कि वे कंपनी की नीति और विनियमन के अनुरूप हैं।

नीचे से गुणवत्ता का निर्माण

पैमाने पर डेटा गुणवत्ता को बनाए रखना केवल त्रुटियों को साफ करने की बात नहीं है। यह वास्तुकला से शुरू होता है। आपको यह पहचानने की आवश्यकता है कि आपका सबसे विश्वसनीय डेटा कहां रहता है, फिर एक प्रणाली को डिज़ाइन करें जो इसे एक विश्वसनीय स्थान पर एक साथ लाता है। वहां से, आप ट्रैक कर सकते हैं कि मॉडल किस डेटा का उपयोग करता है और यह कहां से आता है।

यह दृष्टिकोण भ्रम को रोकता है और प्रणाली को पारदर्शी बनाए रखता है। यह टीमों को त्रुटियों को तेजी से ठीक करने में भी मदद करता है जब कुछ गलत हो जाता है। जब आप जानते हैं कि कौन सा डेटा मॉडल के उत्तर को खिलाता है, तो आप मुद्दों को ठीक कर सकते हैं और उन्हें फैलने से पहले ठीक कर सकते हैं।

एंटरप्राइज़ एआई का भविष्य उन कंपनियों का होगा जो अपने बुनियादी ढांचे में गुणवत्ता को डिफ़ॉल्ट रूप से एम्बेड करती हैं। हम अधिक प्लग-एंड-प्ले एआई सिस्टम देखने की उम्मीद करते हैं जो एक ही पैकेज में तर्क और डेटा एकीकरण दोनों को संभालते हैं। ये “एआई अप्लायंस” संगठनों को डेटा नियंत्रण खोए बिना स्मार्ट सिस्टम तैनात करना आसान बना सकते हैं।

विश्लेषकों का अनुमान है कि जो संगठन अपने डेटा को प्रभावी ढंग से एकजुट और शासित कर सकते हैं, वे एआई परियोजनाओं से तेजी से अपनाने और उच्च आरओआई देखेंगे। एक हालिया रिपोर्ट डेटा तैयारी पर यह बताती है कि यह क्षमता उन कंपनियों को अलग करती है जो निरंतर नवाचार करती हैं जिन लोगों के पास शुरुआती पायलट के बाद रुक जाते हैं। अंतर अक्सर इस बात पर निर्भर करता है कि उनकी एआई प्रणालियां संगत, अच्छी तरह से संरचित जानकारी पर बनाई गई हैं या नहीं।

नीचे की पंक्ति

डेटा गुणवत्ता एआई में से ब्रेकथ्रू की तुलना में उत्साहजनक नहीं लग सकती है, लेकिन यह शांत बल है जो तय करता है कि एआई सफल होता है या विफल होता है। साफ, वर्तमान और सुसंगत डेटा के बिना, सबसे चतुर प्रणालियां भी ठोकर खाएंगी। इसके साथ, यहां तक कि विनम्र एआई परियोजनाएं भी स्थायी मूल्य बना सकती हैं।

प्रत्येक नेता को एआई में निवेश करना चाहिए जो एक सरल प्रश्न पूछना चाहिए: क्या हम उस डेटा पर विश्वास करते हैं जो हमारे निर्णयों को चलाता है? जो कुछ हमने देखा है, उसके अनुसार, जो कंपनियां आत्मविश्वास से “हां” कह सकती हैं, वे एआई दौड़ में पहले से ही अग्रणी हैं।

рдУрд░реЗрди рдИрдиреА RavenDB рдХреЗ рд╕рдВрд╕реНрдерд╛рдкрдХ рдФрд░ рд╕реАрдИрдУ рд╣реИрдВ, рдПрдХ рдорд▓реНрдЯреА-рдореЙрдбрд▓ рдиреЛрд╕реНрдХреНрдпреВрдПрд▓ рдбреЙрдХреНрдпреВрдореЗрдВрдЯ рдбреЗрдЯрд╛рдмреЗрд╕ рдЬрд┐рд╕реЗ рд╡рд┐рд╢реНрд╡рднрд░ рдХреЗ рдбреЗрд╡рд▓рдкрд░реНрд╕ рдФрд░ рдЙрджреНрдпрдореЛрдВ рджреНрд╡рд╛рд░рд╛ рд╡рд┐рд╢реНрд╡рд╛рд╕ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдЗрд╕рдХреЗ рдЕрд▓рд╛рд╡рд╛ рд░реЗрд╡реЗрдирдбреАрдмреА рдбреЗрдЯрд╛рдмреЗрд╕ рдХреЗ рд╡рд┐рдХрд╛рд╕ рдФрд░ рд╡рд┐рд╕реНрддрд╛рд░ рдХреЗ рдкреАрдЫреЗ рдХреА рд╢рдХреНрддрд┐ рд╣реЛрдиреЗ рдХреЗ, рдУрд░реЗрди рдПрдХ рдЙрддреНрд╕рд╛рд╣реА рдмреНрд▓реЙрдЧрд░ рд╣реИрдВ рдФрд░ рд╡рд┐рд╢реНрд╡рднрд░ рдореЗрдВ рдЙрджреНрдпреЛрдЧ рдХреА рдШрдЯрдирд╛рдУрдВ рдореЗрдВ рдирд┐рдпрдорд┐рдд рд░реВрдк рд╕реЗ рдмреЛрд▓рддреЗ рд╣реИрдВред