рд╡рд┐рдЪрд╛рд░ рдиреЗрддрд╛
рдбреЗрдЯрд╛ рдЧреБрдгрд╡рддреНрддрд╛ рдпрд╣ рддрдп рдХрд░рддреА рд╣реИ рдХрд┐ рдПрдВрдЯрд░рдкреНрд░рд╛рдЗрдЬрд╝ рдПрдЖрдИ рд╕рдлрд▓ рд╣реЛрддрд╛ рд╣реИ рдпрд╛ рд╡рд┐рдлрд▓

ओपनएआई के चैटजीपीटी के 2022 के अंत में डेब्यू के बाद, हर कंपनी एआई के साथ तेजी से आगे बढ़ने के लिए होड़ कर रही है। बड़े हार्डवेयर प्लेयर जैसे एनवीडिया कभी के सबसे अधिक जीपीयू बेच रहे हैं, जबकि बड़े मॉडल बिल्डर जैसे ओपनएआई और एंथ्रोपिक लगातार बड़े और बड़े मॉडल बना रहे हैं।
फिर भी, सबसे उन्नत मॉडल और सबसे बड़े बजट के साथ, कई एआई परियोजनाएं अभी भी कम पड़ जाती हैं। हमने स्वास्थ्य सेवा से लेकर परिवहन से लेकर वित्त और अधिक जैसे उद्योगों में यह होते हुए देखा है। कारण दूर की कौड़ी नहीं है: एआई उतना ही अच्छा है जितना डेटा इसे प्रशिक्षित किया जाता है और जो वास्तविक समय में प्राप्त करता है। जब वह डेटा खराब लेबल वाला, पुराना या अधूरा होता है, तो कोई मॉडल सुसंगत या विश्वसनीय परिणाम नहीं दे सकता है।
और यह बड़ी समस्या है जिसका सामना आज कई कंपनियों को करना पड़ रहा है। वे एआई टूल्स में भारी निवेश करते हैं, जबकि उनके डेटा सिस्टम बिखरे हुए और अविश्वसनीय रहते हैं। परिणाम प्रगति का भ्रम है। जबकि मॉडल प्रभावशाली उत्तर देते हैं, अंतर्दृष्टि अक्सर कमजोर आधार पर आधारित होती है। एआई सफलता के लिए वास्तविक बाधा मॉडल प्रदर्शन नहीं है। यह डेटा गुणवत्ता है।
अच्छा डेटा वास्तव में क्या है
उच्च गुणवत्ता वाला डेटा केवल सटीकता के बारे में नहीं है। इसका अर्थ है जानकारी जो वर्तमान, पूर्ण और हाथ में समस्या के लिए प्रासंगिक है। कल्पना कीजिए कि एक ग्राहक ई-कॉमर्स साइट पर ऑर्डर रद्द करने की कोशिश कर रहा है। सिस्टम को ऑर्डर विवरण, शिपिंग स्थिति और भुगतान रिकॉर्ड की जांच करने की आवश्यकता है। यदि उनमें से कोई भी डेटा बिंदु अलग-अलग सिस्टम में रहते हैं जो एक दूसरे से बात नहीं करते हैं, तो एआई सहायक उपयोगी उत्तर देने में विफल रहेगा।
अच्छा डेटा इन बिंदुओं को तुरंत जोड़ता है। यह एआई को पूरी तस्वीर देखने की अनुमति देता है, न कि इसके टुकड़े। खराब डेटा, दूसरी ओर, मॉडल को अनुमान लगाने के लिए मजबूर करता है। और जब एआई अनुमान लगाना शुरू करता है, तो यह गलतियां करता है जो पैसे की लागत और विश्वास को नुकसान पहुंचाती हैं। हाल के उदाहरणों से पता चलता है कि ऐसे अनुमान कितने खतरनाक हो सकते हैं।
न्यू यॉर्क सिटी का एआई चैटबॉट पुरानी या अधूरी कानूनी जानकारी से गलत सलाह देता है। एयर कैनाडा का ग्राहक-सेवा बॉट कंपनी की नीति से संदर्भ की कमी के कारण गलत रिफंड दावे करता है। यहां तक कि बड़े भर्ती प्रणाली ने भी पक्षपातपूर्ण या गलत लेबल वाले डेटा के कारण उम्मीदवारों को गलत तरीके से फ़िल्टर किया है, जैसा कि ईईओसी के पहले एआई से संबंधित समझौते में देखा गया है। ये विफलताएं केवल तकनीकी नहीं हैं। वे प्रतिष्ठा और वित्तीय हैं, और वे एआई प्रणालियों से उत्पन्न होती हैं जिन्हें अविश्वसनीय डेटा पर प्रशिक्षित किया गया था।
उद्योग के अध्ययन इस मुद्दे के पैमाने की पुष्टि करते हैं। गार्टनर की रिपोर्ट है कि 80 प्रतिशत एआई परियोजनाएं डेटा गुणवत्ता और शासन की खराबी के कारण स्केल करने में विफल रहती हैं। इसी तरह, एमआईटी स्लोन मैनेजमेंट रिव्यू सर्वेक्षण में पाया गया कि डेटा समस्याएं, एल्गोरिदम नहीं, उद्यम एआई परियोजनाओं के पतन का शीर्ष कारण हैं।
संस्कृति कोड के रूप में महत्वपूर्ण है
डेटा गुणवत्ता में सुधार करना कुछ ऐसा नहीं है जिसे आप एक ही टूल या कमांड के साथ ठीक कर सकते हैं। इसके लिए सांस्कृतिक परिवर्तन की आवश्यकता है। यही कारण है कि व्यवसायिक नेताओं को डेटा को एक जीवित प्रणाली के रूप में मानना चाहिए जिसे देखभाल और जवाबदेही की आवश्यकता है। यह केवल यह घोषित करने के बारे में नहीं है कि आप “डेटा को बेहतर बनाना चाहते हैं” – यह पर्याप्त नहीं है। संगठन के हर हिस्से को यह समझने की आवश्यकता है कि जानकारी कैसे चलती है, इसका मालिक कौन है, और जब यह बदलता है तो क्या होता है।
हमने देखा है कि यह वास्तविक दुनिया की प्रणालियों में कैसे खेलता है। कई एआई अनुप्रयोग रात के समय डेटा अपडेट पर निर्भर करते हैं। यदि आपका डेटाबेस प्रतिदिन एक बार ताज़ा होता है, तो आपके मॉडल का ज्ञान वास्तविकता से हमेशा पीछे रहेगा। तेजी से बदलते वातावरण में, यह देरी पुरानी अंतर्दृष्टि और खराब निर्णयों का कारण बन सकती है। कंपनियों को अपने पूरे डेटा प्रवाह को फिर से सोचने की आवश्यकता है – जानकारी कैसे एकत्र की जाती है, यह मॉडल तक कैसे पहुंचाई जाती है।
इसे अच्छी तरह से करने से बड़ा समय और लागत बच सकती है। जब डेटा पाइपलाइनें स्पष्टता और उद्देश्य के साथ डिज़ाइन की जाती हैं, तो एआई सिस्टम सबसे हाल की और प्रासंगिक जानकारी पर सीख और कार्य कर सकते हैं। जब वे नहीं होते हैं, तो टीमें डेटा को साफ करने में अधिक समय बिताती हैं niż इसका उपयोग करने में।
डेटा प्रबंधन में विशेषज्ञ अक्सर यह इंगित करते हैं कि मजबूत डेटा गुणवत्ता की कुंजी लोगों, प्रक्रियाओं और प्लेटफ़ॉर्म के बीच फीडबैक लूप है। उस लूप के बिना, जानकारी स्टेल हो जाती है और मॉडल वास्तविक दुनिया की स्थितियों से संपर्क खो देते हैं – एक समस्या जिसे कभी-कभी डेटा ड्रिफ्ट कहा जाता है।
गति के साथ एकता का संतुलन
आमतौर पर तेजी से आगे बढ़ने और सटीक रहने के बीच तनाव होता है। कई संगठन अपने एआई निवेश से तुरंत परिणाम चाहते हैं, लेकिन जल्दबाजी बाद में बड़ी समस्याएं पैदा कर सकती है। लक्ष्य डेटा लचीलापन के साथ अखंडता होना चाहिए। दूसरे शब्दों में, ऐसे सिस्टम बनाना जो तेजी से चले बिना सटीकता खोए।
इस बिंदु पर, हर कंपनी को डेटा के लिए स्पष्ट मार्ग निर्धारित करना चाहिए ताकि यह मॉडल तक वास्तविक समय में पहुंच सके। यह भी मदद करता है कि किस प्रकार की जानकारी की अनुमति है और क्या बाहर रहना चाहिए। संवेदनशील या निजी डेटा को मॉडल तक कभी नहीं पहुंचना चाहिए, भले ही उपयोगकर्ता के पास तकनीकी रूप से इसकी पहुंच हो। इस सीमा की रक्षा करने से विश्वास बनता है और एआई सिस्टम को रिसाव या जानकारी का दुरुपयोग करने से रोकता है।
जैसे-जैसे एआई अधिक स्वायत्त होता जा रहा है, मानव पर्यवेक्षण महत्वपूर्ण बना हुआ है। मॉडल को व्यवसायिक क्रियाओं पर पूर्ण नियंत्रण नहीं होना चाहिए। यह निर्णय लेने के लिए भी नहीं होना चाहिए। इसके बजाय, यह अनुरोध करना चाहिए। अधिक महत्वपूर्ण बात, मानवों को हमेशा इसकी क्रियाओं की समीक्षा और अनुमोदन करना चाहिए ताकि यह सुनिश्चित किया जा सके कि वे कंपनी की नीति और विनियमन के अनुरूप हैं।
नीचे से गुणवत्ता का निर्माण
पैमाने पर डेटा गुणवत्ता को बनाए रखना केवल त्रुटियों को साफ करने की बात नहीं है। यह वास्तुकला से शुरू होता है। आपको यह पहचानने की आवश्यकता है कि आपका सबसे विश्वसनीय डेटा कहां रहता है, फिर एक प्रणाली को डिज़ाइन करें जो इसे एक विश्वसनीय स्थान पर एक साथ लाता है। वहां से, आप ट्रैक कर सकते हैं कि मॉडल किस डेटा का उपयोग करता है और यह कहां से आता है।
यह दृष्टिकोण भ्रम को रोकता है और प्रणाली को पारदर्शी बनाए रखता है। यह टीमों को त्रुटियों को तेजी से ठीक करने में भी मदद करता है जब कुछ गलत हो जाता है। जब आप जानते हैं कि कौन सा डेटा मॉडल के उत्तर को खिलाता है, तो आप मुद्दों को ठीक कर सकते हैं और उन्हें फैलने से पहले ठीक कर सकते हैं।
एंटरप्राइज़ एआई का भविष्य उन कंपनियों का होगा जो अपने बुनियादी ढांचे में गुणवत्ता को डिफ़ॉल्ट रूप से एम्बेड करती हैं। हम अधिक प्लग-एंड-प्ले एआई सिस्टम देखने की उम्मीद करते हैं जो एक ही पैकेज में तर्क और डेटा एकीकरण दोनों को संभालते हैं। ये “एआई अप्लायंस” संगठनों को डेटा नियंत्रण खोए बिना स्मार्ट सिस्टम तैनात करना आसान बना सकते हैं।
विश्लेषकों का अनुमान है कि जो संगठन अपने डेटा को प्रभावी ढंग से एकजुट और शासित कर सकते हैं, वे एआई परियोजनाओं से तेजी से अपनाने और उच्च आरओआई देखेंगे। एक हालिया रिपोर्ट डेटा तैयारी पर यह बताती है कि यह क्षमता उन कंपनियों को अलग करती है जो निरंतर नवाचार करती हैं जिन लोगों के पास शुरुआती पायलट के बाद रुक जाते हैं। अंतर अक्सर इस बात पर निर्भर करता है कि उनकी एआई प्रणालियां संगत, अच्छी तरह से संरचित जानकारी पर बनाई गई हैं या नहीं।
नीचे की पंक्ति
डेटा गुणवत्ता एआई में से ब्रेकथ्रू की तुलना में उत्साहजनक नहीं लग सकती है, लेकिन यह शांत बल है जो तय करता है कि एआई सफल होता है या विफल होता है। साफ, वर्तमान और सुसंगत डेटा के बिना, सबसे चतुर प्रणालियां भी ठोकर खाएंगी। इसके साथ, यहां तक कि विनम्र एआई परियोजनाएं भी स्थायी मूल्य बना सकती हैं।
प्रत्येक नेता को एआई में निवेश करना चाहिए जो एक सरल प्रश्न पूछना चाहिए: क्या हम उस डेटा पर विश्वास करते हैं जो हमारे निर्णयों को चलाता है? जो कुछ हमने देखा है, उसके अनुसार, जो कंपनियां आत्मविश्वास से “हां” कह सकती हैं, वे एआई दौड़ में पहले से ही अग्रणी हैं।












