Connect with us

कंप्यूटर वैज्ञानिक एआई में पूर्वाग्रह से निपटते हैं

कृत्रिम बुद्धिमत्ता

कंप्यूटर वैज्ञानिक एआई में पूर्वाग्रह से निपटते हैं

mm

प्रिंसटन और स्टैनफोर्ड विश्वविद्यालय के कंप्यूटर वैज्ञानिक अब कृत्रिम बुद्धिमत्ता (एआई) में पूर्वाग्रह की समस्याओं का समाधान कर रहे हैं। वे निष्पक्ष डेटा सेट तैयार करने के तरीकों पर काम कर रहे हैं जिनमें लोगों की तस्वीरें हैं। शोधकर्ता इमेजनेट के साथ मिलकर काम कर रहे हैं, जो 13 मिलियन से अधिक छवियों का एक डेटाबेस है। पिछले दशक में, इमेजनेट ने कंप्यूटर दृष्टि को आगे बढ़ाने में मदद की है। अपने तरीकों का उपयोग करके, शोधकर्ताओं ने तब डेटाबेस में सुधार के लिए सिफारिशें कीं।

इमेजनेट में वस्तुओं, परिदृश्य और लोगों की तस्वीरें शामिल हैं। छवियों को वर्गीकृत करने वाले मशीन लर्निंग एल्गोरिदम बनाने वाले शोधकर्ता इमेजनेट का उपयोग डेटा के स्रोत के रूप में करते हैं। डेटाबेस के विशाल आकार के कारण, स्वचालित छवि संग्रह और भीड़ से छवि एनोटेशन की आवश्यकता थी। अब, इमेजनेट टीम पूर्वाग्रह और अन्य मुद्दों को ठीक करने के लिए काम कर रही है। अक्सर छवियों में लोग होते हैं जो इमेजनेट के निर्माण के अनपेक्षित परिणाम होते हैं।

ओल्गा रुसाकोवस्की सह-लेखक और प्रिंसटन में कंप्यूटर विज्ञान की सहायक प्रोफेसर हैं।

“कंप्यूटर दृष्टि अब वास्तव में अच्छी तरह से काम करती है, जिसका अर्थ है कि यह विभिन्न संदर्भों में हर जगह तैनात की जा रही है,” उन्होंने कहा। “इसका अर्थ है कि अब इसके दुनिया पर प्रभाव के बारे में बात करने और इन प्रकार के निष्पक्षता मुद्दों के बारे में सोचने का समय है।”

नई पेपर में, इमेजनेट टीम ने गैर-दृश्य अवधारणाओं और अपमानजनक श्रेणियों की पहचान की। इन श्रेणियों में जातीय और यौन चरित्र चित्रण शामिल थे, और टीम ने उन्हें डेटाबेस से हटाने का प्रस्ताव दिया। टीम ने एक उपकरण भी विकसित किया है जो उपयोगकर्ताओं को आयु, लिंग अभिव्यक्ति और त्वचा के रंग के अनुसार लोगों के छवि सेट को निर्दिष्ट और पुनर्प्राप्त करने की अनुमति देता है। लक्ष्य छवियों में लोगों के चेहरे और गतिविधियों को अधिक निष्पक्ष रूप से वर्गीकृत करने वाले एल्गोरिदम बनाना है।

शोधकर्ताओं द्वारा किए गए काम को 30 जनवरी को बार्सिलोना, स्पेन में एसोसिएशन फॉर कंप्यूटिंग मशीनरी के फेयरनेस, एकाउंटेबिलिटी एंड ट्रांसपेरेंसी कॉन्फ्रेंस में प्रस्तुत किया गया था।

“इन प्रकार की बातचीत में शामिल होने के लिए शोधकर्ताओं और प्रयोगशालाओं के लिए बहुत जरूरत है जिनके पास मुख्य तकनीकी विशेषज्ञता है,” रुसाकोवस्की ने कहा। “इस तथ्य को देखते हुए कि हमें बड़े पैमाने पर डेटा एकत्र करने की आवश्यकता है, इस तथ्य को देखते हुए कि यह भीड़भाड़ के साथ किया जाएगा क्योंकि यह सबसे कुशल और स्थापित पाइपलाइन है, हम इसे कैसे एक निष्पक्ष तरीके से करते हैं – जो इन प्रकार के पिछले पिटफॉल में नहीं गिरता है? इस पेपर का मुख्य संदेश निर्माणकारी समाधानों के बारे में है।”

इमेजनेट को 2009 में प्रिंसटन और स्टैनफोर्ड में कंप्यूटर वैज्ञानिकों के एक समूह द्वारा शुरू किया गया था। इसका उद्देश्य शैक्षणिक शोधकर्ताओं और शिक्षकों के लिए एक संसाधन के रूप में कार्य करना था। सिस्टम का निर्माण प्रिंसटन के पूर्व छात्र और संकाय सदस्य फेई-फेई ली के नेतृत्व में किया गया था।

इमेजनेट एक बड़े लेबल वाले छवि डेटाबेस में इतना बड़ा हो गया है क्योंकि यह भीड़भाड़ के उपयोग के माध्यम से है। मुख्य प्लेटफ़ॉर्म में से एक अमेज़ॅन मैकेनिकल टर्क (एमटुर्क) था, और कार्यकर्ताओं को उम्मीदवार छवियों को सत्यापित करने के लिए भुगतान किया गया था। इससे कुछ समस्याएं हुईं, और कई पूर्वाग्रह और अनुचित वर्गीकरण थे।

लीड ऑथर काईयू यांग कंप्यूटर विज्ञान में एक स्नातक छात्र हैं।

“जब आप लोगों से एक बड़े सेट के उम्मीदवारों से सही छवियों का चयन करने के लिए कहते हैं, तो लोगों को कुछ छवियों का चयन करने के लिए दबाव महसूस होता है और वे छवियां अक्सर विशिष्ट या स्टीरियोटाइपिक विशेषताओं वाली होती हैं,” उन्होंने कहा।

अध्ययन का पहला भाग इमेजनेट से संभावित रूप से अपमानजनक या संवेदनशील व्यक्ति श्रेणियों को फ़िल्टर करना शामिल था। अपमानजनक श्रेणियों को उन लोगों के रूप में परिभाषित किया गया था जिनमें अश्लीलता या जातीय या लिंग अपमान शामिल थे। एक ऐसी संवेदनशील श्रेणी लोगों को उनकी यौन अभिविन्यास या धर्म के आधार पर वर्गीकृत करना था। विविध पृष्ठभूमि के 12 स्नातक छात्रों को श्रेणियों को एनोटेट करने के लिए लाया गया था, और उन्हें निर्देश दिया गया था कि यदि वे इसके बारे में अनिश्चित थे तो एक श्रेणी को संवेदनशील लेबल करें। लगभग 54% श्रेणियों को समाप्त कर दिया गया, या इमेजनेट में 2,932 व्यक्ति श्रेणियों में से 1,593।

एमटुर्क कार्यकर्ताओं ने तब शेष श्रेणियों की “छवि” को 1 से 5 के पैमाने पर रेट किया। 158 श्रेणियों को सुरक्षित और छवियों के रूप में वर्गीकृत किया गया, जो 4 या उच्चतर रेटिंग थी। इन फ़िल्टर्ड श्रेणियों में 133,000 से अधिक छवियां शामिल थीं, जो कंप्यूटर दृष्टि एल्गोरिदम को प्रशिक्षित करने के लिए बहुत उपयोगी हो सकती हैं।

शोधकर्ताओं ने छवियों में लोगों के जनसांख्यिकीय प्रतिनिधित्व का अध्ययन किया, और इमेजनेट में पूर्वाग्रह का स्तर मूल्यांकन किया गया। खोज इंजनों से सोर्स किया गया सामग्री अक्सर पुरुषों, हल्की त्वचा वाले लोगों और 18 से 40 वर्ष की आयु के वयस्कों को अधिक प्रतिनिधित्व करती है।

“लोगों ने पाया है कि छवि खोज परिणामों में जनसांख्यिकी का वितरण बहुत अधिक पूर्वाग्रहित है, और यही कारण है कि इमेजनेट में वितरण भी पूर्वाग्रहित है,” यांग ने कहा। “इस पेपर में हमने यह समझने की कोशिश की कि यह कितना पूर्वाग्रहित है, और साथ ही एक तरीका प्रस्तावित करने की कोशिश की कि वितरण को संतुलित कैसे किया जाए।”

शोधकर्ताओं ने तीन विशेषताओं पर विचार किया जो यू.एस. भेदभाव-विरोधी कानूनों के तहत संरक्षित हैं: त्वचा का रंग, लिंग अभिव्यक्ति, और आयु। एमटुर्क कार्यकर्ताओं ने तब प्रत्येक व्यक्ति की प्रत्येक विशेषता को एक छवि में एनोटेट किया।

परिणामों से पता चला कि इमेजनेट की सामग्री में एक महत्वपूर्ण पूर्वाग्रह है। सबसे कम प्रतिनिधित्व वाले गहरे त्वचा वाले, महिलाएं, और 40 वर्ष से अधिक आयु के वयस्क थे।

एक वेब-इंटरफ़ेस टूल डिज़ाइन किया गया था जो उपयोगकर्ताओं को एक छवि सेट प्राप्त करने की अनुमति देता है जो जनसांख्यिकीय रूप से संतुलित होता है जिस तरह से उपयोगकर्ता चुनता है।

“हम यह नहीं कहना चाहते कि जनसांख्यिकी को संतुलित करने का सही तरीका क्या है, क्योंकि यह एक सीधा मुद्दा नहीं है,” यांग ने कहा। “वितरण विभिन्न देशों में अलग-अलग हो सकता है – यू.एस. में त्वचा के रंगों का वितरण एशिया के देशों की तुलना में अलग है, उदाहरण के लिए। तो हम इस प्रश्न को अपने उपयोगकर्ता को छोड़ देते हैं, और हम केवल छवियों का एक संतुलित उपसेट प्राप्त करने के लिए एक उपकरण प्रदान करते हैं।”

इमेजनेट टीम अब अपने हार्डवेयर और डेटाबेस में तकनीकी अपडेट पर काम कर रही है। वे इस शोध में विकसित फ़िल्टरिंग और पुनः संतुलन उपकरण को लागू करने का भी प्रयास कर रहे हैं। इमेजनेट को अपडेट के साथ फिर से जारी किया जाने वाला है, साथ ही कंप्यूटर दृष्टि अनुसंधान समुदाय से प्रतिक्रिया के लिए एक आह्वान के साथ।

पेपर को प्रिंसटन के पीएचडी छात्र क्लिंट क्विनामी और कंप्यूटर विज्ञान के सहायक प्रोफेसर जिया डेंग द्वारा सह-लिखा गया था। शोध को नेशनल साइंस फाउंडेशन द्वारा समर्थित किया गया था।

एलेक्स मैकफारलैंड एक एआई पत्रकार और लेखक हैं जो कृत्रिम बुद्धिमत्ता में नवीनतम विकासों का अन्वेषण कर रहे हैं। उन्होंने विश्वभर के कई एआई स्टार्टअप्स और प्रकाशनों के साथ सहयोग किया है।