рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛
рдиреМрдХрд░реА рдХреЗ рдЖрд╡реЗрджрдХреЛрдВ рдХреЗ рд░рд┐рдЬреНрдпреВрдореЗ рдХреЛ рдкреНрд░рднрд╛рд╡реА рдврдВрдЧ рд╕реЗ рд▓рд┐рдВрдЧ-рдореБрдХреНрдд рдХрд░рдирд╛ рдЕрд╕рдВрднрд╡ рд╣реИ, рдПрдЖрдИ рд╢реЛрдзрдХрд░реНрддрд╛ рдкрд╛рддреЗ рд╣реИрдВ

न्यूयॉर्क विश्वविद्यालय के शोधकर्ताओं ने पाया है कि बहुत ही सरल प्राकृतिक भाषा प्रसंस्करण (एनएलपी) मॉडल ‘लिंग-मुक्त’ रिज्यूमे से नौकरी के आवेदक के लिंग का पता लगाने में काफी सक्षम हैं – यहां तक कि उन मामलों में जहां मशीन लर्निंग विधियों का उपयोग दस्तावेज से सभी लिंग संकेतकों को हटाने के लिए किया गया है।
न्यूयॉर्क विश्वविद्यालय के शोधकर्ताओं ने 348,000 अच्छी तरह से मिले हुए पुरुष/महिला रिज्यूमे के प्रसंस्करण के बाद यह निष्कर्ष निकाला:
‘[वह] रिज्यूमे में लिंग की एक महत्वपूर्ण मात्रा है। यहां तक कि लिंग को रिज्यूमे से धुंधला करने के महत्वपूर्ण प्रयासों के बाद, एक सरल टीएफ-आईडीएफ मॉडल लिंग के बीच भेदभाव सीखने के लिए सीख सकता है। यह उन चिंताओं को सिद्धांत रूप से मान्य करता है जो मॉडल लिंग के बीच भेदभाव सीखने और प्रशिक्षण डेटा में पूर्वाग्रह को आगे बढ़ाने के बारे में हैं।’
यह खोज इसलिए महत्वपूर्ण नहीं है क्योंकि यह वास्तव में स्क्रीनिंग और साक्षात्कार प्रक्रिया के दौरान लिंग को छिपाना संभव है (जो स्पष्ट रूप से नहीं है), लेकिन इसलिए कि उस चरण तक पहुंचने में ही मानव-इन-द-लूप के बिना रिज्यूमे की एआई-आधारित आलोचना शामिल हो सकती है – और एचआर एआई ने हाल के वर्षों में लिंग पूर्वाग्रह के लिए एक दागदार प्रतिष्ठा प्राप्त की है।
शोधकर्ताओं के अध्ययन के परिणाम दिखाते हैं कि लिंग कितनी आसानी से छिपाने के प्रयासों के लिए लचीला है:

Results from the NYU paper. Source: https://arxiv.org/pdf/2112.08910.pdf
उपरोक्त परिणाम 0-1 एरिया अंडर द रिसीवर ऑपरेटिंग चारैक्टरिस्टिक (AUROC) मीट्रिक का उपयोग करते हैं, जहां ‘1’ लिंग पहचान की 100% निश्चितता का प्रतिनिधित्व करता है। तालिका आठ प्रयोगों की एक श्रृंखला को कवर करती है।
यहां तक कि सबसे खराब प्रदर्शन वाले परिणामों में (प्रयोग #7 और #8), जहां एक रिज्यूमे को इतनी बुरी तरह से लिंग- पहचान करने वाली जानकारी से छीन लिया गया है कि यह उपयोगी नहीं है, एक सरल एनएलपी मॉडल जैसे Word2Vec अभी भी 70% के करीब सटीक लिंग पहचान करने में सक्षम है।
शोधकर्ता टिप्पणी करते हैं:
‘अल्गोरिदमिक हायरिंग संदर्भ में, ये परिणाम यह意味 करते हैं कि जब तक प्रशिक्षण डेटा पूरी तरह से निष्पक्ष नहीं है, तब तक भी सरल एनएलपी मॉडल रिज्यूमे से लिंग के बीच भेदभाव सीखेंगे और पूर्वाग्रह को आगे बढ़ाएंगे।’
लेखकों का मतलब है कि एक वैध एआई-आधारित समाधान ‘रिज्यूमे को लिंग-मुक्त’ करने के लिए एक व्यावहारिक हायरिंग पाइपलाइन में नहीं है, और मशीन लर्निंग तकनीकें जो निष्पक्ष उपचार को लागू करती हैं वे कार्यस्थल में लिंग पूर्वाग्रह की समस्या के लिए एक बेहतर दृष्टिकोण हैं।
एआई शब्दों में, यह ‘सकारात्मक भेदभाव’ के समान है, जहां लिंग-प्रकट करने वाले रिज्यूमे को स्वीकार किया जाता है क्योंकि यह अपरिहार्य है, लेकिन पुनः-क्रमांकन को एक समान उपाय के रूप में लागू किया जाता है। इस प्रकार के दृष्टिकोण लिंक्डइन द्वारा 2019 में और 2018 में जर्मन, इटली और स्पेन के शोधकर्ताओं द्वारा प्रस्तावित किया गया है।
पेपर का शीर्षक रिज्यूमे और हायरिंग में अल्गोरिदमिक पूर्वाग्रह के लिए लिंग-भाषा का महत्व है, और यह न्यूयॉर्क विश्वविद्यालय के प्रौद्योगिकी, संचालन और सांख्यिकी विभाग में प्रासंगिक पारसुरामा और न्यूयॉर्क विश्वविद्यालय के स्टर्न बिजनेस स्कूल में प्रौद्योगिकी, संचालन और सांख्यिकी के सहायक प्रोफेसर जोआओ सेडोक द्वारा लिखा गया है।
हायरिंग में लिंग पूर्वाग्रह
लेखक हायरिंग प्रक्रियाओं में लिंग पूर्वाग्रह के स्तर पर जोर देते हैं जो साहित्यिक रूप से संगठित हो रहा है, जिसमें एचआर प्रबंधक उन्नत अल्गोरिदमिक और मशीन लर्निंग-संचालित ‘स्क्रीनिंग’ प्रक्रियाओं का उपयोग करते हैं जो लिंग के आधार पर एआई-सक्षम अस्वीकृति के बराबर होते हैं।
लेखक 2018 में प्रकट हुए अमेज़न के हायरिंग अल्गोरिदम का मामला उद्धृत करते हैं जिसने महिला उम्मीदवारों को एक मानक तरीके से अस्वीकार कर दिया क्योंकि यह ऐतिहासिक रूप से अधिक बार पुरुषों को नियुक्त करने की संभावना के कारण सीखा गया था
‘मॉडल ने ऐतिहासिक हायरिंग डेटा से सीखा था कि पुरुषों को नियुक्त करने की संभावना अधिक थी, और इसलिए पुरुष रिज्यूमे को महिला रिज्यूमे की तुलना में उच्च दर्जा दिया। ‘
‘हालांकि उम्मीदवार लिंग विशेष रूप से मॉडल में शामिल नहीं किया गया था, यह रिज्यूमे में लिंग की जानकारी के आधार पर पुरुष और महिला रिज्यूमे के बीच भेदभाव सीखने में सक्षम था – उदाहरण के लिए, पुरुष ‘निष्पादित’ और ‘कैप्चर’ जैसे शब्दों का उपयोग करने की संभावना अधिक थी।’
इसके अतिरिक्त, 2011 के एक शोध में पाया गया कि जो नौकरी के विज्ञापन में अप्रत्यक्ष रूप से पुरुषों की मांग की जाती है उन्हें स्पष्ट रूप से आकर्षित करते हैं, और इसी तरह महिलाओं को पद के लिए आवेदन करने से रोकते हैं। डिजिटलीकरण और बड़े डेटा स्कीम्स इन प्रथाओं को स्वचालित प्रणालियों में और अधिक दृढ़ करने का वादा करते हैं, यदि सिंड्रोम को सक्रिय रूप से संबोधित नहीं किया जाता है।
डेटा
एनवाईयू शोधकर्ताओं ने एक श्रृंखला के मॉडलों को लिंग वर्गीकरण के लिए पredictive मॉडलिंग का उपयोग करके प्रशिक्षित किया। उन्होंने यह भी स्थापित करने का प्रयास किया कि मॉडल की लिंग की भविष्यवाणी करने की क्षमता कितनी अच्छी तरह से लिंग-प्रकट करने वाली जानकारी को हटाने के बढ़ते स्तर का सामना कर सकती है, जबकि आवेदन से संबंधित सामग्री को संरक्षित करने का प्रयास किया जा रहा है।
डेटासेट आठ अमेरिकी आधारित आईटी कंपनियों से आवेदक रिज्यूमे के एक शरीर से निकाला गया था, जिसमें प्रत्येक रिज्यूमे के साथ नाम, लिंग, अनुभव के वर्ष, विशेषज्ञता या अध्ययन क्षेत्र, और रिज्यूमे के लिए लक्षित नौकरी पोस्टिंग के विवरण शामिल थे।
तो आगे…












