कृत्रिम बुद्धिमत्ता

नौकरी के आवेदकों के रिज्यूमे को प्रभावी ढंग से लिंग-मुक्त करना असंभव है, एआई शोधकर्ता पाते हैं

Published December 17, 2021

Updated April 28, 2026

Martin Anderson

न्यूयॉर्क विश्वविद्यालय के शोधकर्ताओं ने पाया है कि बहुत ही सरल प्राकृतिक भाषा प्रसंस्करण (एनएलपी) मॉडल ‘लिंग-मुक्त’ रिज्यूमे से नौकरी के आवेदक के लिंग का पता लगाने में काफी सक्षम हैं – यहां तक कि उन मामलों में जहां मशीन लर्निंग विधियों का उपयोग दस्तावेज से सभी लिंग संकेतकों को हटाने के लिए किया गया है।

न्यूयॉर्क विश्वविद्यालय के शोधकर्ताओं ने 348,000 अच्छी तरह से मिले हुए पुरुष/महिला रिज्यूमे के प्रसंस्करण के बाद यह निष्कर्ष निकाला:

‘[वह] रिज्यूमे में लिंग की एक महत्वपूर्ण मात्रा है। यहां तक कि लिंग को रिज्यूमे से धुंधला करने के महत्वपूर्ण प्रयासों के बाद, एक सरल टीएफ-आईडीएफ मॉडल लिंग के बीच भेदभाव सीखने के लिए सीख सकता है। यह उन चिंताओं को सिद्धांत रूप से मान्य करता है जो मॉडल लिंग के बीच भेदभाव सीखने और प्रशिक्षण डेटा में पूर्वाग्रह को आगे बढ़ाने के बारे में हैं।’

यह खोज इसलिए महत्वपूर्ण नहीं है क्योंकि यह वास्तव में स्क्रीनिंग और साक्षात्कार प्रक्रिया के दौरान लिंग को छिपाना संभव है (जो स्पष्ट रूप से नहीं है), लेकिन इसलिए कि उस चरण तक पहुंचने में ही मानव-इन-द-लूप के बिना रिज्यूमे की एआई-आधारित आलोचना शामिल हो सकती है – और एचआर एआई ने हाल के वर्षों में लिंग पूर्वाग्रह के लिए एक दागदार प्रतिष्ठा प्राप्त की है।

शोधकर्ताओं के अध्ययन के परिणाम दिखाते हैं कि लिंग कितनी आसानी से छिपाने के प्रयासों के लिए लचीला है:

Results from the NYU paper. Source: https://arxiv.org/pdf/2112.08910.pdf

उपरोक्त परिणाम 0-1 एरिया अंडर द रिसीवर ऑपरेटिंग चारैक्टरिस्टिक (AUROC) मीट्रिक का उपयोग करते हैं, जहां ‘1’ लिंग पहचान की 100% निश्चितता का प्रतिनिधित्व करता है। तालिका आठ प्रयोगों की एक श्रृंखला को कवर करती है।

यहां तक कि सबसे खराब प्रदर्शन वाले परिणामों में (प्रयोग #7 और #8), जहां एक रिज्यूमे को इतनी बुरी तरह से लिंग- पहचान करने वाली जानकारी से छीन लिया गया है कि यह उपयोगी नहीं है, एक सरल एनएलपी मॉडल जैसे Word2Vec अभी भी 70% के करीब सटीक लिंग पहचान करने में सक्षम है।

शोधकर्ता टिप्पणी करते हैं:

‘अल्गोरिदमिक हायरिंग संदर्भ में, ये परिणाम यह意味 करते हैं कि जब तक प्रशिक्षण डेटा पूरी तरह से निष्पक्ष नहीं है, तब तक भी सरल एनएलपी मॉडल रिज्यूमे से लिंग के बीच भेदभाव सीखेंगे और पूर्वाग्रह को आगे बढ़ाएंगे।’

लेखकों का मतलब है कि एक वैध एआई-आधारित समाधान ‘रिज्यूमे को लिंग-मुक्त’ करने के लिए एक व्यावहारिक हायरिंग पाइपलाइन में नहीं है, और मशीन लर्निंग तकनीकें जो निष्पक्ष उपचार को लागू करती हैं वे कार्यस्थल में लिंग पूर्वाग्रह की समस्या के लिए एक बेहतर दृष्टिकोण हैं।

एआई शब्दों में, यह ‘सकारात्मक भेदभाव’ के समान है, जहां लिंग-प्रकट करने वाले रिज्यूमे को स्वीकार किया जाता है क्योंकि यह अपरिहार्य है, लेकिन पुनः-क्रमांकन को एक समान उपाय के रूप में लागू किया जाता है। इस प्रकार के दृष्टिकोण लिंक्डइन द्वारा 2019 में और 2018 में जर्मन, इटली और स्पेन के शोधकर्ताओं द्वारा प्रस्तावित किया गया है।

पेपर का शीर्षक रिज्यूमे और हायरिंग में अल्गोरिदमिक पूर्वाग्रह के लिए लिंग-भाषा का महत्व है, और यह न्यूयॉर्क विश्वविद्यालय के प्रौद्योगिकी, संचालन और सांख्यिकी विभाग में प्रासंगिक पारसुरामा और न्यूयॉर्क विश्वविद्यालय के स्टर्न बिजनेस स्कूल में प्रौद्योगिकी, संचालन और सांख्यिकी के सहायक प्रोफेसर जोआओ सेडोक द्वारा लिखा गया है।

हायरिंग में लिंग पूर्वाग्रह

लेखक हायरिंग प्रक्रियाओं में लिंग पूर्वाग्रह के स्तर पर जोर देते हैं जो साहित्यिक रूप से संगठित हो रहा है, जिसमें एचआर प्रबंधक उन्नत अल्गोरिदमिक और मशीन लर्निंग-संचालित ‘स्क्रीनिंग’ प्रक्रियाओं का उपयोग करते हैं जो लिंग के आधार पर एआई-सक्षम अस्वीकृति के बराबर होते हैं।

लेखक 2018 में प्रकट हुए अमेज़न के हायरिंग अल्गोरिदम का मामला उद्धृत करते हैं जिसने महिला उम्मीदवारों को एक मानक तरीके से अस्वीकार कर दिया क्योंकि यह ऐतिहासिक रूप से अधिक बार पुरुषों को नियुक्त करने की संभावना के कारण सीखा गया था

‘मॉडल ने ऐतिहासिक हायरिंग डेटा से सीखा था कि पुरुषों को नियुक्त करने की संभावना अधिक थी, और इसलिए पुरुष रिज्यूमे को महिला रिज्यूमे की तुलना में उच्च दर्जा दिया। ‘

‘हालांकि उम्मीदवार लिंग विशेष रूप से मॉडल में शामिल नहीं किया गया था, यह रिज्यूमे में लिंग की जानकारी के आधार पर पुरुष और महिला रिज्यूमे के बीच भेदभाव सीखने में सक्षम था – उदाहरण के लिए, पुरुष ‘निष्पादित’ और ‘कैप्चर’ जैसे शब्दों का उपयोग करने की संभावना अधिक थी।’

इसके अतिरिक्त, 2011 के एक शोध में पाया गया कि जो नौकरी के विज्ञापन में अप्रत्यक्ष रूप से पुरुषों की मांग की जाती है उन्हें स्पष्ट रूप से आकर्षित करते हैं, और इसी तरह महिलाओं को पद के लिए आवेदन करने से रोकते हैं। डिजिटलीकरण और बड़े डेटा स्कीम्स इन प्रथाओं को स्वचालित प्रणालियों में और अधिक दृढ़ करने का वादा करते हैं, यदि सिंड्रोम को सक्रिय रूप से संबोधित नहीं किया जाता है।

डेटा

एनवाईयू शोधकर्ताओं ने एक श्रृंखला के मॉडलों को लिंग वर्गीकरण के लिए पredictive मॉडलिंग का उपयोग करके प्रशिक्षित किया। उन्होंने यह भी स्थापित करने का प्रयास किया कि मॉडल की लिंग की भविष्यवाणी करने की क्षमता कितनी अच्छी तरह से लिंग-प्रकट करने वाली जानकारी को हटाने के बढ़ते स्तर का सामना कर सकती है, जबकि आवेदन से संबंधित सामग्री को संरक्षित करने का प्रयास किया जा रहा है।

डेटासेट आठ अमेरिकी आधारित आईटी कंपनियों से आवेदक रिज्यूमे के एक शरीर से निकाला गया था, जिसमें प्रत्येक रिज्यूमे के साथ नाम, लिंग, अनुभव के वर्ष, विशेषज्ञता या अध्ययन क्षेत्र, और रिज्यूमे के लिए लक्षित नौकरी पोस्टिंग के विवरण शामिल थे।
तो आगे…

Martin Anderson

मशीन लर्निंग पर लेखक, मानव इमेज सिंथेसिस में डोमेन विशेषज्ञ। मेटाफिजिक.एआई में अनुसंधान सामग्री के पूर्व प्रमुख।
व्यक्तिगत साइट: martinanderson.ai
संपर्क: [email protected]
ट्विटर: @manders_ai

Unite.AI

नौकरी के आवेदकों के रिज्यूमे को प्रभावी ढंग से लिंग-मुक्त करना असंभव है, एआई शोधकर्ता पाते हैं

हायरिंग में लिंग पूर्वाग्रह

डेटा

You may like