ठूंठ केवल छवियों पर आधारित एक एआई सोलमेट अनुशंसा प्रणाली - यूनाइट.एआई
हमसे जुडे

Artificial Intelligence

केवल छवियों पर आधारित एक एआई सोलमेट अनुशंसा प्रणाली

mm
Updated on

यूके के शोधकर्ताओं ने ऑनलाइन डेटिंग मैचों के लिए पूरी तरह से छवि-आधारित अनुशंसा प्रणाली विकसित करने के लिए तंत्रिका नेटवर्क का उपयोग किया है जो केवल इस बात पर ध्यान देता है कि दो उपयोगकर्ता एक-दूसरे की तस्वीरों के प्रति आकर्षित हैं या नहीं (प्रोफ़ाइल जानकारी जैसे नौकरी, उम्र आदि के बजाय)। ), और पाया है कि सटीक मिलान प्राप्त करने के मामले में यह कम 'उथले' सिस्टम से बेहतर प्रदर्शन करता है।

परिणामी प्रणाली को टेम्पोरल इमेज-आधारित पारस्परिक अनुशंसा (टीआईआरआर) कहा जाता है, और संभावित मैचों के लिए ब्राउज़ करते समय उपयोगकर्ता के चेहरे के ऐतिहासिक पूर्वाग्रह की व्याख्या करने के लिए आवर्ती तंत्रिका नेटवर्क (आरएनएन) का उपयोग करता है।

RSI काग़ज़ हकदार है - शायद निराशाजनक रूप से - ऑनलाइन डेटिंग में पारस्परिक अनुशंसा के लिए आपको केवल तस्वीरों की आवश्यकता है, और ब्रिस्टल विश्वविद्यालय के दो शोधकर्ताओं से एक समान प्रणाली (जिसे कहा जाता है) में उल्लेखनीय सुधार हुआ है ImRec) 2020 में उसी टीम द्वारा जारी किया गया।

परीक्षणों में, सिस्टम ने भविष्यवाणी करने की क्षमता में अत्याधुनिक सटीकता प्राप्त की पारस्परिक उपयोगकर्ताओं के बीच मेल खाता है, जिससे न केवल शोधकर्ताओं के 2020 के काम में सुधार होता है, बल्कि अन्य सामग्री-आधारित डेटिंग पारस्परिक अनुशंसा प्रणालियों में भी सुधार होता है, जो डेटिंग प्रोफाइल में अधिक विस्तृत, पाठ-आधारित जानकारी को ध्यान में रखते हैं।

वास्तविक विश्व डेटिंग डेटासेट

टीआईआरआर को 'कई मिलियन पंजीकृत उपयोगकर्ताओं' के साथ एक अनाम 'लोकप्रिय' ऑनलाइन डेटिंग सेवा द्वारा प्रदान की गई उपयोगकर्ता जानकारी पर प्रशिक्षित किया गया था, जो उपयोगकर्ताओं को केवल तभी एक-दूसरे के साथ संवाद करने की अनुमति देता है जब प्रत्येक ने दूसरे की प्रोफ़ाइल को 'पसंद' किया हो। उपयोग किए गए डेटा के सबसेट में 200,000 विषय शामिल थे, जो पुरुषों और महिलाओं के बीच समान रूप से विभाजित थे, और सभी डेटिंग प्रोफाइल में लगभग 800,000 उपयोगकर्ता द्वारा व्यक्त प्राथमिकताएं शामिल थीं।

चूंकि डेटा प्रदान करने वाली अनाम डेटिंग सेवा केवल विषमलैंगिक मेलों का समर्थन करती है, इसलिए शोध में केवल पुरुष/महिला मेलों को शामिल किया गया था।

टीआईआरआर केवल प्रोफ़ाइल छवियों के आधार पर दो प्रोफाइलों के बीच मैच की संभावना की सीधे गणना करके इस क्षेत्र में पिछले पारस्परिक अनुशंसा प्रणाली (आरआरएस) डिज़ाइन में सुधार करता है। इसके बजाय पूर्व प्रणालियों ने दो यूनिडायरेक्शनल प्राथमिकताओं की भविष्यवाणी की और फिर भविष्यवाणी प्राप्त करने के लिए उन्हें एकत्रित किया।

शोधकर्ताओं ने उन उपयोगकर्ताओं को बाहर कर दिया जिन्हें डेटिंग सेवा से हटा दिया गया था (किसी भी कारण से, स्वेच्छा से छोड़ने सहित), और उन प्रोफाइलों को बाहर कर दिया जिनमें चेहरे पर आधारित तस्वीरें शामिल नहीं थीं।

संभावित विसंगतियों से बचने के लिए उपयोगकर्ता इतिहास को एक वर्ष पहले तक सीमित कर दिया गया था, जो तब हो सकता था जब डेटिंग साइट ने समय के साथ अपने एल्गोरिदम में बदलाव किया था। वे अधिकतम 15 उपयोगकर्ता प्राथमिकताओं तक ही सीमित थे, क्योंकि इन्हें मॉडल डिज़ाइन को साबित करने के लिए पर्याप्त के रूप में प्रदर्शित किया गया था, जबकि प्राथमिकताओं के अधिक व्यापक उपयोग से प्रदर्शन में गिरावट आई और प्रशिक्षण समय में वृद्धि हुई।

इसके अतिरिक्त, कुछ अधिक शौकीन या दीर्घकालिक उपयोगकर्ताओं का इतिहास रहा है हजारों प्राथमिकताओं का, जिससे प्राप्त सुविधाओं का महत्व कम होने का जोखिम हो सकता है, और प्रशिक्षण का समय और भी बढ़ सकता है।

स्याम देश नेटवर्क

टीआईआरआर का उपयोग करके तैयार किया गया है स्याम देश का नेटवर्क, आमतौर पर के लिए उपयोग किया जाता है 'एक-शॉट' सीखना.

एक टेम्प्लेट सियामीज़ नेटवर्क, जहां समानांतर कन्वोल्यूशनल न्यूरल नेटवर्क (सीएनएन) वजन साझा करते हैं लेकिन डेटा नहीं। वे प्रत्येक सीएनएन के आउटपुट से प्राप्त एक हानि फ़ंक्शन और एक जमीनी सच्चाई लेबल भी साझा करते हैं। स्रोत: https://arxiv.org/pdf/2108.11714.pdf

एक टेम्प्लेट सियामीज़ नेटवर्क, जहां समानांतर कन्वोल्यूशनल न्यूरल नेटवर्क (सीएनएन) वजन साझा करते हैं लेकिन डेटा नहीं। वे प्रत्येक सीएनएन के आउटपुट से प्राप्त एक हानि फ़ंक्शन और एक जमीनी सच्चाई लेबल भी साझा करते हैं।  स्रोत: https://arxiv.org/pdf/2108.11714.pdf

नेटवर्क को बाइनरी क्रॉसेंट्रॉपी का उपयोग करके प्रशिक्षित किया गया था, जो तंत्रिका नेटवर्क में एक सामान्य हानि फ़ंक्शन है, और जिसे शोधकर्ताओं ने तुलना में बेहतर परिणाम देने के लिए पाया है विपरीत हानि. उत्तरार्द्ध उन प्रणालियों में सबसे प्रभावी है जो दो चेहरों के बीच समानता का मूल्यांकन करते हैं, लेकिन चूंकि यह टीआईआरआर का उद्देश्य नहीं है, यह एक ऐसा दृष्टिकोण है जो इस संदर्भ में खराब प्रदर्शन करता है।

सिस्टम के लिए यह आवश्यक है कि वह जानकारी को बनाए रखे और उस पर निर्माण करे क्योंकि प्रशिक्षण एक ही डेटा पर कई बार दोहराता है, और टीआईआरआर में सियामी नेटवर्क एक का उपयोग करता है एलएसटीएम (दीर्घकालिक अल्पकालिक मेमोरी) नेटवर्क को इन निर्णयों को लेने के लिए, और यह सुनिश्चित करने के लिए कि प्रासंगिक समझी जाने वाली सुविधाओं को तदर्थ नहीं छोड़ा जाए क्योंकि रूपरेखा अपनी अंतर्दृष्टि का निर्माण करती है।

टीआईआरआर के लिए विशिष्ट सियामीज़ नेटवर्क आर्किटेक्चर।

टीआईआरआर के लिए विशिष्ट सियामीज़ नेटवर्क आर्किटेक्चर।

शोधकर्ताओं ने पाया कि जब सारा डेटा इनपुट किया गया तो नेटवर्क बहुत धीरे-धीरे प्रशिक्षित हुआ, और बाद में डेटा के तीन अलग-अलग सबसेट का उपयोग करके प्रशिक्षण को तीन चरणों में विभाजित किया गया। इसमें कुछ अतिरिक्त लाभ है, क्योंकि शोधकर्ताओं के 2020 के प्रयोगों ने पहले ही प्रदर्शित कर दिया था कि पुरुष और महिला डेटासेट को अलग-अलग प्रशिक्षण देने से पारस्परिक अनुशंसा प्रणाली के प्रदर्शन में सुधार होता है।

टीआईआरआर के स्याम देश नेटवर्क के लिए अलग-अलग प्रशिक्षण सत्रों का विवरण।

टीआईआरआर के स्याम देश नेटवर्क के लिए अलग-अलग प्रशिक्षण सत्रों का विवरण।

परीक्षण

टीआईआरआर के प्रदर्शन का मूल्यांकन करने के लिए, शोधकर्ताओं ने प्राप्त डेटा के एक हिस्से को एक तरफ रखा और इसे पूरी तरह से परिवर्तित प्रणाली के माध्यम से चलाया। हालाँकि, चूँकि यह प्रणाली काफी नवीन है, इसलिए कोई प्रत्यक्ष रूप से अनुरूप पूर्व प्रणालियाँ नहीं हैं जिनसे इसकी तुलना की जा सके।

इसलिए शोधकर्ताओं ने सबसे पहले एक रिसीवर ऑपरेटिंग कैरेक्टरिस्टिक कर्व स्थापित किया (आरओसी) डायमेंशनलिटी रिडक्शन के लिए यूनिफ़ॉर्म मैनिफ़ोल्ड एप्रोक्सिमेशन और प्रोजेक्शन का उपयोग करने से पहले, सियामीज़ नेटवर्क के लिए बेसलाइन (यूमैप) आसान विज़ुअलाइज़ेशन के लिए 128-आयामी वैक्टर को पतला करना, ताकि पसंद और नापसंद का सुसंगत प्रवाह स्थापित किया जा सके।

बाईं ओर, प्रदर्शन के आधारभूत संकेतक के रूप में सियामी नेटवर्क का आरओसी; दाईं ओर, UMAP विज़ुअलाइज़ेशन लाल रंग में 'पसंद' और काले रंग में 'नापसंद' दिखाता है।

बाईं ओर, प्रदर्शन के आधारभूत संकेतक के रूप में सियामी नेटवर्क का आरओसी; दाईं ओर, UMAP विज़ुअलाइज़ेशन लाल रंग में 'पसंद' और काले रंग में 'नापसंद' दिखाता है।

टीआईआरआर का परीक्षण समान दायरे वाले सहयोगात्मक फ़िल्टरिंग और सामग्री-आधारित सिस्टम के विरुद्ध किया गया था, जिसमें शोधकर्ताओं का पूर्व कार्य ImRec (ऊपर देखें) भी शामिल था, और टोह, 2010 से एक आरआरएस, साथ ही सहयोगी फ़िल्टरिंग एल्गोरिदम आरसीएफ (डेटिंग प्रोफाइल की पाठ्य सामग्री पर आधारित 2015 डेटिंग आरआरएस) और एलएफआरआर (2019 से एक समान परियोजना)।

सभी मामलों में टीआईआरआर बेहतर सटीकता प्रदान करने में सक्षम था, हालांकि एलएफआरआर की तुलना में केवल मामूली रूप से, संभवतः प्रोफ़ाइल पाठ सामग्री और विषयों की प्रोफ़ाइल फ़ोटो के आकर्षण के कथित स्तर के बीच सहसंबंधी कारकों का संकेत मिलता है।

छवि-आधारित टीआईआरआर और अधिक पाठ-आधारित एलएफआरआर के बीच निकट-समानता कम से कम दो संभावनाओं की अनुमति देती है: उपयोगकर्ताओं की दृश्य आकर्षण की धारणा प्रोफाइल की पाठ्य सामग्री से प्रभावित होती है; या कि पाठ्य सामग्री को अधिक ध्यान और प्रशंसा मिलती है, यदि संबंधित चित्र को आकर्षक नहीं माना जाता तो ऐसा हो सकता था।

स्पष्ट कारणों से, अनुसंधान टीम टीआईआरआर के लिए डेटासेट या स्रोत कोड जारी करने में असमर्थ है, लेकिन अन्य टीमों को उनके दृष्टिकोण की नकल करने और पुष्टि करने के लिए प्रोत्साहित करती है।

 

nb मुख्य चित्रण में प्रयुक्त चित्र thispersondoesnotexist.com से हैं।