Connect with us

एक एआई सोलमेट रिकमेंडर सिस्टम जो केवल छवियों पर आधारित है

कृत्रिम बुद्धिमत्ता

एक एआई सोलमेट रिकमेंडर सिस्टम जो केवल छवियों पर आधारित है

mm

यूके के शोधकर्ताओं ने न्यूरल नेटवर्क का उपयोग करके एक पूरी तरह से छवि-आधारित रिकमेंडर सिस्टम विकसित किया है जो ऑनलाइन डेटिंग मैचों के लिए केवल यह देखता है कि क्या दो उपयोगकर्ता एक दूसरे की तस्वीरों की ओर आकर्षित हैं (नौकरी, आयु आदि जैसी प्रोफ़ाइल जानकारी के बजाय), और पाया है कि यह कम ‘उपहास’ सिस्टम की तुलना में सटीक मैच प्राप्त करने के मामले में बेहतर प्रदर्शन करता है।

परिणामी सिस्टम को टेम्पोरल इमेज-आधारित रिकिप्रोकल रिकमेंडर (टीआईआरआर) कहा जाता है, और यह एक उपयोगकर्ता की ऐतिहासिक प्रवृत्ति की व्याख्या करने के लिए रिकरेंट न्यूरल नेटवर्क (आरएनएन) का उपयोग करता है जो वह संभावित मैचों के लिए ब्राउज़ करते समय चेहरों का सामना करता है।

पेपर का शीर्षक है – शायद निराशाजनक रूप से – ऑनलाइन डेटिंग में पारस्परिक सिफारिश के लिए फोटो ही काफी हैं, और यह ब्रिस्टल विश्वविद्यालय के दो शोधकर्ताओं से है, जो 2020 में जारी एक समान प्रणाली (जिसे इमआरईसी कहा जाता है) पर đáng замет रूप से सुधार करता है।

परीक्षणों में, सिस्टम ने उपयोगकर्ताओं के बीच पारस्परिक मैचों की भविष्यवाणी करने की अपनी क्षमता में राज्य-ऑफ-द-आर्ट सटीकता प्राप्त की, न केवल 2020 के काम में सुधार किया, बल्कि अन्य सामग्री-आधारित डेटिंग पारस्परिक सिफारिश प्रणालियों पर भी सुधार किया जो डेटिंग प्रोफाइल में अधिक विस्तृत, पाठ-आधारित जानकारी को ध्यान में रखते हैं।

वास्तविक दुनिया डेटिंग डेटासेट

टीआईआरआर को एक अज्ञात ‘लोकप्रिय’ ऑनलाइन डेटिंग सेवा द्वारा प्रदान की गई उपयोगकर्ता जानकारी पर प्रशिक्षित किया गया था, जिसमें ‘कई मिलियन पंजीकृत उपयोगकर्ता’ थे, जो केवल तभी उपयोगकर्ताओं को एक दूसरे के साथ संवाद करने की अनुमति देता है जब प्रत्येक ने दूसरे की प्रोफ़ाइल को ‘लाइक’ किया हो। उपयोग किए गए डेटा का उपसेट 200,000 विषयों को शामिल करता था, जो पुरुषों और महिलाओं के बीच समान रूप से विभाजित थे, और सभी डेटिंग प्रोफाइल में लगभग 800,000 उपयोगकर्ता-व्यक्त प्राथमिकताएं थीं।

चूंकि डेटा प्रदान करने वाली अज्ञात डेटिंग सेवा केवल समलैंगिक मैचों का समर्थन करती है, इसलिए शोध में केवल पुरुष/महिला मैच शामिल थे।

टीआईआरआर पारस्परिक सिफारिश प्रणालियों (आरआरएस) के पिछले डिज़ाइनों में सुधार करता है जो सीधे दो प्रोफाइल के बीच मैच की संभावना की गणना करता है, केवल प्रोफ़ाइल छवियों पर आधारित है। पिछली प्रणालियों ने इसके बजाय दो एकदिश प्राथमिकताओं की भविष्यवाणी की और फिर एक भविष्यवाणी प्राप्त करने के लिए उन्हें एकत्रित किया।

शोधकर्ताओं ने उन उपयोगकर्ताओं को बाहर कर दिया जिन्हें डेटिंग सेवा (किसी भी कारण से, स्वेच्छा से छोड़ने सहित) से हटा दिया गया था, और उन प्रोफाइल को बाहर कर दिया जिनमें चेहरा-आधारित फोटो शामिल नहीं थीं।

उपयोगकर्ता इतिहास को एक वर्ष पीछे तक सीमित कर दिया गया था, ताकि समय के साथ डेटिंग साइट द्वारा अपने एल्गोरिदम में किए गए संभावित विचलन से बचा जा सके। उन्हें 15 उपयोगकर्ता प्राथमिकताओं की अधिकतम सीमा तक भी सीमित कर दिया गया था, क्योंकि वे मॉडल डिज़ाइन को साबित करने के लिए पर्याप्त साबित हुए, जबकि प्राथमिकताओं का व्यापक उपयोग प्रदर्शन को खराब कर देता और प्रशिक्षण समय को बढ़ा देता।

इसके अलावा, कुछ अधिक उत्साही या दीर्घकालिक उपयोगकर्ताओं के इतिहास में हज़ारों प्राथमिकताएं थीं, जो प्राप्त सुविधाओं के वजन को जोखिम में डाल सकती थीं और प्रशिक्षण समय को और बढ़ा सकती थीं।

सियामीज़ नेटवर्क

टीआईआरआर को एक सियामीज़ नेटवर्क का उपयोग करके बनाया गया है, जो आमतौर पर ‘वन-शॉट’ लर्निंग के लिए उपयोग किया जाता है।

एक सियामीज़ नेटवर्क का एक टेम्पलेट, जहां समानांतर कन्वोल्यूशनल न्यूरल नेटवर्क (सीएनएन) वजन साझा करते हैं लेकिन डेटा नहीं। वे प्रत्येक सीएनएन के आउटपुट से प्राप्त एक हानि फ़ंक्शन और एक ग्राउंड ट्रुथ लेबल भी साझा करते हैं।

एक सियामीज़ नेटवर्क का एक टेम्पलेट, जहां समानांतर कन्वोल्यूशनल न्यूरल नेटवर्क (सीएनएन) वजन साझा करते हैं लेकिन डेटा नहीं। वे प्रत्येक सीएनएन के आउटपुट से प्राप्त एक हानि फ़ंक्शन और एक ग्राउंड ट्रुथ लेबल भी साझा करते हैं। स्रोत: https://arxiv.org/pdf/2108.11714.pdf

नेटवर्क को बाइनरी क्रॉस-एंट्रोपी का उपयोग करके प्रशिक्षित किया गया था, जो न्यूरल नेटवर्क में एक सामान्य हानि फ़ंक्शन है, और जिसे शोधकर्ताओं ने विपरीत हानि की तुलना में बेहतर परिणाम देने वाला पाया। बाद वाला दो चेहरों के बीच समानता का मूल्यांकन करने वाली प्रणालियों में सबसे प्रभावी है, लेकिन चूंकि यह टीआईआरआर का उद्देश्य नहीं है, यह इस संदर्भ में खराब प्रदर्शन करने वाला दृष्टिकोण है।

यह आवश्यक है कि सिस्टम जानकारी को बनाए रखे और उस पर निर्माण करे जो यह विकसित करता है क्योंकि प्रशिक्षण कई बार एक ही डेटा पर चलता है, और टीआईआरआर में सियामीज़ नेटवर्क एक एलएसटीएम (लंबी अवधि की छोटी अवधि की स्मृति) नेटवर्क का उपयोग करता है इन निर्णयों को करने के लिए, और यह सुनिश्चित करने के लिए कि सुविधाएं जो प्रासंगिक मानी जाती हैं उन्हें त्याग दिया नहीं जाता है क्योंकि फ्रेमवर्क अपनी अंतर्दृष्टि बनाता है।

टीआईआरआर के लिए विशिष्ट सियामीज़ नेटवर्क आर्किटेक्चर।

टीआईआरआर के लिए विशिष्ट सियामीज़ नेटवर्क आर्किटेक्चर।

शोधकर्ताओं ने पाया कि नेटवर्क बहुत धीरे से प्रशिक्षित होता है जब सभी डेटा इनपुट होते हैं, और बाद में डेटा के तीन अलग-अलग उपसेट का उपयोग करके प्रशिक्षण को तीन चरणों में विभाजित किया गया। इसमें कुछ अतिरिक्त लाभ है, क्योंकि शोधकर्ताओं के 2020 के प्रयोगों ने पहले ही दिखा दिया था कि पुरुष और महिला डेटासेट को अलग से प्रशिक्षित करने से पारस्परिक सिफारिश प्रणाली के प्रदर्शन में सुधार होता है।

टीआईआरआर के सियामीज़ नेटवर्क के लिए अलग-अलग प्रशिक्षण सत्रों का विभाजन।

टीआईआरआर के सियामीज़ नेटवर्क के लिए अलग-अलग प्रशिक्षण सत्रों का विभाजन।

परीक्षण

टीआईआरआर के प्रदर्शन का मूल्यांकन करने के लिए, शोधकर्ताओं ने प्राप्त डेटा का एक हिस्सा अलग रखा और इसे पूरी तरह से समाप्त सिस्टम के माध्यम से चलाया। हालांकि, चूंकि सिस्टम काफी नया है, इसकी तुलना करने के लिए कोई सीधे तुलनात्मक पिछले सिस्टम नहीं हैं।

इसलिए, शोधकर्ताओं ने पहले सियामीज़ नेटवर्क के लिए एक रिसीवर ऑपरेटिंग कर्व (आरओसी) बेसलाइन स्थापित की, trướcτούमाप और प्रोजेक्शन के लिए यूनिफ़ॉर्म मैनिफ़ोल्ड अनुमान और (यूएमएपी) का उपयोग करके 128-आयामी वेक्टर्स को कम करने के लिए, ताकि पसंद और नापसंद की एक सुसंगत प्रवाह स्थापित की जा सके।

बाएं, सियामीज़ नेटवर्क का आरओसी प्रदर्शन के संकेतक के रूप में; दाएं, यूएमएपी विज़ुअलाइज़ेशन 'पसंद' को लाल रंग में दिखाता है, 'नापसंद' को काले रंग में।

बाएं, सियामीज़ नेटवर्क का आरओसी प्रदर्शन के संकेतक के रूप में; दाएं, यूएमएपी विज़ुअलाइज़ेशन ‘पसंद’ को लाल रंग में दिखाता है, ‘नापसंद’ को काले रंग में।

टीआईआरआर का परीक्षण सहयोगी फ़िल्टरिंग और सामग्री-आधारित प्रणालियों के खिलाफ किया गया था, जिसमें शोधकर्ताओं का पिछला काम इमआरईसी (ऊपर देखें) और आरईसीओएन शामिल था, एक 2010 का आरआरएस, साथ ही साथ आरसीएफ (एक 2015 डेटिंग आरआरएस जो डेटिंग प्रोफाइल की पाठ सामग्री पर आधारित है) और एलएफआरआर (एक समान परियोजना 2019 से)।

सभी मामलों में, टीआईआरआर ने बेहतर सटीकता प्रदान की, हालांकि एलएफआरआर की तुलना में केवल थोड़ा सा, जो संभवतः प्रोफ़ाइल पाठ सामग्री और विषयों की प्रोफ़ाइल तस्वीरों की अनुमानित आकर्षण स्तर के बीच संबंधित कारकों को इंगित करता है।

छवि-आधारित टीआईआरआर और अधिक पाठ-आधारित एलएफआरआर के बीच लगभग समानता से यह संकेत मिलता है कि उपयोगकर्ताओं की दृष्टिकोण से दृश्य आकर्षण की धारणा प्रोफ़ाइल पाठ सामग्री से प्रभावित हो सकती है; या यह कि पाठ सामग्री को संबद्ध चित्र की तुलना में अधिक ध्यान और समर्थन मिलता है जो आकर्षक नहीं माना जाता है।

स्पष्ट कारणों से, शोध टीम टीआईआरआर के लिए डेटासेट या सोर्स कोड जारी नहीं कर सकती है, लेकिन दूसरी टीमों को अपने दृष्टिकोण को दोहराने और पुष्टि करने के लिए प्रोत्साहित करती है।

 

n.b इस व्यक्ति को यह व्यक्ति मौजूद नहीं है से छवियों का उपयोग किया गया है।

मशीन लर्निंग पर लेखक, मानव इमेज सिंथेसिस में डोमेन विशेषज्ञ। मेटाफिजिक.एआई में अनुसंधान सामग्री के पूर्व प्रमुख।
व्यक्तिगत साइट: martinanderson.ai
संपर्क: [email protected]
ट्विटर: @manders_ai

विज्ञापन प्रकटीकरण: Unite.AI सटीक जानकारी और समाचार प्रदान करने के लिए कठोर संपादकीय मानकों के प्रति प्रतिबद्ध है। जब आप उन उत्पादों के लिंक पर क्लिक करते हैं जिनकी हमने समीक्षा की है, तो हमें मुआवजा मिल सकता है।