stomp 'n AI Sielsmaat-aanbevelingstelsel wat slegs op beelde gebaseer is - Unite.AI
Verbinding met ons

Kunsmatige Intelligensie

'n AI Soulmate-aanbevelingstelsel wat slegs op beelde gebaseer is

mm
Opgedateer on

Navorsers van die VK het neurale netwerke gebruik om 'n geheel en al beeldgebaseerde aanbevelingstelsel vir aanlyn-afsprake te ontwikkel wat slegs in ag neem of twee gebruikers aangetrokke is tot mekaar se foto's (eerder as profielinligting soos werk, ouderdom, ens. ), en het gevind dat dit minder 'vlak' stelsels vaar in terme van die verkryging van 'n akkurate passing.

Die gevolglike stelsel word Temporal Image-Based Reciprocal Recommender (TIRR) genoem, en gebruik herhalende neurale netwerke (RNN's) om 'n gebruiker se historiese voorliefde vir gesigte wat hy of sy teëkom terwyl hy na potensiële passings blaai, te interpreteer.

Die papier is geregtig – miskien ontmoedigend – Foto's is al wat jy nodig het vir wederkerige aanbeveling in aanlyn-afsprake, en kom van twee navorsers aan die Universiteit van Bristol, wat veral verbeter op 'n soortgelyke stelsel (genoem ImRec) vrygestel deur dieselfde span in 2020.

In toetse het die stelsel die nuutste akkuraatheid in sy vermoë om te voorspel verkry wedersydse passings tussen gebruikers, wat nie net verbeter op die navorsers se 2020-werk nie, maar ook op ander inhoud-gebaseerde afsprake wederkerige aanbevelingstelsels wat rekening hou met meer gedetailleerde, teks-gebaseerde inligting in dating profiele.

Real World Dating Dataset

TIRR is opgelei oor gebruikersinligting wat verskaf word deur 'n naamlose 'gewilde' aanlyn-afspraakdiens met 'n paar miljoen geregistreerde gebruikers', wat gebruikers slegs toelaat om met mekaar te kommunikeer sodra elkeen van die ander se profiel 'gelaaik' het. Die subset van data wat gebruik is, het 200,000 800,000 proefpersone ingesluit, eweredig verdeel tussen mans en vroue, en ongeveer XNUMX XNUMX gebruiker-uitgedrukte voorkeure oor al die datingprofiele.

Aangesien die anonieme afspraakdiens wat die data verskaf slegs heteroseksuele passings ondersteun, is slegs mans/vroulike passings in die navorsing gedek.

TIRR verbeter op vorige wederkerige aanbevelingstelsels (RRS) ontwerpe in hierdie veld deur die waarskynlikheid van 'n passing tussen twee profiele direk te bereken, uitsluitlik gebaseer op profielbeelde. Vorige stelsels het eerder twee eenrigtingvoorkeure voorspel en dit dan saamgevoeg om 'n voorspelling te verkry.

Die navorsers het gebruikers uitgesluit wat van die afspraakdiens verwyder is (om enige rede, insluitend vrywillige vertrek), en profiele uitgesluit wat nie gesiggebaseerde foto's ingesluit het nie.

Gebruikersgeskiedenis is beperk tot een jaar terug, om potensiële afwykings te vermy wat kan voorkom as die afspraakwebwerf sy algoritmes mettertyd aangepas het. Hulle was ook beperk tot 'n maksimum van 15 gebruikersvoorkeure, aangesien dit gedemonstreer is as voldoende om die modelontwerp te bewys, terwyl meer uitgebreide gebruik van voorkeure prestasie en opleidingstye verswak het.

Boonop het sommige van die meer ywerige of langtermyngebruikers geskiedenis gehad duisende van voorkeure, wat die gevaar kon gevaar het om die gewig van die verkrygde kenmerke te skeef, en oefentye verder te verleng.

Siamese netwerk

TIRR word geformuleer deur gebruik te maak van a Siamese netwerk, tipies gebruik vir 'eenskoot' leer.

'n Sjabloon Siamese netwerk, waar parallelle Convolutional Neural Networks (CNN's) gewigte deel, maar nie data nie. Hulle deel ook 'n verliesfunksie afgelei van die uitsette van elke CNN, en 'n grondwaarheidsetiket. Bron: https://arxiv.org/pdf/2108.11714.pdf

'n Sjabloon Siamese netwerk, waar parallelle Convolutional Neural Networks (CNN's) gewigte deel, maar nie data nie. Hulle deel ook 'n verliesfunksie afgelei van die uitsette van elke CNN, en 'n grondwaarheidsetiket.  Bron: https://arxiv.org/pdf/2108.11714.pdf

Die netwerk is opgelei met behulp van binêre kruisentropie, 'n algemene verliesfunksie in neurale netwerke, en een wat die navorsers bevind het om beter resultate te lewer in vergelyking met kontrasiewe verlies. Laasgenoemde is die doeltreffendste in stelsels wat pariteit tussen twee gesigte evalueer, maar aangesien dit nie die doel van TIRR is nie, is dit 'n benadering wat swak presteer in hierdie konteks.

Dit is nodig dat die stelsel inligting wat dit ontwikkel behou en daarop bou, aangesien die opleiding baie keer oor dieselfde data herhaal, en die Siamese netwerk in TIRR gebruik 'n LSTM (Langtermyn Korttermyn Geheue) netwerk om hierdie besluite te neem, en om te verseker dat kenmerke wat as relevant geag word nie ad hoc weggegooi word nie, aangesien die raamwerk sy insigte bou.

Die spesifieke Siamese netwerkargitektuur vir TIRR.

Die spesifieke Siamese netwerkargitektuur vir TIRR.

Die navorsers het gevind dat die netwerk baie stadig opgelei is toe al die data ingevoer is, en die opleiding daarna in drie fases verdeel het deur drie verskillende substelle van die data te gebruik. Daar is 'n mate van bykomende voordeel hierin, aangesien die navorsers se 2020-eksperimente reeds getoon het dat die opleiding van die manlike en vroulike datastelle afsonderlik die werkverrigting van 'n wedersydse aanbevelingstelsel verbeter.

Die uiteensetting van afsonderlike opleidingsessies vir TIRR se Siamese netwerk.

Die uiteensetting van afsonderlike opleidingsessies vir TIRR se Siamese netwerk.

toets

Om TIRR se werkverrigting te evalueer, het die navorsers 'n gedeelte van die verkryde data eenkant gehou en dit deur die ten volle gekonvergeerde stelsel laat loop. Aangesien die sisteem egter redelik nuut is, is daar geen direkte analoog vorige sisteme waarmee dit vergelyk kan word nie.

Daarom het die navorsers eers 'n Ontvanger Bedryfskenmerkkromme (ROC) basislyn vir die Siamese netwerk, voor gebruik van Uniform Manifold Approximation and Projection for Dimensionity Reduction (UMAP) om die 128-dimensionele vektore te skraal vir maklike visualisering, om 'n samehangende vloei van voor- en afkeure te vestig.

Aan die linkerkant, die ROC van die Siamese netwerk as 'n basislyn-aanwyser van prestasie; aan die regterkant wys die UMAP-visualisering 'hou van' in rooi, 'hou nie van' in swart.

Aan die linkerkant, die ROC van die Siamese netwerk as 'n basislyn-aanwyser van prestasie; aan die regterkant wys die UMAP-visualisering 'hou van' in rooi, 'hou nie van' in swart.

TIRR is getoets teen samewerkende filter en inhoudgebaseerde stelsels met 'n soortgelyke omvang, insluitend die navorsers se vorige werk ImRec (sien hierbo), en RECON, 'n RRS van 2010, sowel as die samewerkende filteralgoritmes RCF ('n 2015 dating RRS gebaseer op teks inhoud van dating profiele) en LFRR ('n Soortgelyke projek vanaf 2019).

In alle gevalle was TIRR in staat om voortreflike akkuraatheid te bied, hoewel slegs marginaal in vergelyking met LFRR, wat moontlik korrelerende faktore tussen profielteksinhoud en die waargenome vlak van aantreklikheid van die proefpersone se profielfoto's aandui.

Die byna gelykheid tussen beeldgebaseerde TIRR en die meer teksgebaseerde LFRR maak voorsiening vir ten minste twee moontlikhede: dat gebruikers se persepsie van visuele aantreklikheid deur die teksinhoud van profiele beïnvloed word; of dat teksinhoud groter aandag en goedkeuring geniet as wat kon gebeur het as die gepaardgaande prentjie nie as aantreklik ervaar is nie.

Om ooglopende redes is die navorsingspan nie in staat om die datastel of bronkode vir TIRR vry te stel nie, maar moedig ander spanne aan om hul benadering te dupliseer en te bevestig.

 

NB Die beelde wat in die hoofillustrasie gebruik word, is van thispersondoesnotexist.com.