Kunsmatige Intelligensie
'n AI Soulmate-aanbevelingstelsel wat slegs op beelde gebaseer is

Navorsers van die Verenigde Koninkryk het neurale netwerke gebruik om 'n volledig beeldgebaseerde aanbevelingstelsel vir aanlyn-afspraakpassings te ontwikkel wat slegs in ag neem of twee gebruikers tot mekaar se foto's aangetrokke is (eerder as profielinligting soos werk, ouderdom, ens.), en het gevind dat dit beter presteer as minder 'vlakkige' stelsels in terme van die verkryging van 'n akkurate passing.
Die gevolglike stelsel word Temporal Image-Based Reciprocal Recommender (TIRR) genoem, en gebruik Recurrent Neural Networks (RNN's) om 'n gebruiker se historiese voorkeur vir gesigte te interpreteer wat hy of sy teëkom terwyl hy of sy na potensiële ooreenkomste blaai.
Die papier is geregtig – miskien ontmoedigend – Foto's is al wat jy nodig het vir wederkerige aanbeveling in aanlyn-afsprake, en kom van twee navorsers aan die Universiteit van Bristol, wat veral verbeter op 'n soortgelyke stelsel (genoem ImRec) vrygestel deur dieselfde span in 2020.
In toetse het die stelsel die nuutste akkuraatheid in sy vermoë om te voorspel verkry wedersydse ooreenstemmings tussen gebruikers, wat nie net die navorsers se 2020-werk verbeter nie, maar ook ander inhoudsgebaseerde wederkerige aanbevelingstelsels vir afsprake wat rekening hou met meer gedetailleerde, teksgebaseerde inligting in afspraakprofiele.
Real World Dating Dataset
TIRR is opgelei op gebruikersinligting wat verskaf is deur 'n naamlose 'gewilde' aanlyn-afspraakdiens met 'verskeie miljoene geregistreerde gebruikers', wat gebruikers slegs toelaat om met mekaar te kommunikeer sodra elkeen die ander se profiel 'gelike' het. Die subversameling data wat gebruik is, het 200 000 proefpersone ingesluit, gelykop verdeel tussen mans en vroue, en ongeveer 800 000 gebruikersuitgedrukte voorkeure oor al die afspraakprofiele.
Aangesien die anonieme afspraakdiens wat die data verskaf slegs heteroseksuele passings ondersteun, is slegs mans/vroulike passings in die navorsing gedek.
TIRR verbeter op vorige wederkerige aanbevelingstelsels (RRS) ontwerpe in hierdie veld deur die waarskynlikheid van 'n passing tussen twee profiele direk te bereken, uitsluitlik gebaseer op profielbeelde. Vorige stelsels het eerder twee eenrigtingvoorkeure voorspel en dit dan saamgevoeg om 'n voorspelling te verkry.
Die navorsers het gebruikers uitgesluit wat van die afspraakdiens verwyder is (om enige rede, insluitend vrywillige vertrek), en profiele uitgesluit wat nie gesiggebaseerde foto's ingesluit het nie.
Gebruikersgeskiedenis is beperk tot een jaar terug, om potensiële afwykings te vermy wat kan voorkom as die afspraakwebwerf sy algoritmes mettertyd aangepas het. Hulle was ook beperk tot 'n maksimum van 15 gebruikersvoorkeure, aangesien dit gedemonstreer is as voldoende om die modelontwerp te bewys, terwyl meer uitgebreide gebruik van voorkeure prestasie en opleidingstye verswak het.
Boonop het sommige van die meer ywerige of langtermyngebruikers geskiedenis gehad duisende van voorkeure, wat die gevaar kon gevaar het om die gewig van die verkrygde kenmerke te skeef, en oefentye verder te verleng.
Siamese netwerk
TIRR word geformuleer deur gebruik te maak van a Siamese netwerk, tipies gebruik vir 'eenmalige' leer.

'n Sjabloon Siamese netwerk, waar parallelle Convolutional Neural Networks (CNN's) gewigte deel, maar nie data nie. Hulle deel ook 'n verliesfunksie afgelei van die uitsette van elke CNN, en 'n grondwaarheidsetiket. Bron: https://arxiv.org/pdf/2108.11714.pdf
Die netwerk is opgelei met behulp van binêre kruisentropie, 'n algemene verliesfunksie in neurale netwerke, en een wat die navorsers bevind het om beter resultate te lewer in vergelyking met kontrasiewe verliesLaasgenoemde is die doeltreffendste in stelsels wat pariteit tussen twee vlakke evalueer, maar aangesien dit nie die doelwit van TIRR is nie, is dit 'n benadering wat swak presteer in hierdie konteks.
Dit is nodig vir die stelsel om inligting wat dit ontwikkel te behou en daarop voort te bou soos die opleiding baie keer oor dieselfde data herhaal, en die Siamese netwerk in TIRR gebruik 'n LSTM (Langtermyn Korttermyn Geheue) netwerk om hierdie besluite te neem, en om te verseker dat kenmerke wat as relevant geag word nie ad hoc weggegooi word nie, aangesien die raamwerk sy insigte bou.
Die navorsers het bevind dat die netwerk baie stadig geoefen het toe al die data ingevoer is, en het die opleiding vervolgens in drie fases verdeel deur drie verskillende subgroepe van die data te gebruik. Daar is 'n bykomende voordeel hierin, aangesien die navorsers se 2020-eksperimente reeds getoon het dat die afsonderlike opleiding van die manlike en vroulike datastelle die werkverrigting van 'n wederkerige aanbevelingstelsel verbeter.

Die uiteensetting van afsonderlike opleidingsessies vir TIRR se Siamese netwerk.
toets
Om TIRR se prestasie te evalueer, het die navorsers 'n gedeelte van die verkrygde data eenkant gehou en dit deur die volledig gekonvergeerde stelsel laat loop. Aangesien die stelsel egter redelik nuut is, is daar geen direk analoë vorige stelsels waarmee dit vergelyk kan word nie.
Daarom het die navorsers eers 'n Ontvanger Bedryfskenmerkkromme (ROC) basislyn vir die Siamese netwerk, voor gebruik van Uniform Manifold Approximation and Projection for Dimensionity Reduction (UMAP) om die 128-dimensionele vektore te skraal vir maklike visualisering, om 'n samehangende vloei van voor- en afkeure te vestig.

Aan die linkerkant, die ROC van die Siamese netwerk as 'n basislyn-aanwyser van prestasie; aan die regterkant wys die UMAP-visualisering 'likes' in rooi, 'dislikes' in swart.
TIRR is getoets teen samewerkende filter- en inhoudgebaseerde stelsels met 'n soortgelyke omvang, insluitend die navorsers se vorige werk ImRec (sien hierbo), en RECON, 'n RRS van 2010, sowel as die samewerkende filteralgoritmes RCF ('n 2015 dating RRS gebaseer op teks inhoud van dating profiele) en LFRR ('n Soortgelyke projek vanaf 2019).

In alle gevalle kon TIRR beter akkuraatheid bied, hoewel slegs marginaal in vergelyking met LFRR, wat moontlik dui op korrelerende faktore tussen profielteksinhoud en die waargenome vlak van aantreklikheid van die proefpersone se profielfoto's.
Die byna gelykheid tussen beeldgebaseerde TIRR en die meer teksgebaseerde LFRR maak voorsiening vir ten minste twee moontlikhede: dat gebruikers se persepsie van visuele aantreklikheid beïnvloed word deur die teksinhoud van profiele; of dat teksinhoud groter aandag en goedkeuring ontvang as wat sou gebeur het as die geassosieerde prentjie nie as aantreklik beskou is nie.
Om ooglopende redes is die navorsingspan nie in staat om die datastel of bronkode vir TIRR vry te stel nie, maar moedig ander spanne aan om hul benadering te dupliseer en te bevestig.
NB Die beelde wat in die hoofillustrasie gebruik word, is van thispersondoesnotexist.com.













