taló Un sistema de recomanació d'AI Soulmate basat només en imatges - Unite.AI
Connecteu-vos amb nosaltres

Intel·ligència Artificial

Un sistema de recomanació d'AI Soulmate basat només en imatges

mm
actualitzat on

Els investigadors del Regne Unit han utilitzat xarxes neuronals per desenvolupar un sistema de recomanació totalment basat en imatges per a coincidències de cites en línia que només té en compte si dos usuaris se senten atrets per les fotos de l'altre (en lloc d'informació de perfil com la feina, l'edat, etc.). ), i han trobat que supera els sistemes menys "superficials" pel que fa a l'obtenció d'una coincidència precisa.

El sistema resultant s'anomena Recomanador recíproc basat en imatges temporals (TIRR) i utilitza xarxes neuronals recurrents (RNN) per interpretar la predilecció històrica d'un usuari per les cares que es troba mentre busca possibles coincidències.

El paper es titula -potser de manera descoratjadora- Les fotos són tot el que necessiteu per a una recomanació recíproca a les cites en línia, i prové de dos investigadors de la Universitat de Bristol, millorant notablement un sistema similar (anomenat ImRec) llançat pel mateix equip el 2020.

En les proves, el sistema va obtenir una precisió d'última generació en la seva capacitat de predicció recíproc coincidències entre usuaris, millorant no només el treball dels investigadors per al 2020, sinó també altres sistemes de recomanació recíproca de cites basats en contingut que tenen en compte informació més detallada i basada en text als perfils de cites.

Conjunt de dades de cites del món real

TIRR va rebre formació sobre la informació d'usuari proporcionada per un servei de cites en línia "popular" sense nom amb "diversos milions d'usuaris registrats", que només permet als usuaris comunicar-se entre ells una vegada que a cadascun li ha "agradat" el perfil de l'altre. El subconjunt de dades utilitzades incloïa 200,000 subjectes, repartits de manera uniforme entre homes i dones, i aproximadament 800,000 preferències expressades per l'usuari a tots els perfils de cites.

Com que el servei de cites anònims que proporciona les dades només admet coincidències heterosexuals, a la investigació només es van tractar les coincidències entre homes i dones.

TIRR millora els dissenys anteriors de sistemes de recomanació recíproca (RRS) en aquest camp calculant directament la probabilitat de coincidència entre dos perfils, basant-se únicament en imatges de perfil. Els sistemes anteriors, en canvi, van predir dues preferències unidireccionals i després les van agregar per obtenir una predicció.

Els investigadors van excloure els usuaris que havien estat eliminats del servei de cites (per qualsevol motiu, inclosa l'abandonament voluntària) i van excloure els perfils que no incloïen fotos basades en la cara.

Els historials d'usuari es van limitar a un any enrere, per tal d'evitar possibles anomalies que es poguessin produir a mesura que el lloc de cites modificava els seus algorismes amb el pas del temps. També es van limitar a un màxim de 15 preferències d'usuari, ja que es van demostrar que són suficients per demostrar el disseny del model, mentre que l'ús més extens de les preferències va degradar el rendiment i augmentar els temps d'entrenament.

A més, alguns dels usuaris més àvids o a llarg termini tenien antecedents milers de preferències, que podrien haver corregut el risc de distorsionar el pes de les característiques obtingudes i allargar encara més els temps d'entrenament.

Xarxa siamesa

El TIRR es formula mitjançant a Xarxa siamesa, normalment utilitzat per aprenentatge "d'un sol cop"..

Una plantilla de xarxa siamesa, on les xarxes neuronals convolucionals (CNN) paral·leles comparteixen pesos però no dades. També comparteixen una funció de pèrdua derivada de les sortides de cada CNN i una etiqueta de veritat terrestre. Font: https://arxiv.org/pdf/2108.11714.pdf

Una plantilla de xarxa siamesa, on les xarxes neuronals convolucionals (CNN) paral·leles comparteixen pesos però no dades. També comparteixen una funció de pèrdua derivada de les sortides de cada CNN i una etiqueta de veritat terrestre.  Font: https://arxiv.org/pdf/2108.11714.pdf

La xarxa es va entrenar mitjançant l'entropia binària, una funció de pèrdua comuna a les xarxes neuronals, i que els investigadors van trobar que donava resultats superiors en comparació amb pèrdua contrastiva. Aquest últim és més efectiu en sistemes que avaluen la paritat entre dues cares, però com que aquest no és l'objectiu del TIRR, és un enfocament que funciona malament en aquest context.

És necessari que el sistema conservi i es construeixi a partir de la informació que desenvolupa a mesura que la formació itera moltes vegades sobre les mateixes dades, i la xarxa siamesa a TIRR utilitza un LSTM (Memòria a curt termini a llarg termini) per prendre aquestes decisions i assegurar-se que les funcions que es consideren rellevants no es descarten ad hoc mentre el marc construeix els seus coneixements.

L'arquitectura de xarxa siamesa específica per a TIRR.

L'arquitectura de xarxa siamesa específica per a TIRR.

Els investigadors van trobar que la xarxa es va entrenar molt lentament quan es van introduir totes les dades i, posteriorment, van dividir la formació en tres etapes utilitzant tres subconjunts diferents de dades. Hi ha algun avantatge addicional en això, ja que els experiments dels investigadors del 2020 ja havien demostrat que entrenar els conjunts de dades masculins i femenins per separat millora el rendiment d'un sistema de recomanació recíproca.

El desglossament de sessions d'entrenament separades per a la xarxa siamesa de TIRR.

El desglossament de sessions d'entrenament separades per a la xarxa siamesa de TIRR.

Proves

Per avaluar el rendiment de TIRR, els investigadors van mantenir una part de les dades obtingudes a un costat i les van executar a través del sistema totalment convergent. Tanmateix, com que el sistema és força nou, no hi ha sistemes anteriors directament anàlegs als quals es pugui comparar.

Per tant, els investigadors van establir primer una corba característica de funcionament del receptor (ROCK) per a la xarxa siamesa, abans d'utilitzar l'aproximació i la projecció de múltiples uniformes per a la reducció de la dimensionalitat (UMAP) per reduir els vectors de 128 dimensions per facilitar la visualització, per tal d'establir un flux coherent de m'agrada i no m'agrada.

A l'esquerra, el ROC de la xarxa siamesa com a indicador bàsic de rendiment; a la dreta, la visualització de l'UMAP mostra "m'agrada" en vermell, "no m'agrada" en negre.

A l'esquerra, el ROC de la xarxa siamesa com a indicador bàsic de rendiment; a la dreta, la visualització de l'UMAP mostra "m'agrada" en vermell, "no m'agrada" en negre.

TIRR es va provar amb sistemes de filtratge col·laboratiu i basats en contingut amb un àmbit similar, inclòs el treball previ dels investigadors ImRec (vegeu més amunt) i RECONEIXEU, un RRS del 2010, així com els algorismes de filtratge col·laboratiu RCF (un RRS de cites del 2015 basat en el contingut de text dels perfils de cites) i LFRR (un projecte similar del 2019).

En tots els casos, TIRR va poder oferir una precisió superior, encara que només marginalment en comparació amb LFRR, possiblement indicant factors de correlació entre el contingut del text del perfil i el nivell d'atractiu percebut de les fotos de perfil dels subjectes.

La gairebé paritat entre el TIRR basat en imatges i el LFRR més basat en text permet almenys dues possibilitats: que la percepció dels usuaris de l'atractiu visual estigui influenciada pel contingut de text dels perfils; o que el contingut del text rebi més atenció i aprovació de la que hauria tingut lloc si la imatge associada no s'hagués percebut com a atractiva.

Per raons òbvies, l'equip d'investigació no pot publicar el conjunt de dades o el codi font per a TIRR, però anima a altres equips a duplicar i confirmar el seu enfocament.

 

nb Les imatges utilitzades a la il·lustració principal són de thispersondoesnotexist.com.