Artificial Intelligence

Een AI Soulmate-aanbevelingssysteem dat alleen is gebaseerd op afbeeldingen

Bijgewerkt on 27 Augustus 2021

Onderzoekers uit het VK hebben neurale netwerken gebruikt om een volledig op afbeeldingen gebaseerd aanbevelingssysteem voor online datingmatches te ontwikkelen dat alleen rekening houdt met het feit of twee gebruikers zich aangetrokken voelen tot elkaars foto's (in plaats van profielinformatie zoals baan, leeftijd, enz. ), en hebben ontdekt dat het beter presteert dan minder 'oppervlakkige' systemen wat betreft het verkrijgen van een nauwkeurige match.

Het resulterende systeem heet Temporal Image-Based Reciprocal Recommender (TIRR) en gebruikt Recurrent Neural Networks (RNN's) om de historische voorkeur van een gebruiker voor gezichten die hij of zij tegenkomt tijdens het zoeken naar mogelijke overeenkomsten te interpreteren.

De papier heeft – misschien ontmoedigend – het recht Foto's zijn alles wat u nodig heeft voor wederzijdse aanbeveling bij online dating, en is afkomstig van twee onderzoekers van de Universiteit van Bristol, die met name een soortgelijk systeem hebben verbeterd (genaamd ImRec) uitgebracht door hetzelfde team in 2020.

In tests behaalde het systeem de allernieuwste nauwkeurigheid in zijn vermogen om te voorspellen wederzijds overeenkomsten tussen gebruikers, wat niet alleen het werk van de onderzoekers in 2020 verbetert, maar ook andere op inhoud gebaseerde wederzijdse aanbevelingssystemen voor daten die rekening houden met meer gedetailleerde, op tekst gebaseerde informatie in datingprofielen.

Dataset voor daten in de echte wereld

TIRR is getraind op gebruikersinformatie van een naamloze 'populaire' online datingservice met 'enkele miljoenen geregistreerde gebruikers', die gebruikers pas in staat stelt met elkaar te communiceren als ze elkaars profiel hebben 'geliked'. De subset van gebruikte gegevens omvatte 200,000 proefpersonen, gelijk verdeeld tussen mannen en vrouwen, en ongeveer 800,000 door gebruikers uitgedrukte voorkeuren voor alle datingprofielen.

Aangezien de anonieme datingservice die de gegevens levert alleen heteroseksuele matches ondersteunt, werden alleen mannelijke/vrouwelijke matches in het onderzoek meegenomen.

TIRR verbetert eerdere ontwerpen van wederzijdse aanbevelingssystemen (RRS) op dit gebied door rechtstreeks de waarschijnlijkheid van een match tussen twee profielen te berekenen, uitsluitend op basis van profielafbeeldingen. Eerdere systemen voorspelden in plaats daarvan twee unidirectionele voorkeuren en voegden deze vervolgens samen om een voorspelling te verkrijgen.

De onderzoekers sloten gebruikers uit die uit de datingservice waren verwijderd (om welke reden dan ook, inclusief vrijwillig vertrek), en sloten profielen uit die geen op gezichten gebaseerde foto's bevatten.

De gebruikersgeschiedenis was beperkt tot een jaar geleden, om mogelijke afwijkingen te voorkomen die zouden kunnen optreden wanneer de datingsite zijn algoritmen in de loop van de tijd aanpaste. Ze waren ook beperkt tot maximaal 15 gebruikersvoorkeuren, aangezien werd aangetoond dat deze voldoende waren om het ontwerp van het model te bewijzen, terwijl uitgebreider gebruik van voorkeuren de prestaties verminderde en de trainingstijd verlengde.

Bovendien hadden enkele van de meer enthousiaste of langdurige gebruikers een geschiedenis met duizenden kosten van voorkeuren, die het risico hadden kunnen lopen om het gewicht van de verkregen kenmerken scheef te trekken en de trainingstijd verder te verlengen.

Siamees Netwerk

TIRR is geformuleerd met behulp van een Siamese netwerk, meestal gebruikt voor 'eenmalig' leren.

Een sjabloon Siamese netwerk, waar parallelle Convolutional Neural Networks (CNN's) gewichten delen, maar geen gegevens. Ze delen ook een verliesfunctie die is afgeleid van de uitgangen van elke CNN, en een grondwaarheidslabel. Bron: https://arxiv.org/pdf/2108.11714.pdf

Het netwerk werd getraind met behulp van binaire crossentropie, een veel voorkomende verliesfunctie in neurale netwerken, en een functie waarvan de onderzoekers vonden dat deze superieure resultaten opleverde vergeleken met contrastief verlies. Dit laatste is het meest effectief in systemen die de pariteit tussen twee gezichten evalueren, maar aangezien dit niet het doel van TIRR is, is het een benadering die in deze context slecht presteert.

Het is noodzakelijk dat het systeem de informatie die het ontwikkelt vasthoudt en erop voortbouwt, aangezien de training vele malen herhaald wordt over dezelfde gegevens, en het Siamese netwerk in TIRR gebruikt een LSTM (Long Term Short-Term Memory) netwerk om deze beslissingen te nemen en om ervoor te zorgen dat kenmerken die relevant worden geacht niet ad hoc worden weggegooid terwijl het raamwerk zijn inzichten opbouwt.

De specifieke Siamese netwerkarchitectuur voor TIRR.

De onderzoekers ontdekten dat het netwerk heel langzaam trainde toen alle gegevens waren ingevoerd, en splitsten de training vervolgens op in drie fasen met behulp van drie verschillende subsets van de gegevens. Dit heeft een bijkomend voordeel, aangezien de experimenten van de onderzoekers in 2020 al hadden aangetoond dat het afzonderlijk trainen van de mannelijke en vrouwelijke datasets de prestaties van een wederzijds aanbevelingssysteem verbetert.

De uitsplitsing van afzonderlijke trainingssessies voor het Siamese netwerk van TIRR.

Testen

Om de prestaties van TIRR te evalueren, hielden de onderzoekers een deel van de verkregen gegevens opzij en lieten deze door het volledig geconvergeerde systeem lopen. Aangezien het systeem echter vrij nieuw is, zijn er geen direct analoge eerdere systemen waarmee het kan worden vergeleken.

Daarom hebben de onderzoekers eerst een Receiver Operating Characteristic Curve (ROC) basislijn voor het Siamese netwerk, voordat Uniform Manifold Approximation and Projection voor Dimensionality Reduction (UMAP) om de 128-dimensionale vectoren af te slanken voor gemakkelijke visualisatie, om een samenhangende stroom van voorkeuren en antipathieën tot stand te brengen.

Links het ROC van het Siamese netwerk als basisindicator voor prestaties; aan de rechterkant toont de UMAP-visualisatie 'vind-ik-leuks' in rood, 'niet-leuks' in zwart.

TIRR werd getest tegen collaboratieve filtering en op inhoud gebaseerde systemen met een vergelijkbare reikwijdte, inclusief het eerdere werk ImRec van de onderzoekers (zie hierboven), en RECON, een RRS uit 2010, evenals de collaboratieve filteralgoritmen RCF (een dating-RRS uit 2015 op basis van tekstinhoud van datingprofielen) en LFRR (een soortgelijk project uit 2019).

In alle gevallen was TIRR in staat superieure nauwkeurigheid te bieden, hoewel slechts marginaal vergeleken met LFRR, wat mogelijk wijst op correlatiefactoren tussen profieltekstinhoud en het waargenomen niveau van aantrekkelijkheid van de profielfoto's van de proefpersonen.

De bijna-pariteit tussen op afbeeldingen gebaseerde TIRR en de meer op tekst gebaseerde LFRR biedt ten minste twee mogelijkheden: dat de perceptie van gebruikers van visuele aantrekkelijkheid wordt beïnvloed door de tekstinhoud van profielen; of dat tekstinhoud meer aandacht en goedkeuring krijgt dan zou zijn gebeurd als de bijbehorende afbeelding niet als aantrekkelijk zou worden ervaren.

Om voor de hand liggende redenen kan het onderzoeksteam de dataset of broncode voor TIRR niet vrijgeven, maar moedigt het andere teams aan om hun aanpak te dupliceren en te bevestigen.

nb De afbeeldingen die in de hoofdafbeelding worden gebruikt, zijn afkomstig van thispersondoesnoexist.com.

Verenigende spraak- en gebarensynthese

Mis het niet

Babydetectorsoftware bewaakt hart- en ademhalingsfrequenties

Martin Anderson

Schrijver over machine learning, kunstmatige intelligentie en big data.
Persoonlijke site: martinanderson.ai
Contact: [e-mail beveiligd]
Twitter: @manders_ai

Verenig.AI

Een AI Soulmate-aanbevelingssysteem dat alleen is gebaseerd op afbeeldingen

Artificial Intelligence