stub Ainult piltidel põhinev AI-soovitussüsteem – Unite.AI
Ühenda meile

Tehisintellekt

AI hingesugulase soovitussüsteem, mis põhineb ainult piltidel

mm
Ajakohastatud on

Ühendkuningriigi teadlased on kasutanud närvivõrke, et töötada välja täielikult pildipõhise soovitamissüsteemi online-tutvumismatšide jaoks, mis võtab arvesse ainult seda, kas kahte kasutajat tõmbavad üksteise fotod või mitte (mitte profiiliteave, nagu töö, vanus jne. ) ja on avastanud, et see ületab täpse vaste saamise osas vähem madalaid süsteeme.

Saadud süsteem kannab nime Temporal Image-Based Reciprocal Recommender (TIRR) ja kasutab korduvaid närvivõrke (Recurrent Neural Networks – RNN), et tõlgendada kasutaja ajaloolist eelsoodumust nägude suhtes, millega ta potentsiaalsete vastete otsimisel kokku puutub.

. paber on õigustatud – võib-olla masendav – Fotod on kõik, mida vajate veebitutvumises vastastikuseks soovituseksja pärineb kahelt Bristoli ülikooli teadurilt, täiustades märkimisväärselt sarnast süsteemi (nn ImRec), mille sama meeskond avaldas 2020. aastal.

Testides saavutas süsteem tipptasemel täpsuse oma ennustamisvõimes vastastikune kasutajatevahelised vasted, parandades mitte ainult teadlaste 2020. aasta tööd, vaid ka teisi sisupõhiseid tutvumissoovitussüsteeme, mis võtavad arvesse tutvumisprofiilides sisalduvat üksikasjalikumat tekstipõhist teavet.

Pärismaailma tutvumisandmete kogum

TIRR-i koolitati kasutajateabe alal, mida andis nimetu "populaarne" Interneti-tutvumisteenus, millel on "mitu miljonit registreeritud kasutajat", mis võimaldab kasutajatel üksteisega suhelda alles siis, kui igaühele on teise profiili meeldinud. Kasutatud andmete alamhulk hõlmas 200,000 800,000 subjekti, mis jagunesid võrdselt meeste ja naiste vahel, ning ligikaudu XNUMX XNUMX kasutaja väljendatud eelistust kõigi tutvumisprofiilide lõikes.

Kuna andmeid pakkuv anonüümne tutvumisteenus toetab ainult heteroseksuaalseid vasteid, hõlmati uuringus ainult meeste/naiste vasteid.

TIRR täiustab selle valdkonna varasemaid vastastikuste soovitussüsteemide (RRS) kujundusi, arvutades otse kahe profiili vahelise vastavuse tõenäosuse, tuginedes ainult profiilipiltidele. Varasemad süsteemid ennustasid selle asemel kahte ühesuunalist eelistust ja seejärel koondasid need prognoosi saamiseks.

Uurijad jätsid välja kasutajad, kes olid kohtinguteenusest eemaldatud (mis tahes põhjusel, sealhulgas vabatahtlikult lahkumisel), ja profiilid, mis ei sisaldanud näopõhiseid fotosid.

Kasutajate ajalugu piirati ühe aastaga, et vältida võimalikke kõrvalekaldeid, mis võivad tekkida, kui tutvumissait aja jooksul oma algoritme kohandas. Neid piirati ka maksimaalselt 15 kasutaja eelistusega, kuna näidati, et need on mudeli disaini tõestamiseks piisavad, samas kui eelistuste ulatuslikum kasutamine halvendas jõudlust ja pikendas treeninguaega.

Lisaks oli mõnel innukamal või pikaajalisel kasutajal ajalugu tuhandeid eelistustest, mis oleks võinud moonutada saadud funktsioonide kaalu ja pikendada treeninguaegu veelgi.

Siiami võrk

TIRR formuleeritakse kasutades a Siiami võrk, mida tavaliselt kasutatakse "ühekordne" õppimine.

Siiami võrgu mall, kus paralleelsed konvolutsioonilised närvivõrgud (CNN) jagavad kaalu, kuid mitte andmeid. Neil on ka iga CNN-i väljunditest tuletatud kadufunktsioon ja põhitõemärgis. Allikas: https://arxiv.org/pdf/2108.11714.pdf

Siiami võrgu mall, kus paralleelsed konvolutsioonilised närvivõrgud (CNN) jagavad kaalu, kuid mitte andmeid. Neil on ka iga CNN-i väljunditest tuletatud kadufunktsioon ja põhitõemärgis.  Allikas: https://arxiv.org/pdf/2108.11714.pdf

Võrku koolitati, kasutades binaarset ristentroopiat, mis on närvivõrkudes tavaline kadufunktsioon ja mis andis teadlaste arvates paremaid tulemusi võrreldes kontrastiivne kadu. Viimane on kõige tõhusam süsteemides, mis hindavad kahe tahu pariteeti, kuid kuna see ei ole TIRR-i eesmärk, toimib see lähenemisviis selles kontekstis halvasti.

Süsteem peab säilitama ja arendama teavet, mida ta arendab, kuna koolitus kordub samade andmetega mitu korda ning TIRR-i Siiami võrk kasutab LSTM (Pikaajaline lühiajaline mälu) võrku, et teha need otsused ja tagada, et asjakohaseks peetud funktsioone ei jäetaks ad hoc kõrvale, kui raamistik oma teadmisi koostab.

TIRR-i spetsiifiline siiami võrguarhitektuur.

TIRR-i spetsiifiline siiami võrguarhitektuur.

Uurijad leidsid, et võrk treenis kõigi andmete sisestamisel väga aeglaselt ja jagas koolituse kolmeks etapiks, kasutades kolme erinevat andmete alamhulka. Sellel on täiendav eelis, kuna teadlaste 2020. aasta katsed näitasid juba, et meeste ja naiste andmekogumite eraldi treenimine parandab vastastikuse soovitussüsteemi toimimist.

TIRRi siiami võrgu eraldi koolituste jaotus.

TIRRi siiami võrgu eraldi koolituste jaotus.

Testimine

TIRR-i toimivuse hindamiseks hoidsid teadlased osa saadud andmetest ühel küljel ja viisid need läbi täielikult ühtlustunud süsteemi. Kuna süsteem on aga üsna uudne, siis otseselt analoogseid varasemaid süsteeme, millega seda võrrelda, ei ole.

Seetõttu koostasid teadlased esmalt vastuvõtja töökarakteristiku kõvera (ROC) Siiami võrgu baasjoon, enne kui kasutate mõõtmete vähendamiseks ühtset kollektori lähendamist ja projektsiooni (UMAP), et vähendada 128-mõõtmelisi vektoreid hõlpsaks visualiseerimiseks, et luua ühtne meeldimiste ja mittemeeldimiste voog.

Vasakul Siiami võrgu ROC jõudluse lähtenäitajana; Paremal on UMAP-i visualiseering punasega "meeldib" ja "ei meeldi" mustaga.

Vasakul Siiami võrgu ROC jõudluse lähtenäitajana; Paremal on UMAP-i visualiseering punasega "meeldib" ja "ei meeldi" mustaga.

TIRR-i testiti sarnase ulatusega koostööfiltreerimise ja sisupõhiste süsteemide suhtes, sealhulgas teadlaste varasema töö ImRec (vt eespool) ja HELISTA, RRS aastast 2010, samuti koostööpõhised filtreerimisalgoritmid RCF (2015. a tutvumisprofiilide tekstisisul põhinev tutvumine RRS) ja LFRR (sarnane projekt aastast 2019).

Kõigil juhtudel suutis TIRR pakkuda suurepärast täpsust, kuigi LFRR-iga võrreldes vaid vähesel määral, mis võib viidata profiiliteksti sisu ja katsealuste profiilifotode tajutava atraktiivsuse taseme korrelatsiooniteguritele.

Pildipõhise TIRR-i ja rohkem tekstipõhise LFRR-i vaheline paarisus võimaldab vähemalt kahte võimalust: kasutajate taju visuaalsest atraktiivsusest mõjutab profiilide tekstisisu; või tekstisisu pälvib suuremat tähelepanu ja heakskiitu, kui oleks võinud juhtuda, kui sellega seotud pilti ei peetaks atraktiivseks.

Arusaadavatel põhjustel ei saa uurimisrühm TIRR-i andmestikku ega lähtekoodi välja anda, kuid julgustab teisi meeskondi oma lähenemisviisi dubleerima ja kinnitama.

 

nb Põhiillustratsioonil kasutatud pildid pärinevad saidilt thispersondoesnotexist.com.