stub Arvustuste kasutamine toimiva soovitussüsteemi loomiseks – Unite.AI
Ühenda meile

Tehisintellekt

Arvustuste kasutamine toimiva soovitussüsteemi loomiseks

mm
Ajakohastatud on

Kui olete kunagi ostnud toote Internetist ja imestanud ostu- ja müügijärgsete kaupade mõttetuse ja mittekasutatavuse üle, saate juba aru, et populaarne ja tavapärane soovitussüsteemid ei pruugi tulevaste ostude vahelistest suhetest aru saada.

Kui ostate ebatõenäolise ja harvaesineva eseme, näiteks ahju, on soovitused teistele ahjudele tõenäoliselt üleliigsed, kuigi halvimad soovitussüsteemid ei suuda seda tunnistada. Näiteks 2000. aastatel tekitas TiVO soovitussüsteem selles sektoris varajase poleemika tajutava seksuaalsuse ümbermääramine kasutajast, kes püüdis hiljem sõjafilme valides oma kasutajaprofiili "uuesti maskuliiniseerida" – see on algoritmi revisjoni toores lähenemine.

Mis veelgi hullem, ei pea te tegelikult midagi ostma (näiteks) Amazonist ega alustama filmi vaatamist, mille kirjeldust sirvite mis tahes suuremal voogesitusplatvormil. infonäljas soovituslikud algoritmid, et alustada rõõmsalt valest teest; Piisab otsingutest, peatumistest ja klõpsamistest üksikasjade lehtedel ning see napp (ja tõenäoliselt vale) teave säilib tõenäoliselt platvormi tulevastel sirvimisseanssidel.

Proovin Recommenderi süsteemi unustada

Mõnikord on võimalik sekkuda: Netflix pakub pöidla üles/alla süsteemi, mis peaks teoreetiliselt aitama selle masinõppe algoritmidel eemaldada teie soovituste profiilist teatud manustatud mõisted ja sõnad (kuigi selle tõhusus on küsitletud, ja isikupärastatud soovitusalgoritmi nullist väljatöötamine on palju lihtsam kui see on soovimatute ontoloogiate eemaldamine), samal ajal kui Amazon seda võimaldab eemaldada pealkirjad teie kliendiajaloost, mis peaks viima madalamale versioonile kõik soovimatud domeenid, mis teie soovitustesse imbusid.

Hulul on a sarnane funktsioon, samas kui HBO Maxil on osaliselt taandunud ainult algoritmipõhistest soovitussüsteemidest, pidades silmas nende praegusi puudujääke.

Ükski neist rangelt tarbija tasemel kogemustest ei puuduta isegi laialt levinud ja kasvavat kriitikat passiivsete reklaamiplatvormide soovitussüsteemide (kus märkimisväärne muutus on tulemas avaliku viha tõttu) või sotsiaalmeedia AI soovituste sütitav teema, kus saidid nagu Youtube, puperdama ja Facebook jätkuvalt taluma kriitikat ebaoluliste või isegi kahjulike soovituste pärast.

Tundub, et masin ei tea, mida me tahame, välja arvatud juhul, kui me seda tahame külgnev üksus mis meie otsingus esile kerkisid – isegi kui see üksus on sisuliselt äsja ostetud peamise kauba duplikaat või alternatiiv, mitte potentsiaalne täiendav või lisaost.

Täpsed soovitused koos ülevaatusandmetega

Hiina ja Austraalia uus teaduskoostöö pakub uudset meetodit selliste mittesobivate soovituste käsitlemiseks, kasutades väliseid kasutajate ülevaateid, et saada paremini aru kaupade tegelikest suhetest ostuseansil. Testides ületas arhitektuur kõiki praeguseid nüüdisaegseid meetodeid, pakkudes lootust soovitussüsteemidele, millel on parem üksuste sõltuvuste sisemine kaart:

RI-GNN edestab peamisi konkurente üksustevaheliste suhete täpsuse poolest, toimides kõige paremini seanssidel, kus on rohkem kui viis üksust. Süsteemi testiti Amazon Review Data (2018) lemmikloomatarvete ja -filmide ning telerite andmekogumite suhtes. Allikas: https://arxiv.org/pdf/2201.12532.pdf

RI-GNN edestab peamisi konkurente üksustevaheliste suhete täpsuse poolest, toimides kõige paremini seanssidel, kus on rohkem kui viis üksust. Süsteemi testiti lemmikloomatarvete ja filmide ning telesaadete andmekogude suhtes Amazoni ülevaateandmed (2018).  Allikas: https://arxiv.org/pdf/2201.12532.pdf

Käivitamiseks käsitleb projekt märkimisväärset väljakutset soovituste loomisel isegi anonüümsete seansside käigus, kus soovitussüsteemil pole juurdepääsu kasutajate lisatud üksikasjadele, nagu ostuajalugu või kasutaja enda veebiülevaadetele varasemate ostude kohta.

Uus paber kutsutakse Seansipõhistes soovitustes külgneva sõltuvuse ümbermõtestamine, ning pärineb Qilu Tehnikaülikooli ja Hiina Pekingi Tehnoloogiainstituudi teadlastelt, Melbourne'i RMIT ülikoolist ja Sydney Tehnikaülikooli Austraalia Tehisintellekti Instituudist.

Mis edasi?

Seansipõhiste soovituste (SBR) põhiülesanne on määrata praegusest üksusest „järgmine” üksus, võttes aluseks selle arvutatud seose praeguse üksusega. Praktikas võib see ilmneda poodide veebisaidi linnupuuri kaubalehel olevate „seotud üksuste” loendina.

Kui ostate linnupuuri, siis mida veel tõenäoliselt vajate? Noh, vähemalt on teil vaja lindu, kes sellesse panna – see on a tõeline sõltuvus. Linnupuur on aga ontoloogias esile tõstetud lemmikloomakaubad, kus linde ei müüda. Perversselt, kassitoit kuulub samasse ontoloogiasse, kuigi kasside toitmiskausi lisamine linnupuuritoote soovitusena on vale sõltuvus – ekslik ja eksinud assotsiatsioon.

Paberilt: tõesed ja valed seosed mitme üksuse vahel, mis on kujutatud paremal üksustevahelise graafikuna.

Paberilt: tõesed ja valed seosed mitme üksuse vahel, mis on kujutatud paremal üksustevahelise graafikuna.

Nagu masinõppearhitektuuride puhul sageli juhtub, on väljakutse veenda soovitussüsteemi, et "kauge" üksus (lind ei esine üldse lemmikloomatooted) võib olla esemega sisuliselt ja olulisel määral seotud, samas kui üksustel, mis kuuluvad samasse kategooriasse ning mis on funktsioonilt ja keskse kontseptsiooni poolest väga lähedased (nt kassi toitmisnõu), võivad olla ortogonaalsed või olla otseselt kaalutava ostu vastu.

Ainus viis mittekülgnevate üksuste vahelise kaardistamise loomiseks on probleemi koondamine, kuna kõnealused suhted on inimkogemuse tahk, neid ei saa programmiliselt ära arvata ja need jäävad tõenäoliselt kaugemale tavapäraste lähenemisviiside taskukohastest piiridest. andmestiku märgistus, nt Amazon Mehaaniline Türk.

Seetõttu on teadlased kasutanud loomuliku keele töötlemise (NLP) mehhanisme, et eraldada toote arvustustest silmapaistvad sõnad, ja on kasutanud nende analüüside sagedusi, et luua manuseid, mis suudavad näiliselt kaugeid objekte "sobitada".

Arhitektuur läbivaatusega rafineeritud üksustevahelise graafilise närvivõrgu (RI-GNN) jaoks.

Arhitektuur läbivaatusega rafineeritud üksustevahelise graafilise närvivõrgu (RI-GNN) jaoks.

Arhitektuur ja andmed

Nagu uus paber märgib, on varasemad sarnase iseloomuga tööd kasutanud sisselogitud kasutaja enda arvustuste ajalugu, et pakkuda algelist kaardistamist. DeepCONN ja RNS mõlemad kasutasid seda lähenemist. See aga välistab asjaolu, et kasutaja ei pruugi olla kirjutanud ühtegi arvustust või ühtegi arvustust, mis on seotud konkreetse kaubaga, mis jääb tema tavapärastest ostuharjumustest välja. Lisaks on see „valge kasti” lähenemine, kuna see eeldab, et kasutaja on konto loomiseks ja sisselogimiseks juba piisavalt kontakti saanud.

Teadlaste pakutud laiendatud graafiline närvivõrk (GNN) kasutab rohkem oraaklipõhist lähenemisviisi, tuletades tõelisi sõltuvusi. aprioorne, et anonüümne ja välja logitud kasutaja saaks minimaalse sisendiga kogeda asjakohasemaid soovitusi.

Ülevaatustega täiendatud süsteem kannab pealkirja Läbivaatamise täiustatud üksustevaheline graafiku närvivõrk (RI-GNN). Teadlased on testinud seda kahe vastu Amazoni andmestikud, Pet Supplies ja Filmid ja teler. Kuigi see lahendab arvustuste kättesaadavuse probleemi üsna korralikult, peaks vabas kasutuses leidma ja kraapima sobiva arvustuste andmebaasi. Selline andmekogu allikas võib teoreetiliselt olla ükskõik milline, alates postitustest sotsiaalvõrgustikus kuni vastusteni Quora lehel.

Seda laadi kõrgetasemelised seoste kaardistused oleksid lisaks soovitussüsteemidele väärtuslikud ka paljude masinõpperakenduste jaoks. Paljud praegused projektid on takistatud piiratud rahaliste vahendite ja ulatuse tõttu domeenidevahelise ja -sisese kaardistamise puudumise tõttu, samas kui tõeliselt teadliku ja rahvapõhise poodide soovitussüsteemi kaubanduslik tõuge võib selle lünga täita.

Mõõdikud ja testimine

Autorid testisid RI-GNN-i iga andmestiku kahe versiooniga, millest igaüks koosneb kasutaja ostuajaloost ja toote üldistest ülevaadetest. Üksused, mis ilmusid vähem kui viis korda, eemaldati ja kasutajate ajalugu jagati nädala ühikuteks. Esimene andmestiku versioon sisaldas kõiki seansse, milles oli rohkem kui üks üksus, ja teine ​​​​kõik seansid, kus oli rohkem kui viis üksust.

Projekt kasutas hindamismõõdikuteks P@K (täpsus) ja MRR@K (keskmine vastastikune aste). Testitud konkureerivad arhitektuurid olid: S-KNN; GRU4Rec; S-POP; TEMPEL; BERT4Rec; DHCN; GCE-GNN; SR-GNNNing NARM.

Raamistiku koolitati 100 partiidena Adam õppimiskiirusega 0.001, teemade arvuks on seatud vastavalt 24 ja 20 Pet Supplies ja Filmid ja teler.

 

 

Esmakordselt avaldatud 1. veebruaril 2022.