Inteligenta Artificiala

Utilizarea recenziilor pentru a crea un sistem de recomandare care funcționează

Actualizat on December 9, 2022

Dacă ați cumpărat vreodată un produs online și v-ați mirat de nebunia și inaplicabilitatea „articolelor înrudite” care bântuie procesul de cumpărare și post-vânzare, înțelegeți deja că popularul și curentul general. sisteme de recomandare tind să fie scurt în ceea ce privește înțelegerea relațiilor dintre achizițiile viitoare.

Dacă cumpărați un articol puțin probabil și rar, cum ar fi un cuptor, recomandările pentru alte cuptoare sunt probabil de prisos, deși cele mai proaste sisteme de recomandare nu reușesc să recunoască acest lucru. În anii 2000, de exemplu, sistemul de recomandare al TiVO a creat o controversă timpurie în acest sector prin reatribuirea sexualităţii percepute a unui utilizator, care a încercat ulterior să-și „re-masculinizeze” profilul de utilizator selectând filme de război – o abordare brută a revizuirii algoritmului.

Mai rău încă, nu trebuie să cumpărați ceva de la (de exemplu) Amazon sau să începeți să vizionați un film a cărui descriere o navigați pe orice platformă de streaming majoră, pentru a infometat de informații algoritmi de recomandare pentru a începe vesel pe calea greșită; căutările, postările și clicurile în paginile cu „detalii” sunt suficiente, iar această informație redusă (și probabil incorectă) este probabil să se perpetueze pe parcursul sesiunilor viitoare de navigare pe platformă.

Încercarea de a face un sistem de recomandare să uite

Uneori este posibil să interveniți: Netflix oferă un sistem „degetul în sus/în jos” care ar trebui, teoretic, să ajute algoritmii săi de învățare automată să elimine anumite concepte și cuvinte încorporate din profilul dumneavoastră de recomandări (deși eficacitatea sa a a fost pus la îndoială, și rămâne mult mai ușor să evoluezi un algoritm de recomandare personalizat de la zero decât pentru a elimina ontologiile nedorite), în timp ce Amazon vă permite eliminați titluri din istoricul clienților dvs., care ar trebui să downgradeze orice domenii nedorite care s-au infiltrat în recomandările dvs.

Hulu are o caracteristică similară, în timp ce HBO Max are parțial retras din sistemele de recomandare doar cu algoritm, în fața deficiențelor lor actuale.

Niciuna dintre aceste experiențe strict la nivel de consumator nu atinge nici măcar critica larg răspândită și în creștere la adresa sistemelor de recomandare a platformelor de publicitate „pasive” (unde se apropie o schimbare notabilă din cauza furiei publice), sau subiectul incendiar al recomandărilor de IA din rețelele sociale, unde site-uri precum YouTube, Twitter și Facebook continuă să suporte critici pentru recomandări nerelevante sau chiar dăunătoare.

Mașina nu pare să știe ce vrem, decât dacă vrem articol adiacent care a apărut în căutarea noastră – chiar dacă acel articol este în esență un duplicat sau o alternativă la articolul principal pe care este posibil să-l fi cumpărat, mai degrabă decât o potențială achiziție complementară sau auxiliară.

Recomandări precise cu date de revizuire

O nouă colaborare de cercetare din China și Australia oferă o metodă nouă de a aborda astfel de recomandări neadecvate, prin utilizarea recenziilor externe ale utilizatorilor pentru a obține o mai bună înțelegere a relațiilor reale dintre articole într-o sesiune de cumpărături. În teste, arhitectura a depășit toate metodele actuale de ultimă generație, oferind speranță sistemelor de recomandare care au o hartă internă mai bună a dependențelor articolelor:

RI-GNN depășește concurenții majori în ceea ce privește acuratețea relațiilor dintre articole, performând cel mai bine în sesiunile cu mai mult de cinci articole. Sistemul a fost testat cu articolele pentru animale de companie și seturile de date pentru filme și TV de la Date de revizuire Amazon (2018). Sursă: https://arxiv.org/pdf/2201.12532.pdf

Pentru început, proiectul abordează provocarea notabilă de a crea recomandări chiar și în sesiunile anonime, în care sistemul de recomandare nu are acces la detaliile contribuite de utilizator, cum ar fi istoricul achizițiilor sau recenziile online ale utilizatorului cu privire la achizițiile anterioare.

Noul hârtie se numește Regândirea dependenței adiacente în recomandările bazate pe sesiune, și provine de la cercetătorii de la Universitatea de Tehnologie Qilu și de la Institutul de Tehnologie din Beijing din China, de la Universitatea RMIT din Melbourne și de la Institutul Australian de Inteligență Artificială de la Universitatea de Tehnologie din Sydney.

Ce urmează?

Sarcina de bază a recomandărilor bazate pe sesiune (SBR) este de a determina „următorul” articol de-a lungul articolului curent, pe baza relației sale calculate cu articolul curent. În termeni practici, aceasta s-ar putea manifesta ca o listă de „Articole înrudite” într-o pagină de articole pentru o cușcă pentru păsări pe un site web de comerț electronic.

Dacă cumpărați o cușcă pentru păsări, de ce altceva ați putea avea nevoie? Ei bine, cel puțin, veți avea nevoie de o pasăre pe care să o puneți în ea – asta este a adevărata dependență. Cu toate acestea, cușca pentru păsări este prezentată în ontologie bunuri pentru animale de companie, unde păsările nu se vând. Pervers, Mâncare pentru pisici se află în aceeași ontologie, deși adăugarea unui bol de hrănire pentru pisici ca recomandare asociată pentru un produs cușcă pentru păsări este o falsa dependenta – o asociere greșită și greșită.

Din lucrare: relații adevărate și false între mai mulți itemi, vizualizate în dreapta ca un grafic inter-item.

Așa cum se întâmplă atât de des în arhitecturile de învățare automată, este o provocare să convingi un sistem de recomandare că o entitate „depărtată” (pasăre nu apare deloc în produse pentru animale de companie) poate avea o relație intrinsecă și importantă cu un articol, în timp ce articolele care sunt în aceeași categorie și foarte apropiate ca funcție și concept central (cum ar fi bol de hrănire pentru pisici), pot fi ortogonale sau direct opuse achiziției luate în considerare.

Singura modalitate de a crea aceste mapări între entitățile „non-adiacente” este de a participa problema, deoarece relațiile în cauză sunt o fațetă a experienței umane, nu pot fi ghicite programatic și sunt probabil dincolo de sfera accesibilă a abordărilor convenționale pentru etichetarea setului de date, cum ar fi Amazon Mechanical Turk.

Prin urmare, cercetătorii au folosit mecanisme de procesare a limbajului natural (NLP) pentru a extrage cuvinte importante din recenzii pentru un produs și au folosit frecvențele din aceste analize pentru a crea înglobări capabile să „potrivieze” elemente aparent îndepărtate.

Arhitectura pentru rețeaua neuronală grafică inter-item rafinată prin revizuire (RI-GNN).

Arhitectură și date

După cum notează noua lucrare, lucrările anterioare de natură similară au exploatat istoricul de recenzii al unui utilizator conectat pentru a oferi mapări rudimentare. DeepCONN și RNS ambii au folosit această abordare. Cu toate acestea, acest lucru exclude faptul că este posibil ca un utilizator să nu fi scris recenzii sau recenzii relevante pentru un anumit articol care este „în afara limitei” obiceiurilor obișnuite de cumpărare. În plus, aceasta este o abordare de tip „cutie albă”, deoarece presupune că utilizatorul s-a implicat deja suficient cu priza pentru a crea un cont și a se conecta.

Rețeaua neuronală grafică extinsă (GNN) propusă de cercetători adoptă o abordare mai bazată pe oracol, derivând adevărate dependențe a priori, astfel încât, probabil, utilizatorul anonim și deconectat să poată experimenta recomandări mai relevante cu o introducere minimă necesară.

Sistemul de revizuire-augmentat este intitulat Rețeaua neuronală grafică inter-item rafinată de revizuire (RI-GNN). Cercetătorii l-au testat împotriva a două seturi de date de la Amazon, Accesorii pentru animale și Filme și TV. Deși acest lucru rezolvă problema disponibilității recenziilor destul de clar, o implementare în sălbăticie ar trebui să găsească și să elaboreze o bază de date adecvată de recenzii. O astfel de sursă de set de date ar putea fi, teoretic, orice, de la postări pe o rețea socială până la răspunsuri pe Quora.

Mapările relațiilor la nivel înalt de această natură ar fi, în plus, valoroase pentru o serie de aplicații de învățare automată dincolo de sistemele de recomandare. Multe proiecte actuale sunt afectate de lipsa de cartografiere inter și intra-domeniu din cauza fondurilor limitate și a domeniului de aplicare, în timp ce impulsul comercial al unui sistem de recomandare de comerț electronic cu adevărat informat și crowdsourced ar putea umple acest gol.

Metrici și testare

Autorii au testat RI-GNN cu două versiuni ale fiecărui set de date, fiecare dintre acestea fiind compusă din istoricul de achiziții al unui utilizator și recenzii generale ale produsului. Elementele care apăreau de mai puțin de cinci ori au fost eliminate, iar istoricul utilizatorilor a fost împărțit în unități de o săptămână. Prima versiune de set de date a prezentat toate sesiunile cu mai mult de un articol, iar a doua toate sesiunile cu peste cinci articole.

Proiectul a folosit P@K (Precizie) și MRR@K (Rang reciproc mediu) pentru metricile sale de evaluare. Arhitecturile rivale testate au fost: S-KNN; GRU4Rec; S-POP; TIMBRU; BERT4Rec; DHCN; GCE-GNN; SR-GNNŞi NARM.

Cadrul a fost antrenat în loturi de câte 100 Adam la o rată de învățare de 0.001, cu numărul de subiecte setat la 24 și, respectiv, 20 pentru Accesorii pentru animale și Filme și TV.

Publicat prima dată la 1 februarie 2022.

Urmeaza

De ce Deepfakes nu poate transmite momentan subtilitatea emoției

Nu ratați

Analizând 25 de ani de politici de confidențialitate cu Machine Learning

Martin Anderson

Scriitor despre învățare automată, inteligență artificială și date mari.
Site personal: martinanderson.ai
Contact: [e-mail protejat]
Twitter: @manders_ai