peň Použitie recenzií na vytvorenie systému odporúčaní, ktorý funguje - Unite.AI
Spojte sa s nami

Umelá inteligencia

Použitie recenzií na vytvorenie systému odporúčaní, ktorý funguje

mm
Aktualizované on

Ak ste si niekedy kúpili produkt online a žasli ste nad nepochopiteľnosťou a nepoužiteľnosťou „súvisiacich položiek“, ktoré prenasledujú nákupný a popredajný proces, už chápete, že populárne a bežné odporúčacie systémy majú tendenciu zaostávať, pokiaľ ide o pochopenie vzťahov medzi potenciálnymi nákupmi.

Ak si kúpite nepravdepodobnú a zriedkavú položku, ako je rúra, odporúčania pre iné rúry budú pravdepodobne zbytočné, aj keď najhoršie systémy odporúčaní neuznať to. Napríklad v roku 2000 systém odporúčaní TiVO vyvolal v tomto sektore skorú kontroverziu preradenie vnímanej sexuality používateľa, ktorý sa následne snažil „premaskulinizovať“ svoj používateľský profil výberom vojnových filmov – hrubý prístup k revízii algoritmu.

Ešte horšie je, že si nemusíte nič kupovať (napríklad) na Amazone, ani začať pozerať film, ktorého popis si prezeráte na akejkoľvek veľkej streamovacej platforme, aby ste informačne vyhladovaný odporúčacie algoritmy, aby sa veselo rozbehli po nesprávnej ceste; stačí vyhľadávanie, zotrvanie a kliknutia na stránky „podrobnosti“ a tieto nedostatočné (a pravdepodobne nesprávne) informácie sa pravdepodobne zachovajú počas budúcich relácií prehliadania na platforme.

Pokúšate sa zabudnúť na systém odporúčaní

Niekedy je možné zasiahnuť: Netflix poskytuje systém „palec hore/dole“, ktorý by mal teoreticky pomôcť jeho algoritmom strojového učenia odstrániť určité vložené koncepty a slová z vášho profilu odporúčaní (hoci jeho účinnosť boli vypočutía zostáva oveľa jednoduchšie vyvinúť prispôsobený algoritmus odporúčaní od začiatku než je odstrániť nežiaduce ontológie), zatiaľ čo Amazon vám to umožní odstrániť tituly z vašej histórie zákazníkov, čo by malo znížiť úroveň všetkých nevítaných domén, ktoré prenikli do vašich odporúčaní.

Hulu má a podobná vlastnosť, zatiaľ čo HBO Max má čiastočne ustúpil zo systémov odporúčajúcich iba algoritmy, vzhľadom na ich súčasné nedostatky.

Žiadna z týchto skúseností výlučne na úrovni spotrebiteľov sa ani nedotýka rozšírenej a rastúcej kritiky „pasívnych“ systémov odporúčaní reklamných platforiem (kde prichádza výrazná zmena kvôli verejnému hnevu), alebo zápalná téma odporúčaní AI sociálnych médií, kde sú stránky ako napr YouTube, Twitter a facebook naďalej znášať kritiku za nerelevantné alebo dokonca škodlivé odporúčania.

Zdá sa, že stroj nevie, čo chceme, pokiaľ to nechceme susedná položka ktorá sa objavila pri našom hľadaní – aj keď je táto položka v podstate duplikátom alebo alternatívou k hlavnej položke, ktorú sme možno práve kúpili, a nie potenciálnym doplnkovým alebo doplnkovým nákupom.

Presné odporúčania s údajmi o kontrole

Nová výskumná spolupráca z Číny a Austrálie ponúka novú metódu riešenia takýchto nevhodných odporúčaní pomocou externých používateľských recenzií na lepšie pochopenie skutočných vzťahov medzi položkami počas nákupnej relácie. V testoch architektúra prekonala všetky súčasné najmodernejšie metódy, čo ponúka nádej pre systémy odporúčaní, ktoré majú lepšiu internú mapu závislostí položiek:

RI-GNN prekonáva hlavných konkurentov z hľadiska presnosti vzťahov medzi položkami, pričom najlepšie funguje pri reláciách s viac ako piatimi položkami. Systém bol testovaný v porovnaní so súbormi údajov pre domáce zvieratá a filmy a TV z Amazon Review Data (2018). Zdroj: https://arxiv.org/pdf/2201.12532.pdf

RI-GNN prekonáva hlavných konkurentov, pokiaľ ide o presnosť vzťahov medzi položkami, pričom najlepšie funguje pri reláciách s viac ako piatimi položkami. Systém bol testovaný v porovnaní so súbormi údajov pre domáce zvieratá a filmy a TV Údaje o recenzii Amazonu (2018).  Zdroj: https://arxiv.org/pdf/2201.12532.pdf

Na spustenie projektu sa projekt zaoberá pozoruhodnou výzvou vytvárania odporúčaní aj v anonymných reláciách, kde systém odporúčaní nemá prístup k podrobnostiam, ktoré prispeli používateľmi, ako je história nákupov alebo vlastné online recenzie predchádzajúcich nákupov používateľa.

Nový papier sa nazýva Prehodnotenie susednej závislosti v odporúčaniach založených na reláciách, a pochádza od výskumníkov z Qilu University of Technology a Pekingského technologického inštitútu v Číne, RMIT University v Melbourne a Austrálskeho inštitútu umelej inteligencie na University of Technology v Sydney.

Čo bude ďalej?

Hlavnou úlohou odporúčaní na základe relácie (SBR) je určiť „ďalšiu“ položku popri aktuálnej položke na základe jej vypočítaného vzťahu k aktuálnej položke. V praxi by sa to mohlo prejaviť ako zoznam „súvisiacich položiek“ na stránke položky pre vtáčiu klietku na webovej lokalite elektronického obchodu.

Ak kupujete vtáčiu klietku, čo ešte budete pravdepodobne potrebovať? No, prinajmenšom budete potrebovať vtáka, ktorý do nej vložíte – to je a skutočná závislosť. V ontológii sa však vyskytuje vtáčia klietka tovar pre domáce zvieratá, kde sa vtáky nepredávajú. zvrátene, mačacie jedlo je v rovnakej ontológii, hoci pridanie misky na kŕmenie mačiek ako súvisiaceho odporúčania pre produkt vtáčej klietky je falošná závislosť – mylná a pomýlená asociácia.

Z papiera: pravdivé a nepravdivé vzťahy medzi niekoľkými položkami, zobrazené vpravo ako medzipoložkový graf.

Z papiera: pravdivé a nepravdivé vzťahy medzi niekoľkými položkami, zobrazené vpravo ako medzipoložkový graf.

Ako to už v architektúrach strojového učenia často býva, je náročné presvedčiť odporúčací systém, aby „vzdialená“ entita (vták vôbec nevystupuje v výrobky pre domáce zvieratá) môžu mať vnútorný a dôležitý vzťah k položke, zatiaľ čo položky, ktoré sú v rovnakej kategórii a majú veľmi blízko vo funkcii a ústrednom koncepte (ako napr. miska na kŕmenie mačiek), môžu byť ortogonálne alebo priamo protichodné k zvažovanej kúpe.

Jediným spôsobom, ako vytvoriť tieto mapovania medzi „nesusednými“ entitami, je crowdsourcing problému, keďže príslušné vzťahy sú aspektom ľudskej skúsenosti, nemožno ich uhádnuť programovo a pravdepodobne sú mimo dostupného rozsahu konvenčných prístupov k označovanie datasetov, ako napr Amazon Mechanical Turk.

Preto výskumníci použili mechanizmy spracovania prirodzeného jazyka (NLP) na extrakciu najdôležitejších slov z recenzií na produkt a použili frekvencie z týchto analýz na vytvorenie vložiek schopných „spárovať“ zjavne vzdialené položky.

Architektúra pre neurónovú sieť medzi položkami grafu (RI-GNN) prepracovanej na preskúmanie.

Architektúra pre neurónovú sieť medzi položkami grafu (RI-GNN) prepracovanej na preskúmanie.

Architektúra a dáta

Ako poznamenáva nový článok, predchádzajúce práce podobného charakteru využívali vlastnú históriu recenzií prihláseného používateľa na poskytnutie základných máp. DeepCONN a RNS obaja použili tento prístup. To však znižuje skutočnosť, že používateľ možno nenapísal žiadne recenzie alebo žiadne recenzie týkajúce sa konkrétnej položky, ktorá je „mimo rozsahu“ jeho obvyklých nákupných návykov. Okrem toho je to niečo ako prístup „bielej skrinky“, pretože predpokladá, že používateľ sa už dostatočne zapojil do zásuvky na vytvorenie účtu a prihlásenie.

Rozšírená grafová neurónová sieť (GNN), ktorú navrhli výskumníci, využíva prístup viac založený na orákulum a odvodzuje skutočné závislosti. priori, takže anonymný a odhlásený používateľ pravdepodobne získa relevantnejšie odporúčania s minimálnym potrebným vstupom.

Systém rozšírený o preskúmanie má názov Recenzia prepracovaná medzipoložkový graf neurónová sieť (RI-GNN). Vedci to testovali na dvoch množiny údajov z Amazonu, Pet Dodávky a Filmy a televízia. Hoci to rieši problém dostupnosti recenzií pomerne úhľadne, pri voľnej implementácii by bolo potrebné nájsť a zoškrabať vhodnú databázu recenzií. Takýmto zdrojom dátového súboru by teoreticky mohlo byť čokoľvek od príspevkov na sociálnej sieti až po odpovede na Quora.

Mapovanie vzťahov na vysokej úrovni tohto charakteru by bolo navyše cenné pre celý rad aplikácií strojového učenia nad rámec odporúčacích systémov. Mnoho súčasných projektov je brzdených nedostatkom mapovania medzi doménami a v rámci domén v dôsledku obmedzených finančných prostriedkov a rozsahu, zatiaľ čo komerčný impulz skutočne informovaného a crowdsourcingového systému odporúčaní elektronického obchodu by mohol túto medzeru vyplniť.

Metriky a testovanie

Autori testovali RI-GNN na dvoch verziách každého súboru údajov, z ktorých každá obsahuje históriu nákupov používateľa a všeobecné recenzie produktu. Položky, ktoré sa objavili menej ako päťkrát, boli odstránené a história používateľov bola rozdelená na jednotky týždňa. Prvá verzia súboru údajov obsahovala všetky relácie s viac ako jednou položkou a druhá všetky relácie s viac ako piatimi položkami.

Projekt použil pre svoje hodnotiace metriky P@K (Precision) a MRR@K (Mean Reciprocal Rank). Testované konkurenčné architektúry boli: S-KNN; GRU4Rec; S-POP; STAMP; BERT4Rec; DHCN; GCE-GNN; SR-GNNA NARM.

Rám bol trénovaný v dávkach po 100 kusoch Adam pri rýchlosti učenia 0.001 s počtom tém nastaveným na 24 a 20 Pet Dodávky a Filmy a televízia.

 

 

Prvýkrát zverejnené 1. februára 2022.