Intelligenza Artificiale

Utilizzare le recensioni per creare un sistema di raccomandazione che funzioni

Pubblicato il 1 Febbraio 2022

aggiornato Dicembre 9, 2022

Martin Anderson

Se hai mai acquistato un prodotto online e ti sei meravigliato dell'inutilità e della non applicabilità degli "articoli correlati" che infestano il processo di acquisto e post-vendita, capisci già che i prodotti popolari e tradizionali sistemi di raccomandazione tendono a non essere all'altezza in termini di comprensione delle relazioni tra i potenziali acquisti.

Se acquisti un oggetto improbabile e poco frequente, come un forno, è probabile che i consigli per altri forni siano superflui, sebbene i peggiori sistemi di raccomandazione non riconoscere questoNegli anni 2000, ad esempio, il sistema di raccomandazione di TiVO ha creato una delle prime controversie in questo settore riassegnare la sessualità percepita di un utente che ha successivamente cercato di "ri-mascolinizzare" il suo profilo utente selezionando film di guerra, un approccio rozzo alla revisione degli algoritmi.

Peggio ancora, non hai bisogno di acquistare nulla (ad esempio) su Amazon, o di iniziare a guardare un film la cui descrizione stai consultando su una qualsiasi delle principali piattaforme di streaming, per affamato di informazioni algoritmi di raccomandazione per iniziare allegramente sulla strada sbagliata; ricerche, pause e clic nelle pagine dei "dettagli" sono sufficienti, e queste scarse (e probabilmente errate) informazioni sono destinate a perpetuarsi nelle future sessioni di navigazione sulla piattaforma.

Cercando di far dimenticare un sistema di raccomandazione

A volte è possibile intervenire: Netflix fornisce un sistema "pollice su/giù" che in teoria dovrebbe aiutare i suoi algoritmi di apprendimento automatico a rimuovere determinati concetti e parole incorporati dal tuo profilo di raccomandazioni (anche se la sua efficacia è stato interrogatoe rimane molto più semplice evolvere da zero un algoritmo di raccomandazione personalizzato piuttosto che rimuovere ontologie indesiderate), mentre Amazon te lo consente rimuovere i titoli dalla cronologia dei tuoi clienti, che dovrebbe eseguire il downgrade di eventuali domini indesiderati che si sono infiltrati nei tuoi consigli.

Hulu ha un caratteristica simile, mentre HBO Max sì parzialmente ritirato da sistemi di raccomandazione basati solo su algoritmi, a fronte delle loro attuali carenze.

Nessuna di queste esperienze strettamente a livello di consumatore tocca nemmeno la critica diffusa e crescente dei sistemi di raccomandazione delle piattaforme pubblicitarie "passive" (dove sta arrivando un notevole cambiamento a causa dell'ira pubblica), o l'argomento incendiario delle raccomandazioni AI sui social media, dove siti come YouTube, Twitter e Facebook continuare a subire critiche per raccomandazioni non pertinenti o addirittura dannose.

La macchina non sembra sapere cosa vogliamo, a meno che non lo vogliamo noi elemento adiacente che è emerso nella nostra ricerca, anche se quell'articolo è essenzialmente un duplicato o un sostituto dell'articolo principale che potremmo aver appena acquistato, piuttosto che un potenziale acquisto complementare o accessorio.

Raccomandazioni accurate con dati di revisione

Una nuova collaborazione di ricerca dalla Cina e dall'Australia offre un nuovo metodo per affrontare tali raccomandazioni non appropriate, utilizzando le recensioni degli utenti esterni per ottenere una migliore comprensione delle relazioni reali tra gli articoli in una sessione di acquisto. Nei test, l'architettura ha superato tutti gli attuali metodi all'avanguardia, offrendo speranza per i sistemi di raccomandazione che hanno una migliore mappa interna delle dipendenze degli elementi:

RI-GNN supera i principali concorrenti in termini di accuratezza delle relazioni tra gli elementi, ottenendo risultati migliori nelle sessioni con più di cinque elementi. Il sistema è stato testato rispetto ai set di dati Pet Supplies e Movies and TV di Dati delle recensioni di Amazon (2018). Fonte: https://arxiv.org/pdf/2201.12532.pdf

Oltre a ciò, il progetto affronta la notevole sfida di creare raccomandazioni anche in sessioni anonime, in cui il sistema di raccomandazione non ha accesso ai dettagli forniti dagli utenti, come la cronologia degli acquisti o le recensioni online degli utenti stessi sugli acquisti precedenti.

La nuova carta è chiamato Ripensare la dipendenza adiacente nelle raccomandazioni basate sulla sessione, e proviene da ricercatori della Qilu University of Technology e del Beijing Institute of Technology in Cina, della RMIT University di Melbourne e dell'Australian Artificial Intelligence Institute della University of Technology di Sydney.

Cosa c'è di nuovo?

Il compito principale delle raccomandazioni basate sulla sessione (SBR) è determinare l'elemento "successivo" rispetto a quello corrente, in base alla sua relazione calcolata con quest'ultimo. In termini pratici, questo potrebbe manifestarsi come un elenco di "Elementi correlati" nella pagina di un articolo per una gabbia per uccelli su un sito web di e-commerce.

Se stai comprando una gabbia per uccelli, di cos'altro potresti aver bisogno? Beh, come minimo, ti servirà un uccellino da metterci dentro, questo è... vera dipendenza. Tuttavia, la gabbia per uccelli è presente nell'ontologia articoli per animali domestici, dove gli uccelli non vengono venduti. Perversamente, cibo per gatti si trova nella stessa ontologia, sebbene l'aggiunta di una ciotola per l'alimentazione dei gatti come raccomandazione associata per un prodotto per gabbie per uccelli sia un falsa dipendenza – un'associazione sbagliata e fuorviante.

Dall'articolo: relazioni vere e false tra diversi elementi, visualizzate a destra come grafico inter-elemento.

Come spesso accade nelle architetture di apprendimento automatico, è una sfida convincere un sistema di raccomandazione che un'entità "distante" (uccello non è affatto presente in prodotti per animali domestici) possono avere una relazione intrinseca e importante con un articolo, mentre gli articoli che sono nella stessa categoria, e molto vicini nella funzione e nel concetto centrale (come ciotola per l'alimentazione del gatto), possono essere ortogonali o direttamente opposte all'acquisto considerato.

L'unico modo per creare queste mappature tra entità "non adiacenti" è ricorrere al crowdsourcing per risolvere il problema, poiché le relazioni in questione sono una sfaccettatura dell'esperienza umana, non possono essere indovinate a livello di programmazione e probabilmente vanno oltre la portata accessibile degli approcci convenzionali all'etichettatura dei set di dati, come Amazon Mechanical Turk.

Pertanto i ricercatori hanno utilizzato meccanismi di elaborazione del linguaggio naturale (NLP) per estrarre parole salienti dalle recensioni di un prodotto e hanno utilizzato le frequenze di queste analisi per creare incorporamenti in grado di "abbinare" elementi apparentemente distanti.

L'architettura per Inter-item Graph Neural Network (RI-GNN) perfezionata dalla revisione.

Architettura e dati

Come sottolinea il nuovo documento, lavori precedenti di natura simile hanno sfruttato la cronologia delle revisioni di un utente registrato per fornire mappature rudimentali. DeepCONN e RNS Entrambi hanno utilizzato questo approccio. Tuttavia, questo non tiene conto del fatto che un utente potrebbe non aver scritto alcuna recensione, o potrebbe non aver scritto alcuna recensione pertinente a un particolare articolo che è "fuori portata" dalle sue abitudini di acquisto abituali. Inoltre, si tratta di un approccio "white box", poiché presuppone che l'utente abbia già interagito sufficientemente con il punto vendita da creare un account e accedere.

L'esteso Graph Neural Network (GNN) proposto dai ricercatori adotta un approccio più guidato dagli oracoli, derivando vere dipendenze a priori, in modo che, presumibilmente, l'utente anonimo e disconnesso possa ricevere consigli più pertinenti con un input minimo richiesto.

Il sistema di revisione aumentata è intitolato Rete neurale grafica Inter-item perfezionata dalla revisione (RI-GNN). I ricercatori l'hanno testato contro due set di dati da Amazon, Pet Supplies e Film e TV. Sebbene ciò risolva il problema della disponibilità delle recensioni in modo piuttosto ordinato, un'implementazione in-the-wild dovrebbe individuare e raschiare un database di recensioni appropriato. Una tale fonte di set di dati potrebbe, in teoria, essere qualsiasi cosa, dai post su un social network alle risposte su Quora.

Le mappature delle relazioni di alto livello di questa natura sarebbero, inoltre, preziose per una gamma di applicazioni di apprendimento automatico oltre ai sistemi di raccomandazione. Molti progetti in corso sono ostacolati dalla mancanza di mappatura inter e intra-dominio a causa di fondi e portata limitati, mentre l'impulso commerciale di un sistema di raccomandazioni per l'e-commerce veramente informato e basato sul crowdsourcing potrebbe potenzialmente colmare questa lacuna.

Metriche e test

Gli autori hanno testato RI-GNN con due versioni di ciascun set di dati, ciascuna delle quali comprende la cronologia degli acquisti dell'utente e le recensioni generali del prodotto. Gli elementi che apparivano meno di cinque volte sono stati rimossi e la cronologia dell'utente è stata suddivisa in unità di una settimana. La prima versione del set di dati includeva tutte le sessioni con più di un elemento, mentre la seconda tutte le sessioni con più di cinque elementi.

Il progetto ha utilizzato P@K (Precisione) e MRR@K (Mean Reciprocal Rank) per i suoi parametri di valutazione. Le architetture rivali testate erano: S-KNN; GRU4Rec; S-POP; FRANCOBOLLO; BERT4Rec; DHCN; GCE-GNN; SR-GNN, E NARM.

Il framework è stato addestrato in lotti di 100 su Adam a un tasso di apprendimento di 0.001, con il numero di argomenti impostato rispettivamente su 24 e 20, per Pet Supplies e Film e TV.

Pubblicato per la prima volta il 1° febbraio 2022.