Intelligenza artificiale

Utilizzare le recensioni per creare un sistema di raccomandazione che funzioni

Published February 1, 2022

Updated April 28, 2026

Martin Anderson

Se hai mai acquistato un prodotto online e ti sei meravigliato dell’inanità e della non-applicabilità degli “articoli correlati” che infestano il processo di acquisto e le fasi successive, già capisci che i sistemi di raccomandazione popolari e mainstream tendono a non funzionare bene nel comprendere le relazioni tra potenziali acquisti.

Se acquisti un articolo insolito e poco frequente, come un forno, le raccomandazioni per altri forni sono probabilmente superflue, anche se i peggiori sistemi di raccomandazione non riconoscono questo. Negli anni 2000, ad esempio, il sistema di raccomandazione di TiVO creò una controversia precoce in questo settore riassegnando la presunta sessualità di un utente, che successivamente cercò di “rimascolinizzare” il suo profilo utente selezionando film di guerra – un approccio grezzo alla revisione dell’algoritmo.

Peggio ancora, non è necessario acquistare nulla su (ad esempio) Amazon, o iniziare a guardare un film la cui descrizione stai sfogliando su una piattaforma di streaming importante, perché gli algoritmi di raccomandazione affamati di informazioni inizino a percorrere la strada sbagliata; le ricerche, le soste e i clic sulle pagine dei “dettagli” sono sufficienti, e queste informazioni scarse (e probabilmente errate) saranno probabilmente perpetuate nelle future sessioni di navigazione sulla piattaforma.

Cercare di far dimenticare a un sistema di raccomandazione

A volte è possibile intervenire: Netflix fornisce un sistema di “pollici su/giù” che dovrebbe in teoria aiutare i suoi algoritmi di apprendimento automatico a rimuovere certi concetti e parole incorporati nel tuo profilo di raccomandazioni (anche se la sua efficacia è stata messa in discussione, e rimane molto più facile evolvere un algoritmo di raccomandazione personalizzato da zero che rimuovere ontologie indesiderate), mentre Amazon ti consente di rimuovere i titoli dalla tua cronologia clienti, il che dovrebbe declassare qualsiasi dominio indesiderato che abbia infiltrato le tue raccomandazioni.

Hulu ha una funzione simile, mentre HBO Max ha parzialmente ritirato dai sistemi di raccomandazione basati solo su algoritmi, di fronte alle loro attuali carenze.

Nessuna di queste esperienze strettamente a livello di consumatore tocca nemmeno la vasta e crescente critica dei sistemi di raccomandazione delle piattaforme di advertising “passive” (dove un notevole cambiamento è in arrivo a causa dell’ira pubblica), o il tema incendiario delle raccomandazioni AI dei social media, dove siti come YouTube, Twitter e Facebook continuano a subire critiche per raccomandazioni non pertinenti o addirittura dannose.

La macchina non sembra sapere cosa vogliamo, a meno che non vogliamo l’articolo adiacente che è apparso nella nostra ricerca – anche se quell’articolo è essenzialmente una copia o un’alternativa all’articolo principale che potremmo aver appena acquistato, piuttosto che un potenziale acquisto complementare o accessorio.

Raccomandazioni accurate con i dati di recensione

Una nuova collaborazione di ricerca dalla Cina e dall’Australia offre un metodo innovativo per affrontare tali raccomandazioni non pertinenti, utilizzando recensioni utente esterne per ottenere una comprensione migliore delle vere relazioni tra gli articoli in una sessione di acquisto. Nei test, l’architettura ha superato tutti i metodi attuali di stato dell’arte, offrendo speranza per i sistemi di raccomandazione che hanno una migliore mappa interna delle dipendenze degli articoli:

RI-GNN supera i principali concorrenti in termini di accuratezza delle relazioni tra gli articoli, eseguendo al meglio le sessioni con più di cinque articoli. Il sistema è stato testato contro i dataset Pet Supplies e Movies and TV da Amazon Review Data (2018). Fonte: https://arxiv.org/pdf/2201.12532.pdf

Inoltre, il progetto affronta la nota sfida di creare raccomandazioni anche in sessioni anonime, dove il sistema di raccomandazione non ha accesso ai dettagli forniti dall’utente, come la cronologia degli acquisti o le recensioni online dei propri acquisti precedenti.

Il nuovo documento si intitola Ripensare la dipendenza adiacente nelle raccomandazioni basate sulla sessione e proviene da ricercatori della Qilu University of Technology e del Beijing Institute of Technology in Cina, della RMIT University di Melbourne e dell’Australian Artificial Intelligence Institute dell’Università di Tecnologia di Sydney.

Cosa c’è dopo?

Il compito principale delle raccomandazioni basate sulla sessione (SBR) è determinare l’articolo “successivo” a partire dall’articolo corrente, in base alla sua relazione calcolata con l’articolo corrente. In termini pratici, ciò potrebbe manifestarsi come un elenco di “Articoli correlati” nella pagina di un articolo per una gabbia per uccelli su un sito web di e-commerce.

Se stai acquistando una gabbia per uccelli, cosa altro potresti aver bisogno? Beh, almeno, avrai bisogno di un uccello da mettere dentro – è una dipendenza vera. Tuttavia, la gabbia per uccelli è presente nell’ontologia beni per animali domestici, dove gli uccelli non sono venduti. Perversamente, cibo per gatti si trova nella stessa ontologia, anche se aggiungere una ciotola per gatti come raccomandazione associata per un prodotto di gabbia per uccelli è una dipendenza falsa – un’associazione errata e fuorviante.

Dal documento: relazioni vere e false tra diversi articoli, visualizzate a destra come un grafo di articoli.

Come spesso accade nelle architetture di apprendimento automatico, è una sfida convincere un sistema di raccomandazione che un’entità “distantante” (uccello non figura affatto in prodotti per animali domestici) possa avere una relazione intrinseca e importante con un articolo, mentre gli articoli che si trovano nella stessa categoria e molto vicini per funzione e concetto centrale (come ciotola per gatti) possono essere ortogonali o direttamente opposti all’acquisto in questione.

L’unico modo per creare queste mappe tra entità “non adiacenti” è quello di esternalizzare il problema, poiché le relazioni in questione sono un aspetto dell’esperienza umana, non possono essere indovinate programmaticamente e sono probabilmente al di là della portata convenzionale degli approcci alla etichettatura dei dati, come Amazon Mechanical Turk.

Pertanto, i ricercatori hanno utilizzato meccanismi di elaborazione del linguaggio naturale (NLP) per estrarre parole salienti dalle recensioni di un prodotto e hanno utilizzato le frequenze di queste analisi per creare incorporamenti in grado di “abbbinare” articoli apparentemente distanti.

L’architettura per Review-refined Inter-item Graph Neural Network (RI-GNN).

Architettura e dati

Come nota il nuovo documento, lavori precedenti di natura simile hanno sfruttato la storia di recensioni di un utente registrato per fornire mappe rudimentali. DeepCONN e RNS hanno utilizzato questo approccio. Tuttavia, ciò trascura il fatto che un utente potrebbe non aver scritto alcuna recensione, o alcuna recensione pertinente a un articolo particolare che è “fuori portata” delle sue abitudini di acquisto abituali. Inoltre, questo è un approccio un po’ “white box”, poiché si presume che l’utente abbia già interagito sufficientemente con il punto vendita per creare un account e accedere.

La rete neurale grafica estesa (GNN) proposta dai ricercatori adotta un approccio più guidato dall’oracolo, derivando dipendenze vere a priori, in modo che, presumibilmente, l’utente anonimo e non connesso possa sperimentare raccomandazioni più pertinenti con un input minimo richiesto.

Il sistema di raccomandazione arricchito con le recensioni si intitola Review-refined Inter-item Graph Neural Network (RI-GNN). I ricercatori lo hanno testato contro due dataset di Amazon, Pet Supplies e Movies and TV. Sebbene ciò risolva il problema della disponibilità delle recensioni in modo abbastanza pulito, un’implementazione nel mondo reale dovrebbe localizzare e raccogliere un database di recensioni appropriato. Una tale fonte di dati potrebbe, in teoria, essere qualsiasi cosa, dalle pubblicazioni su una rete sociale alle risposte su Quora.

Mappe di relazioni di alto livello di questo tipo sarebbero, inoltre, preziose per una vasta gamma di applicazioni di apprendimento automatico al di là dei sistemi di raccomandazione. Molti progetti attuali sono limitati dalla mancanza di mappe interne e interne ai domini a causa di fondi e portata limitati, mentre l’impulso commerciale di un sistema di raccomandazione di e-commerce veramente conoscitivo e basato sul crowdsourcing potrebbe potenzialmente colmare quella lacuna.

Metriche e test

Gli autori hanno testato RI-GNN contro due versioni di ciascun dataset, ciascuno dei quali è composto dalla cronologia degli acquisti di un utente e dalle recensioni generali del prodotto. Gli articoli che appaiono meno di cinque volte sono stati rimossi e la cronologia degli utenti è stata divisa in unità di una settimana. La prima versione del dataset presentava tutte le sessioni con più di un articolo e la seconda tutte le sessioni con più di cinque articoli.

Il progetto ha utilizzato P@K (Precisione) e MRR@K (Media del reciproco rango) per le metriche di valutazione. Le architetture rivali testate sono state: S-KNN; GRU4Rec; S-POP; STAMP; BERT4Rec; DHCN; GCE-GNN; SR-GNN; e NARM.

La struttura è stata addestrata in lotti di 100 su Adam con un tasso di apprendimento di 0,001, con il numero di argomenti impostato su 24 e 20, rispettivamente, per Pet Supplies e Movies and TV.

Pubblicato per la prima volta il 1° febbraio 2022.