Intelligence Artificielle

Utiliser les avis pour créer un système de recommandation qui fonctionne

Publié 1 février 2022

Le kit de préparation mis à jour 9 décembre 2022

Martin Anderson

Si vous avez déjà acheté un produit en ligne et que vous vous êtes émerveillé de l'inanité et de la non-applicabilité des « articles connexes » qui hantent le processus d'achat et d'après-vente, vous comprenez déjà que les produits populaires et grand public systèmes de recommandation ont tendance à ne pas comprendre les relations entre les achats potentiels.

Si vous achetez un article peu probable et peu fréquent, comme un four, les recommandations pour d'autres fours seront probablement superflues, bien que les pires systèmes de recommandation ne pas le reconnaître. Dans les années 2000, par exemple, le système de recommandation de TiVO a créé une controverse précoce dans ce secteur en réassigner la sexualité perçue d'un utilisateur qui a ensuite cherché à « remasculiniser » son profil utilisateur en sélectionnant des films de guerre – une approche grossière de la révision des algorithmes.

Pire encore, vous n'avez pas besoin d'acheter quoi que ce soit sur (par exemple) Amazon, ou de commencer à regarder un film dont vous parcourez la description sur n'importe quelle grande plateforme de streaming, pour en manque d'informations Les algorithmes de recommandation commencent joyeusement sur la mauvaise voie ; les recherches, les arrêts et les clics sur les pages « détails » suffisent, et ces informations rares (et probablement incorrectes) risquent de se perpétuer au cours des futures sessions de navigation sur la plateforme.

Essayer de faire oublier un système de recommandation

Il est parfois possible d'intervenir : Netflix propose un système de « pouces vers le haut/vers le bas » qui devrait en théorie aider ses algorithmes d'apprentissage automatique à supprimer certains concepts et mots intégrés de votre profil de recommandations (bien que son efficacité ait été été interrogé, et il reste beaucoup plus facile de faire évoluer un algorithme de recommandation personnalisé à partir de zéro que de supprimer les ontologies indésirables), tandis qu'Amazon vous permet supprimer des titres de votre historique client, ce qui devrait rétrograder tous les domaines indésirables qui ont infiltré vos recommandations.

Hulu a un caractéristique similaire, tandis que HBO Max a partiellement reculé des systèmes de recommandation basés uniquement sur des algorithmes, face à leurs lacunes actuelles.

Aucune de ces expériences strictement destinées aux consommateurs n'aborde même la critique généralisée et croissante des systèmes de recommandation des plateformes publicitaires « passives » (où un changement notable est à venir en raison de la colère du public), ou le sujet incendiaire des recommandations de l'IA sur les réseaux sociaux, où des sites tels que YouTube, Twitter Facebook continuent de subir des critiques pour des recommandations non pertinentes, voire préjudiciables.

La machine ne semble pas savoir ce que nous voulons, à moins que nous ne voulions élément adjacent qui est apparu dans notre recherche - même si cet article est essentiellement un doublon ou une alternative à l'article principal que nous venons peut-être d'acheter, plutôt qu'un achat complémentaire ou accessoire potentiel.

Recommandations précises avec données d'examen

Une nouvelle collaboration de recherche entre la Chine et l'Australie propose une nouvelle méthode pour répondre à ces recommandations non pertinentes, en utilisant des avis d'utilisateurs externes pour mieux comprendre les relations réelles entre les articles lors d'une session d'achat. Lors des tests, l'architecture a surpassé toutes les méthodes de pointe actuelles, offrant de l'espoir aux systèmes de recommandation qui ont une meilleure carte interne des dépendances des éléments :

RI-GNN surpasse les principaux concurrents en termes de précision des relations entre les éléments, les meilleures performances sur les sessions avec plus de cinq éléments. Le système a été testé par rapport aux ensembles de données Pet Supplies et Movies and TV de Données d'examen d'Amazon (2018). Source : https://arxiv.org/pdf/2201.12532.pdf

De plus, le projet relève le défi notable de créer des recommandations même dans des sessions anonymes, où le système de recommandation n'a pas accès aux détails fournis par l'utilisateur, tels que l'historique des achats ou les propres avis en ligne de l'utilisateur sur ses achats antérieurs.

Le nouveau système d’ papier est appelé Repenser la dépendance adjacente dans les recommandations basées sur la session, et vient de chercheurs de l'Université de technologie de Qilu et de l'Institut de technologie de Pékin en Chine, de l'Université RMIT de Melbourne et de l'Institut australien d'intelligence artificielle de l'Université de technologie de Sydney.

Quelle est la prochaine étape?

La fonction principale des recommandations basées sur la session (SBR) est de déterminer l'article suivant à partir de l'article actuel, en fonction de sa relation calculée avec celui-ci. Concrètement, cela pourrait se traduire par une liste d'articles associés sur la page d'un article d'un site e-commerce.

Si vous achetez une cage à oiseaux, de quoi d'autre aurez-vous besoin ? Au minimum, il vous faudra un oiseau à l'intérieur. vraie dépendance. Cependant, la cage à oiseaux figure dans l'ontologie produits pour animaux de compagnie, où les oiseaux ne sont pas vendus. Perversement, nourriture pour chat se trouve dans la même ontologie, bien que l'ajout d'un bol d'alimentation pour chat comme recommandation associée pour un produit de cage à oiseaux soit un fausse dépendance – une association erronée et erronée.

Extrait de l'article : relations vraies et fausses entre plusieurs items, visualisées à droite sous forme de graphique inter-items.

Comme c'est souvent le cas dans les architectures d'apprentissage automatique, il est difficile de persuader un système de recommandation qu'une entité « distante » (oiseau ne figure pas du tout dans produits pour animaux de compagnie) peuvent avoir une relation intrinsèque et importante avec un élément, alors que les éléments qui appartiennent à la même catégorie et sont très proches en termes de fonction et de concept central (tels que gamelle pour chat), peuvent être orthogonaux ou directement opposés à l'achat envisagé.

La seule façon de créer ces mappages entre des entités « non adjacentes » est de externaliser le problème, car les relations en question sont une facette de l'expérience humaine, ne peuvent pas être devinées par programmation et sont probablement au-delà de la portée abordable des approches conventionnelles d'étiquetage des ensembles de données, telles que Turc mécanique d'Amazon.

Les chercheurs ont donc utilisé des mécanismes de traitement du langage naturel (NLP) pour extraire les mots saillants des critiques d'un produit et ont utilisé les fréquences de ces analyses pour créer des intégrations capables de « faire correspondre » des éléments apparemment éloignés.

L'architecture du réseau neuronal de graphes inter-éléments (RI-GNN) affiné par la révision.

Architecture et données

Comme le souligne le nouveau document, des travaux antérieurs de nature similaire ont exploité l'historique des avis d'un utilisateur connecté pour fournir des mappages rudimentaires. DeepCONN RNS Les deux ont utilisé cette approche. Cependant, cela ne tient pas compte du fait qu'un utilisateur puisse n'avoir rédigé aucun avis, ou qu'il n'ait pas d'avis pertinent sur un article particulier qui soit « hors de portée » de ses habitudes d'achat. De plus, il s'agit d'une approche « boîte blanche », car elle suppose que l'utilisateur a déjà suffisamment interagi avec le point de vente pour créer un compte et se connecter.

Le Graph Neural Network (GNN) étendu proposé par les chercheurs adopte une approche plus oracle, dérivant de véritables dépendances a priori, de sorte que, vraisemblablement, l'utilisateur anonyme et déconnecté puisse bénéficier de recommandations plus pertinentes avec un minimum d'entrées requises.

Le système d'examen augmenté est intitulé Réseau de neurones de graphes inter-éléments affiné (RI-GNN). Les chercheurs l'ont testé contre deux ensembles de données d'Amazon, Fournitures pour animaux Films et télé. Bien que cela résolve assez bien le problème de la disponibilité des avis, une implémentation dans la nature devrait localiser et gratter une base de données d'avis appropriée. Une telle source d'ensemble de données pourrait, en théorie, être n'importe quoi, des publications sur un réseau social aux réponses sur Quora.

Des mappages de relations de haut niveau de cette nature seraient, en outre, précieux pour une gamme d'applications d'apprentissage automatique au-delà des systèmes de recommandation. De nombreux projets en cours sont paralysés par le manque de cartographie inter et intra-domaine en raison de fonds et d'une portée limités, alors que l'impulsion commerciale d'un système de recommandation de commerce électronique véritablement informé et participatif pourrait potentiellement combler cette lacune.

Métriques et tests

Les auteurs ont testé RI-GNN sur deux versions de chaque ensemble de données, chacune comprenant l'historique d'achat de l'utilisateur et des avis généraux sur le produit. Les articles apparaissant moins de cinq fois ont été supprimés et l'historique utilisateur a été divisé en unités d'une semaine. La première version de l'ensemble de données présentait toutes les sessions comportant plus d'un article, et la seconde toutes celles comportant plus de cinq articles.

Le projet a utilisé P@K (Precision) et MRR@K (Mean Reciprocal Rank) pour ses mesures d'évaluation. Les architectures concurrentes testées étaient : S-KNN; GRU4Rec; S-POP; TIMBRE; BERT4Rec; DHCN; GCE-GNN; SR-GNNet NARM.

Le cadre a été entraîné par lots de 100 sur Adam à un taux d'apprentissage de 0.001, avec le nombre de sujets fixés à 24 et 20, respectivement, pour Fournitures pour animaux Films et télé.

Première publication le 1er février 2022.

Rubriques connexes:traitement du langage naturel nlp recommandation moteur de recommandation moteur de recommandation Une étude