Künstliche Intelligenz

Mit Bewertungen ein Empfehlungssystem erstellen, das funktioniert

Published February 1, 2022

Updated April 5, 2026

Martin Anderson

Wenn Sie schon einmal ein Produkt online gekauft und sich über die Unsinnigkeit und Unzulänglichkeit der “ähnlichen Artikel” gewundert haben, die den Kauf- und Nachkaufprozess heimsuchen, verstehen Sie bereits, dass populäre und mainstream-Empfehlungssysteme in Bezug auf das Verständnis der Beziehungen zwischen möglichen Käufen oft versagen.

Wenn Sie ein unwahrscheinliches und seltenes Produkt wie einen Ofen kaufen, sind Empfehlungen für andere Öfen wahrscheinlich überflüssig, obwohl die schlechtesten Empfehlungssysteme dies nicht anerkennen. In den 2000er Jahren löste beispielsweise das Empfehlungssystem von TiVO einen frühen Skandal in diesem Sektor aus, indem es die wahrgenommene Sexualität eines Benutzers neu zuordnete, der anschließend versuchte, sein Benutzerprofil durch die Auswahl von Kriegsfilmen zu “remasculinisieren” – ein grober Ansatz zur Algorithmusrevision.

Schlimmer noch, Sie müssen nichts kaufen (z. B. bei Amazon) oder einen Film ansehen, dessen Beschreibung Sie auf einer großen Streaming-Plattform durchsuchen, damit informationsarme Empfehlungsalgorithmen den falschen Weg einschlagen; Suchanfragen, Verweilzeiten und Klicks auf die “Details”-Seiten reichen aus, und diese knappe (und wahrscheinlich falsche) Information wird wahrscheinlich in zukünftigen Browsing-Sitzungen auf der Plattform fortgesetzt.

Versuchen, ein Empfehlungssystem zum Vergessen zu bringen

Manchmal ist es möglich, einzugreifen: Netflix bietet ein “Daumen hoch/runter”-System, das in der Theorie dazu beitragen sollte, bestimmte in den Empfehlungen verankerte Konzepte und Wörter aus dem Benutzerprofil zu entfernen (obwohl seine Wirksamkeit in Frage gestellt wurde und es viel einfacher ist, einen personalisierten Empfehlungsalgorithmus von Grund auf zu entwickeln als unerwünschte Ontologien zu entfernen), während Amazon es ermöglicht, Titel aus der Kundenhistorie zu entfernen, was unerwünschte Domänen herunterstufen sollte, die in die Empfehlungen eingedrungen sind.

Hulu hat eine ähnliche Funktion, während HBO Max teilweise von algorithmusbasierten Empfehlungssystemen abgerückt ist, angesichts ihrer aktuellen Mängel.

Keine dieser strikt auf den Verbraucher ausgerichteten Erfahrungen berührt auch nur ansatzweise die weit verbreitete und wachsende Kritik an “passiven” Empfehlungssystemen auf Werbeplattformen (wo beachtliche Veränderungen aufgrund öffentlichen Unmuts erfolgen), oder das brandheiße Thema der sozialen Medien-KI-Empfehlungen, wo Seiten wie YouTube, Twitter und Facebook weiterhin Kritik für nicht relevante oder sogar schädliche Empfehlungen einstecken.

Die Maschine scheint nicht zu wissen, was wir wollen, es sei denn, wir wollen das benachbarte Element, das in unserer Suche aufgetaucht ist – auch wenn dieses Element im Wesentlichen eine Kopie oder Alternative zum primären Element ist, das wir vielleicht gerade gekauft haben, anstatt ein potenzielles komplementäres oder sekundäres Kaufobjekt.

Genauere Empfehlungen mit Bewertungsdaten

Eine neue Forschungskooperation aus China und Australien bietet eine neuartige Methode, um derart unpassende Empfehlungen anzugehen, indem sie externe Benutzerbewertungen nutzt, um ein besseres Verständnis der tatsächlichen Beziehungen zwischen Elementen in einer Kaufsession zu erlangen. In Tests übertraf die Architektur alle aktuellen State-of-the-Art-Methoden und bot Hoffnung für Empfehlungssysteme, die eine bessere interne Karte der Abhängigkeiten von Elementen haben:

RI-GNN übertrifft die wichtigsten Mitbewerber in Bezug auf die Genauigkeit der Beziehungen zwischen Elementen, am besten bei Sitzungen mit mehr als fünf Elementen. Das System wurde gegen die Pet Supplies- und Movies and TV-Datensätze aus Amazon Review Data (2018) getestet. Quelle: https://arxiv.org/pdf/2201.12532.pdf

Zusätzlich geht das Projekt die bemerkenswerte Herausforderung an, Empfehlungen auch in anonymen Sitzungen zu erstellen, in denen das Empfehlungssystem keinen Zugriff auf benutzerdefinierte Details wie Kaufhistorie oder die eigenen Online-Bewertungen des Benutzers zu vorherigen Käufen hat.

Der neue Artikel trägt den Titel Neue Überlegungen zur adjazenten Abhängigkeit in sessionbasierten Empfehlungen und stammt von Forschern der Qilu-Universität für Technologie und des Beijing Institute of Technology in China, der RMIT-Universität in Melbourne und des australischen Artificial Intelligence Institute an der University of Technology Sydney.

Was kommt als Nächstes?

Die Kernaufgabe der sessionbasierten Empfehlungen (SBR) besteht darin, das “nächste” Element anhand seines berechneten Verhältnisses zum aktuellen Element zu bestimmen. In der Praxis könnte dies als Liste der “Ähnlichen Artikel” auf einer Artikel-Seite für einen Vogelkäfig auf einer E-Commerce-Website in Erscheinung treten.

Wenn Sie einen Vogelkäfig kaufen, was benötigen Sie sonst noch? Nun, Sie werden mindestens einen Vogel benötigen, den Sie hineinsetzen können – das ist eine wahre Abhängigkeit. Allerdings befindet sich der Vogelkäfig in der Ontologie Haustierbedarf, in der keine Vögel verkauft werden. Perverserweise befindet sich Katzenfutter in derselben Ontologie, obwohl die Hinzufügung einer Katzenfutter-Schüssel als assoziierte Empfehlung für ein Vogelkäfig-Produkt eine falsche Abhängigkeit – eine fehlerhafte und irreführende Assoziation – darstellt.

Aus dem Artikel: wahre und falsche Beziehungen zwischen mehreren Elementen, visualisiert rechts als Inter-Element-Graph.

Wie oft in maschinellen Lernalgorithmen ist es eine Herausforderung, ein Empfehlungssystem davon zu überzeugen, dass eine “entfernte” Entität (Vogel kommt in Haustierbedarf überhaupt nicht vor) eine inhärente und wichtige Beziehung zu einem Element haben kann, während Elemente, die in derselben Kategorie sind und sehr nahe in Funktion und zentralem Konzept (wie Katzenfutter-Schüssel) liegen, orthogonal oder direkt entgegengesetzt zum Kaufobjekt sein können.

Der einzige Weg, diese Zuordnungen zwischen “nicht-benachbarten” Entitäten zu erstellen, besteht darin, das Problem zu crowdsourcen, da die in Frage stehenden Beziehungen ein Aspekt der menschlichen Erfahrung sind, nicht programmatisch erraten werden können und wahrscheinlich außerhalb des finanziell tragbaren Rahmens herkömmlicher Ansätze zur Datenauszeichnung wie Amazon Mechanical Turk liegen.

Daher haben die Forscher Natural Language Processing (NLP)-Mechanismen eingesetzt, um wichtige Wörter aus Produktbewertungen zu extrahieren, und haben Häufigkeiten aus diesen Analysen verwendet, um Einbettungen zu erstellen, die offensichtlich entfernte Elemente “abgleichen” können.

Die Architektur für Review-refined Inter-item Graph Neural Network (RI-GNN).

Architektur und Daten

Wie der neue Artikel feststellt, haben frühere Arbeiten ähnlicher Art die Bewertungsgeschichte eines angemeldeten Benutzers ausgenutzt, um rudimentäre Zuordnungen zu liefern. DeepCONN und RNS haben diesen Ansatz verwendet. Allerdings wird dabei außer Acht gelassen, dass ein Benutzer möglicherweise keine Bewertungen geschrieben oder keine relevanten Bewertungen zu einem bestimmten Element hat, das außerhalb seines üblichen Kaufverhaltens liegt. Darüber hinaus ist dies ein gewisser “White-Box”-Ansatz, da angenommen wird, dass der Benutzer bereits ausreichend mit dem Outlet interagiert hat, um ein Konto zu erstellen und sich anzumelden.

Das von den Forschern vorgeschlagene erweiterte Graph Neural Network (GNN) verfolgt einen eher orakelgetriebenen Ansatz, indem es wahre Abhängigkeiten a priori ableitet, so dass der anonyme und abgemeldete Benutzer relevantere Empfehlungen mit minimaler Eingabe erfahrungsgemäß erhalten kann.

Das review-augmentierte System trägt den Titel Review-refined Inter-item Graph Neural Network (RI-GNN). Die Forscher haben es gegen zwei Datensätze von Amazon getestet, Pet Supplies und Movies and TV. Obwohl dies das Problem der Verfügbarkeit von Bewertungen recht elegant löst, müsste eine Implementierung in der Praxis eine geeignete Bewertungsdatenbank finden und durchsuchen. Eine solche Datensammlung könnte theoretisch alles sein, von Posts in einem sozialen Netzwerk bis hin zu Antworten auf Quora.

High-Level-Beziehungsabbildungen dieser Art wären auch für eine Vielzahl von maschinellen Lernalgorithmen jenseits von Empfehlungssystemen von Wert. Viele aktuelle Projekte sind aufgrund begrenzter Mittel und Reichweite durch mangelnde Inter- und Intra-Domain-Abbildungen eingeschränkt, während der kommerzielle Antrieb eines wirklich wissenden und crowdsourcierten E-Commerce-Empfehlungssystems diese Lücke möglicherweise füllen könnte.

Metriken und Tests

Die Autoren testeten RI-GNN gegen zwei Versionen jedes Datensatzes, von denen jeder aus der Kaufhistorie eines Benutzers und allgemeinen Bewertungen des Produkts besteht. Elemente, die weniger als fünf Mal auftraten, wurden entfernt, und die Benutzerhistorie in Einheiten von einer Woche aufgeteilt. Die erste Datensatzversion umfasste alle Sitzungen mit mehr als einem Element, und die zweite alle Sitzungen mit mehr als fünf Elementen.

Das Projekt verwendete P@K (Präzision) und MRR@K (mittlerer reciproker Rang) als Bewertungsmetriken. Die getesteten Rivalen-Architekturen waren: S-KNN; GRU4Rec; S-POP; STAMP; BERT4Rec; DHCN; GCE-GNN; SR-GNN; und NARM.

Das Framework wurde in Chargen von 100 auf Adam mit einer Lernrate von 0,001 trainiert, wobei die Anzahl der Themen auf 24 bzw. 20 für Pet Supplies und Movies and TV festgelegt wurde.

Erstveröffentlicht am 1. Februar 2022.