Τεχνητή νοημοσύνη

Χρησιμοποιώντας τις Κριτικές για τη Δημιουργία ενός Συστήματος Συνιστώσεων που Λειτουργεί

Published February 1, 2022

Updated April 28, 2026

Martin Anderson

Εάν έχετε αγοράσει ποτέ ένα προϊόν στο διαδίκτυο και θαυμάσετε την ανοησία και την μη εφαρμοσιμότητα των “σχετικών αντικειμένων” που στοιχειώνουν τη διαδικασία αγοράς και μετά την πώληση, ήδη καταλαβαίνετε ότι τα δημοφιλή και κυρίαρχα συστήματα συνιστώσεων τείνουν να αποτυγχάνουν όσον αφορά την κατανόηση των σχέσεων μεταξύ προοπτικών αγορών.

Εάν αγοράσετε ένα απίθανο και σπάνιο αντικείμενο, όπως ένα φούρνο, οι συστάσεις για άλλα φούρνους είναι πιθανό να είναι περιττές, αν και τα χειρότερα συστήματα συνιστώσεων αποτυγχάνουν να αναγνωρίσουν αυτό. Στις αρχές της δεκαετίας του 2000, για παράδειγμα, το σύστημα συνιστώσεων του TiVO δημιούργησε μια πρώιμη διαμάχη σε αυτόν τον τομέα, αναθέτοντας τη percειμένη σεξουαλικότητα ενός χρήστη, ο οποίος στη συνέχεια ζήτησε να “αναμασκουλιώσει” το προφίλ του χρήστη, επιλέγοντας πολεμικές ταινίες – μια груβή προσέγγιση για τη αναθεώρηση του αλγορίθμου.

Χειρότερα, δεν χρειάζεται να αγοράσετε τίποτα στο (για παράδειγμα) Amazon, ή να αρχίσετε να βλέπετε μια ταινία της οποίας η περιγραφή την ερευνάτε σε οποιαδήποτε μεγάλη πλατφόρμα streaming, για να πληροφορημένα αλγόριθμοι συνιστώσεων να αρχίσουν να πηγαίνουν με χαρά στο λάθος μονοπάτι. Οι αναζητήσεις, οι παραμονές και οι κλικ στο “λεπτομέρειες” είναι αρκετά, και αυτή η λιγοστή (και πιθανώς λανθασμένη) πληροφορία είναι πιθανό να διατηρηθεί σε μελλοντικές συνεδρίες περιήγησης στην πλατφόρμα.

Προσπαθώντας να κάνει ένα Σύστημα Συνιστώσεων να Ξεχάσει

Μερικές φορές είναι δυνατό να παρέμβει: το Netflix παρέχει ένα σύστημα “thumbs up/down” που θα πρέπει θεωρητικά να βοηθήσει τους αλγόριθμους μηχανικής μάθησης να αφαιρέσουν ορισμένες ενσωματωμένες έννοιες και λέξεις από το προφίλ συνιστώσεων σας (αν και η αποτελεσματικότητά του αμφισβητήθηκε, και παραμένει πολύ πιο εύκολο να εξελίξει ένα προσωποποιημένο σύστημα συνιστώσεων από την αρχή παρά να αφαιρέσετε μη επιθυμητές οντολογίες), ενώ το Amazon σας επιτρέπει να αφαιρέσετε τίτλους από το ιστορικό του πελάτη, το οποίο θα πρέπει να υποβαθμίσει οποιαδήποτε ανεπιθύμητη domaine που διεισδύει στις συστάσεις σας.

Το Hulu έχει một παρόμοιο χαρακτηριστικό, ενώ το HBO Max έχει μερικώς υποχωρήσει από αλγόριθμους-μόνο συστήματα συνιστώσεων, αντιμετωπίζοντας τις τρέχουσες ελλείψεις τους.

Κανένα από αυτά τα σRICTLY καταναλωτικά εμπειρίες δεν αγγίζει καν την ευρεία και αυξανόμενη κριτική των “παθητικών” συστημάτων συνιστώσεων πλατφορμών διαφήμισης (όπου σημαντική αλλαγή έρχεται λόγω δημόσιας δυσαρέσκειας), ή το επικίνδυνο θέμα των συνιστώσεων AI των μέσων κοινωνικής δικτύωσης, όπου ιστοχώροι όπως YouTube, Twitter και Facebook συνεχίζουν να υποφέρουν κριτική για μη σχετικές ή ακόμη και βλαβερές συστάσεις.

Η μηχανή δεν φαίνεται να ξέρει τι θέλουμε, εκτός αν θέλουμε το σχετικό αντικείμενο που εμφανίστηκε στην αναζήτησή μας – ακόμη και αν αυτό το αντικείμενο είναι ουσιαστικά ένα αντίγραφο ή εναλλακτικό του πρωταρχικού αντικειμένου που μπορεί να αγοράσαμε, παρά ένα πιθανό συμπληρωματικό ή βοηθητικό αγορά.

Ακρίβειες Συνιστώσεων με Δεδομένα Κριτικών

Μια νέα ερευνητική συνεργασία από την Κίνα και την Αυστραλία προσφέρει ένα καινοτόμο μέθοδο για την αντιμετώπιση τέτοιων μη σχετικών συστάσεων, χρησιμοποιώντας εξωτερικές κριτικές χρηστών για να αποκτήσει μια καλύτερη κατανόηση των πραγματικών σχέσεων μεταξύ αντικειμένων σε μια συνεδρία αγοράς. Σε δοκιμές, η αρχιτεκτονική υπερέβη όλα τα τρέχοντα state-of-the-art μεθόδους, προσφέροντας ελπίδα για συστήματα συνιστώσεων που έχουν ένα καλύτερο εσωτερικό χάρτη των εξαρτήσεων των αντικειμένων:

RI-GNN outperforms major competitors in terms of accuracy of relationships between items, performing best on sessions with more than five items. The system was tested against the Pet Supplies and Movies and TV datasets from Amazon Review Data (2018). Source: https://arxiv.org/pdf/2201.12532.pdf

Για να αρχίσουμε, το έργο αντιμετωπίζει την αξιοσημείωτη πρόκληση της δημιουργίας συστάσεων ακόμη και σε ανώνυμες συνεδρίες, όπου το σύστημα συνιστώσεων δεν έχει πρόσβαση σε λεπτομέρειες που συμβάλλουν από τον χρήστη, όπως ιστορικό αγορών, ή τις κριτικές του χρήστη για προηγούμενες αγορές.

Το νέο έγγραφο ονομάζεται Rethinking Adjacent Dependency in Session-based Recommendations, και προέρχεται από ερευνητές στο Qilu University of Technology και το Beijing Institute of Technology στην Κίνα, RMIT University στο Melbourne, και το Australian Artificial Intelligence Institute στο University of Technology Sydney.

Τι Είναι το Επόμενο;

Η βασική εργασία των συνιστώσεων με βάση τη συνεδρία (SBR) είναι να καθορίσει το “επόμενο” αντικείμενο από το τρέχον αντικείμενο, με βάση τη υπολογισμένη σχέση του με το τρέχον αντικείμενο. Σε πρακτικούς όρους, αυτό μπορεί να εκφραστεί ως μια λίστα “Σχετικών αντικειμένων” σε μια σελίδα αντικειμένου για μια κλουβί πουλιού σε ένα ηλεκτρονικό κατάστημα.

Εάν αγοράσετε μια κλουβί πουλιού, τι άλλο είναι πιθανό να χρειαστείτε; Λίγο περισσότερο, θα χρειαστείτε ένα πουλί για να το βάλει μέσα – αυτό είναι ένα αληθινό εξάρτημα. Ωστόσο, το κλουβί πουλιού είναι στο οντολογία πετ γούνα, όπου τα πουλιά δεν πωλούνται. Παρόλα αυτά, το γατοτροφή κάθεται στην ίδια οντολογία, αν και η προσθήκη ενός μπολ για τη διατροφή γατιών ως μια συσχετισμένη σύσταση για ένα προϊόν κλουβί πουλιού είναι ένα ψευδές εξάρτημα – μια λανθασμένη και παρεξηγημένη σύνδεση.

From the paper: true and false relationships between several items, visualized on the right as an inter-item graph.

Όπως είναι συχνά η περίπτωση στις αρχιτεκτονικές μηχανικής μάθησης, είναι μια πρόκληση να πείσουν ένα σύστημα συνιστώσεων ότι ένα “μακρινό” αντικείμενο (πουλί δεν εμφανίζεται καθόλου στο πετ προϊόντα) μπορεί να έχει μια εγγενή και σημαντική σχέση με ένα αντικείμενο, ενώ αντικείμενα που είναι στην ίδια κατηγορία και πολύ κοντά στη λειτουργία και την κεντρική έννοια (όπως μπολ για τη διατροφή γατιών) μπορεί να είναι ορθογώνιο ή απευθείας αντίθετο στο προϊόν που εξετάζεται.

Ο μόνος τρόπος για να δημιουργηθούν αυτές οι αντιστοιχίες μεταξύ “μη-αδجacent” οντολογιών είναι να αναθέσουμε το πρόβλημα,既然 οι σχέσεις που αναφέρονται είναι μια πτυχή της ανθρώπινης εμπειρίας, δεν μπορούν να υπολογιστούν προγραμματικά και είναι πιθανό να ξεπεράσουν το εύρος των συμβατικών προσεγγίσεων για την ετικέτα του συνόλου δεδομένων, όπως Amazon Mechanical Turk.

Επομένως, οι ερευνητές έχουν χρησιμοποιήσει μηχανισμούς NLP για να εξαγάγουν σημαντικές λέξεις από κριτικές για ένα προϊόν και έχουν χρησιμοποιήσει συχνότητες από αυτές τις αναλύσεις για να δημιουργήσουν ενσωματώσεις ικανές να “συμπληρώσουν” φαινομενικά μακρινά αντικείμενα.

The architecture for Review-refined Inter-item Graph Neural Network (RI-GNN).

Αρχιτεκτονική και Δεδομένα

Όπως σημειώνει το νέο έγγραφο, προηγούμενες εργασίες του ίδιου είδους έχουν εκμεταλλευτεί το ιστορικό κριτικών του συνδεμένου χρήστη για να παρέχουν βασικές αντιστοιχίες. DeepCONN και RNS και οι δύο χρησιμοποιήσαν αυτήν την προσέγγιση. Ωστόσο, αυτό αγνοεί το γεγονός ότι ένας χρήστης μπορεί να μην έχει γράψει keine κριτικές, ή keine κριτικές που αφορούν ένα συγκεκριμένο αντικείμενο που είναι “εκτός εύρους” των συνηθισμένων αγοραστικών του συνηθειών. Επιπλέον, αυτό είναι ένα είδος “λευκού κουτιού” προσέγγισης,既然 υποθέτει ότι ο χρήστης έχει ήδη αλληλεπιδράσει αρκετά με το εξοχικό για να δημιουργήσει ένα λογαριασμό και να συνδεθεί.

Η επεκτάσιμη Graph Neural Network (GNN) που προτείνεται από τους ερευνητές λαμβάνει μια πιο προφητική προσέγγιση, εξαγώγοντας αληθινά εξαρτήματα a priori, ώστε, προφανώς, ο ανώνυμος και μη συνδεδεμένος χρήστης να μπορεί να βιώσει πιο σχετικές συστάσεις με ελάχιστη εισαγωγή που απαιτείται.

Το σύστημα που εμπλουτίζεται με κριτικές ονομάζεται Review-refined Inter-item Graph Neural Network (RI-GNN). Οι ερευνητές έχουν δοκιμάσει το RI-GNN ενάντια σε δύο datasets από το Amazon, Pet Supplies και Movies and TV. Αν και αυτό λύνει το πρόβλημα της διαθεσιμότητας κριτικών με ευκολία, μια εφαρμογή στο πεδίο θα χρειαζόταν να εντοπίσει και να σαρώσει μια κατάλληλη βάση δεδομένων κριτικών. Một τέτοια πηγή δεδομένων θα μπορούσε, σε θεωρία, να είναι οτιδήποτε από δημοσιεύσεις σε ένα κοινωνικό δίκτυο σε απαντήσεις στο Quora.

Υψηλού επιπέδου χαρτογραφήσεις σχέσεων αυτού του είδους θα ήταν επίσης πολύτιμες για eine σειρά εφαρμογών μηχανικής μάθησης πέρα από τα συστήματα συνιστώσεων. Πολλά τρέχοντα έργα είναι εγκλωβισμένα λόγω έλλειψης χαρτογραφήσεων inter και intra-τομέα λόγω περιορισμένων κεφαλαίων και εύρους, ενώ η εμπορική ώθηση ενός πραγματικά γνώσιμου και crowdsourced συστήματος συνιστώσεων ηλεκτρονικής αγοράς θα μπορούσε να γεμίσει αυτήν την κενή.

Μέτρα και Δοκιμές

Οι συγγραφείς δοκιμάζουν το RI-GNN ενάντια σε δύο εκδόσεις κάθε dataset, κάθε μια από τις οποίες αποτελείται από το ιστορικό αγορών του χρήστη και γενικές κριτικές του προϊόντος. Αντικείμενα που εμφανίζονται λιγότερο από πέντε φορές αφαιρέθηκαν, και το ιστορικό του χρήστη χωρίστηκε σε μονάδες μιας εβδομάδας. Η πρώτη έκδοση του dataset είχε όλες τις συνεδρίες με περισσότερα από ένα αντικείμενο, και η δεύτερη όλες τις συνεδρίες με πάνω από πέντε αντικείμενα.

Το έργο χρησιμοποιεί P@K (Precision) και MRR@K (Mean Reciprocal Rank) για τα μέτρα αξιολόγησης. Οι αντίπαλοι αρχιτεκτονικοί δοκιμάστηκαν: S-KNN; GRU4Rec; S-POP; STAMP; BERT4Rec; DHCN; GCE-GNN; SR-GNN; και NARM.

Το πλαίσιο εκπαιδεύτηκε σε δόσεις των 100 στο Adam με ρυθμό μάθησης 0,001, με τον αριθμό των θεμάτων οριστεί σε 24 και 20, αντίστοιχα, για Pet Supplies και Movies and TV.

Πρώτη δημοσίευση 1ης Φεβρουαρίου 2022.