Τεχνητή νοημοσύνη
Γιατί η Τεχνητή Νοημοσύνη Δεν Παρέχει Καλύτερες Προτάσεις Προϊόντων

Αν σας ενδιαφέρουν τα ασυνήθιστα πράγματα, υπάρχουν δύο λόγοι για τους οποίους οι αναζητήσεις σας για αντικείμενα και προϊόντα είναι πιθανό να είναι λιγότερο σχετικές με τα ενδιαφέροντά σας από εκείνα των “κύριων” ομοτίμων σας· είτε είστε μια περίπτωση “ακραίου” μονεταρίσματος, των οποίων τα ενδιαφέροντα θα ικανοποιηθούν μόνο εάν είστε επίσης στις ανώτερες κατηγορίες οικονομικής αγοραστικής δύναμης (για παράδειγμα, προϊόντα και υπηρεσίες που σχετίζονται με ‘διαχείριση πλούτου’), ή οι αλγόριθμοι αναζήτησης που χρησιμοποιείτε αξιοποιούν συνεργατική φιλτράρισή (CF), η οποία ευνοεί τα ενδιαφέροντα της πλειοψηφίας.
Καθώς η συνεργατική φιλτράρισή είναι φθηνότερη και πιο καθιερωμένη από άλλους πιθανώς πιο ικανούς αλγόριθμους και πλαισίων, είναι δυνατό και οι δύο περιπτώσεις να ισχύουν.
Τα αποτελέσματα αναζήτησης που βασίζονται σε CF θα προτεραιοποιούν τα αντικείμενα που θεωρούνται δημοφιλή μεταξύ “ατόμων σαν εσάς”, όσο το δυνατόν καλύτερα η φιλοξενουμένη πλατφόρμα μπορεί να καταλάβει ποιο είδος καταναλωτή είστε.
Εάν είστε επιφυλακτικοί να παρέχετε πληροφορίες προφίλ σε σύστημα φιλοξενίας – για παράδειγμα, δεν είστε προκλητικοί να πατήσετε τα κουμπιά “Μου αρέσει” στο Netflix και άλλες υπηρεσίες περιεχομένου βίντεο – είναι πιθανό να ταξινομηθείτε khá γενικά στις πρώτες σας互одействίες με το σύστημα, και οι προτάσεις που θα λάβετε θα αντανακλούν τις πιο δημοφιλείς τάσεις.
Σε μια πλατφόρμα streaming, αυτό θα μπορούσε να σημαίνει ότι σας προτείνουν όποια σόου και ταινίες είναι τώρα “ζεστές”, όπως η τηλεόραση πραγματικότητας και οι εγκληματικές ντοκιμαντέρ, ανεξάρτητα από το ενδιαφέρον σας για αυτά. Παρόμοια και για πλατφόρμες προτάσεων βιβλίων, οι οποίες θα προτείνουν τα τρέχοντα και πρόσφατα best-seller, φαινομενικά αυθαίρετα.
Θεωρητικά, ακόμη και οι χρήστες που είναι προσεκτικοί με τα δεδομένα θα πρέπει τελικά να λάβουν καλύτερα αποτελέσματα από τέτοιους συστήματα με βάση τον τρόπο που τα χρησιμοποιούν και τα πράγματα που αναζητούν,既然 τα περισσότερα πλαίσια αναζήτησης δίνουν στους χρήστες περιορισμένη δυνατότητα να επεξεργαστούν το ιστορικό χρήσης τους.
Οποιοδήποτε Χρώμα Σας Αρέσει, Όσο Το Χρώμα Είναι Μαύρο
Ωστόσο, σύμφωνα με μια νέα μελέτη από την Αυστρία, η υπεροχή της συνεργατικής φιλτράρισής над περιεχομένου-βασισμένη φιλτράρισή (η οποία επιδιώκει να ορίσει σχέσεις μεταξύ προϊόντων αντί να λαμβάνει υπόψη μόνο την συνολική δημοτικότητα), και άλλες εναλλακτικές προσεγγίσεις, κλίνει τα συστήματα αναζήτησης προς μακροχρόνια πρεσβευτική προκατάληψη, όπου φανερά δημοφιλή αποτελέσματα προωθούνται προς τελικούς χρήστες που είναι απίθανο να ενθουσιαστούν από αυτά.
Το έγγραφο βρίσκει ότι οι χρήστες που δεν ενδιαφέρονται για δημοφιλή αντικείμενα λαμβάνουν “σημαντικά χειρότερες” προτάσεις από τους χρήστες με μέτριο ή υψηλό ενδιαφέρον για δημοτικότητα, και (ίσως ταυτολογικά) ότι δημοφιλή αντικείμενα προτείνονται συχνότερα από μη δημοφιλή αντικείμενα. Οι ερευνητές επίσης καταλήγουν στο συμπέρασμα ότι οι χρήστες με χαμηλό ενδιαφέρον για δημοφιλή αντικείμενα τείνουν να έχουν μεγαλύτερα προφίλ χρηστών που θα μπορούσαν потенτικά να βελτιώσουν τα συστήματα προτάσεων – αν μόνο τα συστήματα μπορούσαν να ξεπεράσουν την εθισμό τους στα “κοπάδια” μετρήσεων.

Σύγκριση δημοτικότητας με複雑ότητα προφίλ χρηστών δείχνει ότι ‘περιφερειακοί’ χρήστες που δεν ενδιαφέρονται για mainstream περιεχόμενο έχουν πραγματικά περισσότερο δυνατό περιεχόμενο για τα συστήματα προτάσεων να εξορύξουν· αλλά既然 τέτοιοι χρήστες δεν συμμορφώνονται με τις τάσεις, φαίνεται να είναι μια χαμένη ευκαιρία. Source: https://arxiv.org/pdf/2203.00376.pdf
Το έγγραφο έχει τον τίτλο Πρεσβευτική Προκατάληψη σε Συστήματα Προτάσεων Πολυμέσων που Βασίζονται σε Συνεργατική Φιλτράρισή, και προέρχεται από ερευνητές στο now-Center GmbH στο Γκρατς, και το Πανεπιστήμιο Τεχνολογίας του Γκρατς.
Πεδία που Καλύπτονται
Κτίζοντας σε προηγούμενες εργασίες που μελέτησαν ατομικούς τομείς (όπως προτάσεις βιβλίων), η νέα μελέτη εξετάζει τέσσερα πεδία: ψηφιακά βιβλία (μέσω του συνόλου δεδομένων BookCrossing)· ταινίες (μέσω MovieLens)· μουσική (μέσω Last.fm)· και anime (μέσω MyAnimeList).
Η μελέτη εφαρμόζει τέσσερις δημοφιλείς αλγόριθμους συνεργατικής φιλτράρισής σε συνόλου δεδομένων διαχωρισμένα σε τρεις ομάδες χρηστών, σύμφωνα με την προθυμία τους να είναι αποδέκτες ‘δημοφιλών’ αποτελεσμάτων: LowPop, MedPop, και HighPop. Οι ομάδες χρηστών χωρίστηκαν σε 1000 ομάδες ίσου μεγέθους, με βάση το λιγότερο, το μέσο, και το πιο πιθανό να ευνοήσουν ‘δημοφιλές’ αποτελέσματα.
Σχολιάζοντας τα αποτελέσματα, οι συγγραφείς δηλώνουν:
‘[Βρήκαμε ότι] η πιθανότητα ενός πολυμεσικού στοιχείου να προτείνεται συσχετίζεται ισχυρά με τη δημοτικότητα αυτού του στοιχείου [και] ότι οι χρήστες με λιγότερη προθυμία να ευνοήσουν δημοφιλή στοιχεία λαμβάνουν στατιστικά σημαντικά χειρότερες προτάσεις πολυμέσων από τους χρήστες με μέτριο και υψηλό ενδιαφέρον για δημοφιλή στοιχεία…
‘Τα αποτελέσματά μας δείχνουν ότι, αν και οι χρήστες με μικρό ενδιαφέρον για δημοφιλή στοιχεία τείνουν να έχουν τα μεγαλύτερα προφίλ χρηστών, λαμβάνουν την χαμηλότερη ακρίβεια προτάσεων. Έτσι, μελλοντική έρευνα είναι απαραίτητη για να μετριάσει την πρεσβευτική προκατάληψη στα συστήματα προτάσεων, τόσο στο επίπεδο του στοιχείου όσο και στο επίπεδο του χρήστη.’
Μεταξύ των αλγορίθμων που αξιολογήθηκαν ήταν δύο K-Nearest Neighbors (KNN) παραλλαγές, UserKNN και UserKNNAvg. Ο πρώτος από αυτούς δεν παράγει μια μέση βαθμολογία για τον στόχο χρήστη και στοιχείο. Ένας μη αρνητικός παράγοντας μετρίσεων παραλλαγή (NMF) cũng δοκιμάστηκε, μαζί με έναν αλγόριθμο CoClustering.
Η αξιολόγηση του πρωτοκόλλου θεωρήθηκε ως μια πρόκληση πρόβλεψης, μετρημένη από τους ερευνητές σε όρους μέσου απόλυτου σφάλματος (MAE), έναντι ενός πятиπλόου πρωτοκόλλου διασταύρωσης που υπερβαίνει το συνήθως 80/20 διαχωρισμό μεταξύ εκπαιδευμένων και δοκιμαστικών δεδομένων.
Τα αποτελέσματα δείχνουν μια近乎 εγγύηση της πρεσβευτικής προκατάληψης υπό συνεργατική φιλτράρισή. Το ερώτημα, επιχείρημα, είναι αν αυτό θεωρείται πρόβλημα από τις εταιρείες δισεκατομμυρίων δολαρίων που ενσωματώνουν CF στους αλγόριθμους αναζήτησής τους.

Σε όλα τα τέσσερα συνόλου δεδομένων που μελετήθηκαν σε τέσσερις δημοφιλείς Συνεργατικές Φιλτράρισή Προτάσεων, κάθε αποτέλεσμα δείχνει ότι δημοφιλή πολυμεσικά στοιχεία είναι πιο πιθανό να προτείνουν παρά μη δημοφιλή προσφορές.
Ο ‘Εύκολος’ Δρόμος
Αν και η συνεργατική φιλτράρισή χρησιμοποιείται ολοένα και περισσότερο ως μόνο μια πλευρά μιας ευρύτερης στρατηγικής αλγορίθμου αναζήτησης, έχει ένα ισχυρό μερίδιο στην αγορά αναζήτησης, και η λογική και το δυνητικό κέρδος της είναι ελκυστικά εύκολο να κατανοηθεί.
Στι自己, η CF απλώς αποφορτίζει την εργασία της αξιολόγησης της αξίας του περιεχομένου στους τελικούς χρήστες, και χρησιμοποιεί την αποδοχή του περιεχομένου ως δείκτη της αξίας και της δυνητικής ελκυστικότητας για άλλους πελάτες. Με αναλογία, είναι ουσιαστικά ένας χάρτης του ‘βουρτσίσματος του νερού’.
Η περιεχομένου-βασισμένη φιλτράρισή είναι πιο δύσκολη, αλλά θα μπορούσε να παρέχει πιο σχετικές αποτελέσματα. Στο τομέα της οπτικής υπολογιστή, μια αυξανόμενη ποσότητα ερευνών δαπανώνται目前 για την κατηγοριοποίηση του περιεχομένου βίντεο και προσπαθούν να εξαγάγουν τομείς, χαρακτηριστικά, και υψηλά επίπεδα εννοιών μέσω ανάλυσης ήχου και βίντεο σε ταινίες και τηλεοπτικά προγράμματα.

Ένα από τα πολλά ερευνητικά έργα τα τελευταία πέντε χρόνια που προσπαθούν να εξαγάγουν σημασιολογικά χαρακτηριστικά από το περιεχόμενο των ταινιών, για να παράγουν πιο έξυπνες ‘παράλληλες’ προτάσεις. Source: https://arxiv.org/pdf/1701.00199.pdf
Ωστόσο, αυτό είναι μια σχετικά νεαρή διώρυγα, και δεσμευμένη στην τρέχουσα, πιο γενική αγωνία να ποσοτικοποιηθεί, να απομονωθεί και να εκμεταλλευτεί υψηλά επίπεδα εννοιών και χαρακτηριστικών στη γνώση τομέα.
Ποιος Χρησιμοποιεί Συνεργατική Φιλτράρισή;
Στην ώρα της γραφής, ο αλγόριθμος προτάσεων του Netflix oft-criticized παραμένει προσηλωμένος σε διάφορες συνεργατικές φιλτράρισή προσεγγίσεις, εφαρμόζοντας μια ποικιλία συμπληρωματικών τεχνολογιών σε συνεχείς προσπάθειες να παράγει πιο σχετικές προτάσεις για τους χρήστες.
Ο αλγόριθμος αναζήτησης της Amazon εξελίχθηκε από την πρώιμη υιοθέτησή του της συνεργατικής φιλτράρισής με βάση τον χρήστη σε μια μεθοδολογία συνεργατικής φιλτράρισής με βάση το αντικείμενο, η οποία δίνει μεγαλύτερη έμφαση στο ιστορικό αγορών του πελάτη. Φυσικά, αυτό μπορεί να οδηγήσει σε διαφορετικά είδη ανακρίβειας, όπως φίλτρα φυσαλίδων, ή υπερβολική έμφαση σε σπάνια δεδομένα. Στη δεύτερη περίπτωση, αν ένας σπάνιος πελάτης της Amazon αγοράσει ένα ‘ατυχές’ προϊόν, όπως ένα σετ οπερέτας για einen φίλο που αγαπά την όπερα, μπορεί να μην υπάρχουν επαρκή εναλλακτικά προϊόντα που να αντανακλούν τις προτιμήσεις του πελάτη για να σταματήσουν αυτή την αγορά από το να γίνει μια επιρροή στις δικές του προτάσεις.
Η συνεργατική φιλτράρισή χρησιμοποιείται επίσης εκτενώς από το Facebook, σε συνδυασμό με άλλες προσεγγίσεις, και επίσης από LinkedIn, YouTube, και Twitter.
Πρώτη δημοσίευση 2ης Μαρτίου 2022.












