Connect with us

Artificiell intelligens

Varför AI inte tillhandahåller bättre produktrekommendationer

mm

Om du är intresserad av obskyra saker, finns det två anledningar till varför dina sökningar efter artiklar och produkter sannolikt kommer att vara mindre relaterade till dina intressen än de hos dina ‘mainstream’-jämförelsegrupper; antingen är du en monetiserings-‘edge case’ vars intressen endast kommer att tillgodoses om du också är i de övre kategorierna av ekonomisk köpkraft (till exempel produkter och tjänster relaterade till ‘förvaltning av förmögenhet’); eller så använder sökalgoritmerna du använder collaborative filtering (CF), som föredrar intressen hos majoriteten.

Eftersom collaborative filtering är billigare och mer etablerat än andra potentiellt mer kapabla algoritmer och ramverk, är det möjligt att båda fallen gäller.

CF-baserade sökresultat kommer att prioritera artiklar som uppfattas vara populära bland ‘personer som du’, så gott det värdramverk kan förstå vad du är för en konsument.

Om du är försiktig med att tillhandahålla dataprofileringsinformation till värdsystemet – till exempel inte benägen att klicka på ‘Gilla’-knapparna i Netflix och andra videotjänster – kommer du sannolikt att klassificeras ganska generiskt i dina tidigaste interaktioner med systemet, och rekommendationerna du får kommer att återspegla de mest populära trenderna.

På en strömningplattform kan det betyda att du rekommenderas vad som helst som för närvarande är ‘hett’, som verklighetstv och forensiska morddokumentärer, oavsett ditt intresse för dessa. Likaså för bokrekommendationsplattformar, som tenderar att erbjuda aktuella och nyliga bästsäljare, uppenbarligen godtyckligt.

I teorin bör även användare som är försiktiga med data så småningom få bättre resultat från sådana system baserat på hur de använder dem och de saker de söker efter, eftersom de flesta sökramverk ger användarna begränsad möjlighet att redigera sin användningshistorik.

Any Color You Like, so Long as It’s Black

Men enligt en ny studie från Österrike, collaborative filterings överlägsenhet över innehållsbaserad filtering (som syftar till att definiera relationer mellan produkter istället för att bara ta hänsyn till aggregatpopularitet), och andra alternativa tillvägagångssätt, innebär att söksystemen tenderar mot långsiktig popularitetsbias, där uppenbarligen populära resultat pushas mot slutanvändare som är oväntade att bli entusiastiska över dem.

Studien finner att användare som är ointresserade av populära artiklar får ‘väsentligt sämre’ rekommendationer än användare med medel eller hög intresse för popularitet, och (kanske tautologiskt) att populära artiklar rekommenderas mer frekvent än impopulära artiklar. Forskarna drar också slutsatsen att användare med lågt intresse för populära artiklar tenderar att ha större användarprofiler som potentiellt kan förbättra rekommendationssystem – om systemen bara kunde sluta sitt beroende av ‘herde’-metriker.

Jämförelse av popularitet till komplexitet av användarprofiler visar att 'marginala' användare som är ointresserade av mainstream-innehåll faktiskt har mer potentialt innehåll för rekommendationssystem att utvinna; men eftersom sådana användare inte följer trender, verkar det vara en förlorad möjlighet.

Jämförelse av popularitet till komplexitet av användarprofiler visar att ‘marginala’ användare som är ointresserade av mainstream-innehåll faktiskt har mer potentialt innehåll för rekommendationssystem att utvinna; men eftersom sådana användare inte följer trender, verkar det vara en förlorad möjlighet. Källa: https://arxiv.org/pdf/2203.00376.pdf

Den studien heter Popularitetsbias i Collaborative Filtering-baserade Multimedia Rekommendationssystem, och kommer från forskare vid now-Center GmbH i Graz, och Graz Tekniska Universitet.

Omfång

Genom att bygga på tidigare arbeten som studerade enskilda sektorer (såsom bokrekommendationer), undersöker den nya studien fyra områden: digitala böcker (via BookCrossing-databasen); filmer (via MovieLens); musik (via Last.fm); och animes (via MyAnimeList).

Studien tillämpade fyra populära multimedia rekommendationssystem (MMRS) collaborative filtering-algoritmer mot databaser delade i tre användargrupper, enligt deras benägenhet att vara mottagliga för ‘populära’ resultat: LowPop, MedPop, och HighPop. Användargrupperna filtrerades ner till 1000 lika stora grupper, baserat på minst, genomsnitt och mest sannolikt att föredra ‘populära’ resultat.

I kommentar till resultaten, skriver författarna:

‘[Vi] finner att sannolikheten för att en multimedia-artikel rekommenderas starkt korrelerar med denna artikels popularitet [och] att användare med mindre benägenhet till popularitet (LowPop) får väsentligt sämre multimedia-rekommendationer än användare med medel (MedPop) och hög (HighPop) benägenhet till populära artiklar…

‘Våra resultat visar att användare med litet intresse för populära artiklar tenderar att ha de största användarprofilerna, men de får den lägsta rekommendationsprecisionen. Därför behövs framtida forskning för att mildra popularitetsbias i MMRS, både på artikel- och användarnivå.’

Bland de algoritmer som utvärderades fanns två K-Nearest Neighbors (KNN)-varianter, UserKNN och UserKNNAvg. Den första av dessa genererar inte en genomsnittlig betyg för målanvändaren och artikeln. En icke-negativ matrisfaktorisering (NMF) variant testades också, tillsammans med en CoClustering-algoritm.

Utvärderingsprotokollet ansåg rekommendationsuppgiften som en förutsägelseutmaning, mätt av forskarna i termer av medelabsolut fel (MAE), mot en femfaldig korsvalideringsprotokoll som överstiger den vanliga 80/20-fördelningen mellan tränad och testdata.

Resultaten indikerar en nästan garanti för popularitetsbias under collaborative filtering. Frågan, kanhända, är om detta uppfattas som ett problem av de multibilliondollarföretag som för närvarande integrerar CF i sina sökalgoritmer.

Över alla fyra dataset som studerats över fyra populära Collaborative Filtering-rekommendationer, indikerar varje resultat att populära media-artiklar är mer benägna att rekommenderas än impopulära erbjudanden.

Över alla fyra dataset som studerats över fyra populära Collaborative Filtering-rekommendationer, indikerar varje resultat att populära media-artiklar är mer benägna att rekommenderas än impopulära erbjudanden.

Den ‘Lätta’ Vägen Ut

Även om collaborative filtering alltmer används som endast en del av en bredare sökalgoritmstrategi, har det ett starkt intresse i sökområdet, och dess logik och potentiella lönsamhet är attraktivt lätt att förstå.

I sig själv, CF avlastar i princip uppgiften att utvärdera innehållsvärde till slutanvändare, och använder deras användning av innehållet som en index av dess värde och potentiell attraktivitet för andra kunder. Genom analogi, är det i princip en karta över ‘vattenkylarprat’.

Innehållsbaserad filtering (CBF) är svårare, men kunde potentiellt ge mer relevanta resultat. I datorsektorn för datorseende, läggs en ökande mängd forskning för närvarande på att kategorisera videoinnehåll och försöka härleda domäner, funktioner och högnivåkoncept genom analys av ljud och video i film- och tv-utgång.

Ett av många forskningsprojekt under de senaste fem åren som försöker härleda semantiska funktioner från innehållet i filmer, för att generera mer intelligenta 'adjacent' rekommendationer. Källa: https://arxiv.org/pdf/1701.00199.pdf

Ett av många forskningsprojekt under de senaste fem åren som försöker härleda semantiska funktioner från innehållet i filmer, för att generera mer intelligenta ‘adjacent’ rekommendationer. Källa: https://arxiv.org/pdf/1701.00199.pdf

Men detta är ett relativt nytt företag, och är bundet till den nuvarande, mer allmänna kampen att kvantifiera, isolera och utnyttja högnivåkoncept och funktioner i domänkunskap.

Vem Använder Collaborative Filtering?

Vid tidpunkten för skrivande, förblev Netflix ofta kritiserade rekommendationsmotor fokuserad på olika collaborative filtering-tillvägagångssätt, och tillämpar en mängd olika tillhörande teknologier i pågående försök att generera mer användar-relevanta rekommendationer.

Amazons sökmotor utvecklades från dess tidiga antagande av användar-baserad collaborative filtering till en artikel-artikel collaborative filtering-metod, som lägger större tonvikt vid kundens köphistorik. Naturligtvis kan detta leda till olika typer av fel, såsom filterbubblor, eller överbetonning av sparad data. I det senare fallet, om en ovanlig Amazon-kund gör ett ‘ovanligt’ köp, till exempel en uppsättning operetter för en operälskande vän, kan det inte finnas tillräckligt med alternativa köp som återspeglar kundens egna preferenser för att stoppa detta köp från att bli en påverkan på deras egna rekommendationer.

Collaborative filtering används också i stor utsträckning av Facebook, i koncert med andra tillvägagångssätt, och också av LinkedIn, YouTube, och Twitter.

 

Publicerad första gången 2:a mars 2022.

Författare på maskinlärande, domänspecialist inom mänsklig bildsyntes. Före detta chef för forskningsinnehåll på Metaphysic.ai.