stub Oppdager "profesjonelle" ondsinnede anmeldelser på nett med maskinlæring - Unite.AI
Kontakt med oss

Kunstig intelligens

Oppdager "profesjonelle" ondsinnede anmeldelser på nett med maskinlæring

mm
oppdatert on

Et nytt forskningssamarbeid mellom Kina og USA tilbyr en måte å oppdage ondsinnede e-handelsanmeldelser designet for å undergrave konkurrenter eller for å lette utpressing, ved å utnytte signaturadferden til slike anmeldere.

Systemet, med tittelen ondsinnet brukerdeteksjonsmodell (MMD), bruker Metrisk læring, en teknikk ofte brukt i datasyn og anbefalingssystemer, sammen med et gjentakende nevralt nettverk (RNN), for å identifisere og merke utdataene til slike anmeldere, som papiret navngir Profesjonelle ondsinnede brukere (PMUer).

Flott! 1 stjerne

De fleste netthandelsanmeldelser gir to former for tilbakemeldinger fra brukere: en stjernerangering (eller en rangering av 10) og en tekstbasert anmeldelse, og i et typisk tilfelle vil disse samsvare logisk (dvs. en dårlig anmeldelse vil bli ledsaget av en lav vurdering).

PMUer undergraver imidlertid vanligvis denne logikken, ved enten å legge igjen en dårlig tekstanmeldelse med høy vurdering, eller en dårlig vurdering ledsaget av en god anmeldelse.

Dette gjør at brukerens anmeldelse kan forårsake skade på omdømmet uten å utløse de relativt enkle filtrene som brukes av netthandelssider for å identifisere og adressere resultatet fra ondsinnede negative anmeldere. Hvis et filter basert på Natural Language Processing (NLP) identifiserer invektiv i teksten til en anmeldelse, blir dette "flagget" effektivt kansellert av den høye stjerne- (eller desimal) rangeringen som PMU også tildelte, noe som effektivt gjør det skadelige innholdet "nøytralt". , fra et statistisk synspunkt.

Et eksempel på hvordan en ondsinnet anmeldelse kan blandes, statistisk, med ekte anmeldelser, fra synspunktet til et samarbeidende filtreringssystem som prøver å identifisere slik oppførsel. Kilde: https://arxiv.org/pdf/2205.09673.pdf

Et eksempel på hvordan en ondsinnet anmeldelse kan blandes, statistisk, med ekte anmeldelser, fra synspunktet til et samarbeidende filtreringssystem som prøver å identifisere slik oppførsel.  Kilde: https://arxiv.org/pdf/2205.09673.pdf

Det nye papiret bemerker at intensjonen med en PMU ofte er å presse penger fra nettforhandlere i retur for endring av negative anmeldelser, og/eller et løfte om å ikke legge ut flere negative anmeldelser. I noen tilfeller er skuespillerne det ad hoc individer søker rabatter, selv om det ofte er PMU tilfeldig ansatt av offerets konkurrenter.

Tilsløring av negative anmeldelser

Den nåværende generasjonen av automatiserte detektorer for slike vurderinger bruker Collaborative Filtering eller en innholdsbasert modell, og leter etter klare og entydige "outliers" - anmeldelser som er jevnt negative på tvers av begge tilbakemeldingsmetodene, og som avviker spesielt fra den generelle trenden med anmeldelsessentiment og vurdering.

Den andre klassiske signaturen som slike filtre slår inn på, er en høy postingsfrekvens, mens en PMU vil poste strategisk og bare av og til (siden hver anmeldelse kan representere enten en individuell provisjon eller et stadium i en lengre strategi designet for å skjule "frekvens"-beregningen ).

Derfor har den nye artikkelens forskere integrert den merkelige polariteten til profesjonelle ondsinnede anmeldelser i et dedikert system, noe som resulterer i en algoritme som nesten er på nivå med evnen til en menneskelig anmelder til å "lukte en rotte" ved ulikheten mellom vurderingen og anmeldelsen. tekstinnhold.

Den konseptuelle arkitekturen for MMD, består av to sentrale moduler: Malicious User Profiling (MUP) og Attention Metric Learning (MLC, i grått).

Den konseptuelle arkitekturen for MMD, består av to sentrale moduler: Malicious User Profiling (MUP) og Attention Metric Learning (MLC, i grått).

Sammenligning med tidligere tilnærminger

Siden MMD, ifølge forfatterne, er det første systemet som forsøker å identifisere PMUer basert på deres schizofrene postingsstil, er det ingen direkte tidligere arbeider å sammenligne det med. Derfor satte forskerne systemet sitt opp mot en rekke komponentalgoritmer som tradisjonelle automatiserte filtre ofte er avhengig av, inkludert K-means++ Clustering; den ærverdige Deteksjon av statistisk avvik (SOD); Hysad; Halvtrist; CNN-trist, Og Baktalende brukerdeteksjonsanbefalingssystem (SDRS).

Testet mot merkede datasett fra Amazon og Yelp, er MMD i stand til å identifisere profesjonelle online kritikere med høyest nøyaktighet, hevder forfatterne. Fet representerer MMD, mens stjernen (*) indikerer den beste ytelsen. I det ovennevnte tilfellet ble MMD slått i bare to oppgaver, av en frittstående teknologi (MUP) som allerede er integrert i den, men som ikke er verktøyet som standard for oppgaven på hånden.

Testet mot merkede datasett fra Amazon og Yelp, er MMD i stand til å identifisere profesjonelle online kritikere med høyest nøyaktighet, hevder forfatterne. Fet representerer MMD, mens stjernen (*) indikerer den beste ytelsen. I det ovennevnte tilfellet ble MMD slått i bare to oppgaver, av en frittstående teknologi (MUP) som allerede er integrert i den, men som ikke er verktøyet som standard for oppgaven på hånden.

I dette tilfellet ble MMD satt opp mot umerkede datasett fra Taobao og Jindong, noe som gjorde det effektivt til en uovervåket læringsoppgave. Igjen, MMD er bare forbedret av en av sine egne bestanddeler teknologier, svært tilpasset for oppgaven med det formål å teste.

I dette tilfellet ble MMD satt opp mot umerkede datasett fra Taobao og Jindong, noe som gjorde det effektivt til en uovervåket læringsoppgave. Igjen, MMD er bare forbedret av en av sine egne bestanddeler teknologier, svært tilpasset for oppgaven med det formål å teste.

Forskerne observerer:

«[På] alle fire datasettene overgår vår foreslåtte modell MMD (MLC+MUP) alle grunnlinjene når det gjelder F-score. Legg merke til at MMD er en kombinasjon av MLC og MUP, som sikrer dens overlegenhet over overvåkede og uovervåkede modeller generelt.'

Artikkelen antyder også at MMD kan tjene som en nyttig forbehandlingsmetode for tradisjonelle automatiserte filtersystemer, og gir eksperimentelle resultater på en rekke datasett, bl.a. Brukerbasert samarbeidsfiltrering (UBCF), Varebasert samarbeidsfiltrering (IBCF), Matrisefaktorisering (MF-eALS), Bayesiansk personlig rangering (MF-BPR), og Nevralt samarbeidsfiltrering (NCF).

I form av Treffforhold (HR) og Normalisert diskontert kumulativ gevinst (NDCG) i resultatene av disse testede utvidelsene, uttaler forfatterne:

Blant alle fire datasettene forbedrer MMD anbefalingsmodellene betydelig når det gjelder HR og NDCG. Spesifikt kan MMD forbedre ytelsen til HR med 28.7 % i gjennomsnitt og HDCG med 17.3 % i gjennomsnitt.

«Ved å slette profesjonelle ondsinnede brukere kan MMD forbedre kvaliteten på datasettene. Uten disse profesjonelle ondsinnede brukernes falske [tilbakemelding], blir datasettet mer [intuitiv].'

De papir har tittelen Oppdag profesjonell ondsinnet bruker med metrisk læring i Recommender Systems, og kommer fra forskere ved Institutt for informatikk og teknologi ved Jilin University; nøkkellaben for intelligent informasjonsbehandling ved det kinesiske vitenskapsakademiet i Beijing; og School of Business ved Rutgers i New Jersey.

Data og tilnærming

Å oppdage PMU-er er en multimodal utfordring, siden to ikke-ekvivalente parametere (en numerisk verdi stjerne/desimalvurdering og en tekstbasert gjennomgang) må vurderes. Forfatterne av den nye artikkelen hevder at ingen tidligere arbeid har adressert denne utfordringen.

MMD har en Hierarkisk Dual-Attention tilbakevendende nevralt nettverk (HDAN) for å assimilere anmeldelsesinnholdet i en følelsesscore.

Projisere en anmeldelse inn i en sentiment-score med HDAN, som bidrar med ordinnbygging og setningsinnbygging for å oppnå en sentiment-score.

Projisere en anmeldelse inn i en sentiment-score med HDAN, som bidrar med ordinnbygging og setningsinnbygging for å oppnå en sentiment-score.

HDAN bruker oppmerksomhetsmekanismer for å tildele vekter til hvert ord, og til hver setning. På bildet over oppgir forfatterne ordet dårligere bør klart tillegges større vekt enn konkurrerende ord i anmeldelsen.

For prosjektet tok HDAN vurderingene for produkter på tvers av fire datasett som grunnleggende sannhet. Datasettene var  Amazon.com; Yelp for RecSys (2013); og to 'virkelige verden' (i stedet for eksperimentelle) datasett, fra Taobao og Jindong.

MMD utnytter metrisk læring, som forsøker å estimere en nøyaktig avstand mellom enheter for å karakterisere den samlede gruppen av relasjoner i dataene.

MMD begynner med en one-hot-koding for å velge bruker og element, via en Latent Factor Model (LFM), som oppnår en grunnvurderingsscore. I mellomtiden projiserer HDAN vurderingsinnholdet inn i sentimentresultatet som tilleggsdata.

Resultatene blir deretter behandlet til en Malicious User Profiling (MUP) modell, som gir ut sentiment gap vektor – forskjellen mellom vurderingen og den estimerte sentimentpoengsummen til anmeldelsens tekstinnhold. På denne måten kan PMU-er for første gang kategoriseres og merkes.

Oppmerksomhetsbasert metrisk læring for clustering.

Oppmerksomhetsbasert metrisk læring for clustering.

Metric Learning for Clustering (MLC) bruker disse utdataetikettene til å etablere en beregning som sannsynligheten for at en brukeranmeldelse er skadelig beregnes mot.

Menneskelige tester

I tillegg til de kvantitative resultatene beskrevet ovenfor, utførte forskerne en brukerstudie som ga 20 studenter i oppgave å identifisere ondsinnede anmeldelser, kun basert på innholdet og stjernerangeringen. Deltakerne ble bedt om å rangere anmeldelsene som 0 (for "normale" anmeldere) eller 1 (for en profesjonell ondsinnet bruker).

Av en 50/50 deling mellom normale og ondsinnede anmeldelser, merket studentene 24 sanne positive og 24 sanne negative brukere i gjennomsnitt. Til sammenligning var MMD i stand til å merke 23 sanne positive og 24 sanne negative brukere i gjennomsnitt, og opererer nesten på menneskelig nivå, og overgår grunnlinjene for oppgaven.

Studenter vs. MMD. Stjerne [*] indikerer de beste resultatene, og fet skrift indikerer MMDs resultater.

Studenter vs. MMD. Stjerne [*] indikerer de beste resultatene, og fet skrift indikerer MMDs resultater.

Forfatterne konkluderer med:

"I hovedsak er MMD en generisk løsning som ikke bare kan oppdage profesjonelle ondsinnede brukere som er utforsket i denne artikkelen, men også tjene som et generelt grunnlag for ondsinnede brukerdeteksjoner. Med mer data, som bilde, video eller lyd, kan ideen om MMD være lærerikt for å oppdage følelsesgapet mellom tittelen og innholdet, som har en lys fremtid for å motvirke forskjellige maskeringsstrategier i forskjellige applikasjoner.'

 

Først publisert 20. mai 2022.