cung Zbulimi i rishikimeve të dëmshme "profesionale" në internet me mësimin e makinerisë - Unite.AI
Lidhu me ne

Inteligjenca artificiale

Zbulimi i rishikimeve të dëmshme 'profesionale' në internet me mësimin e makinerisë

mm
Përditësuar on

Një bashkëpunim i ri kërkimor midis Kinës dhe SHBA-së ofron një mënyrë për të zbuluar rishikimet me qëllim të keq të tregtisë elektronike, të krijuara për të minuar konkurrentët ose për të lehtësuar shantazhin, duke shfrytëzuar sjelljen e nënshkrimit të rishikuesve të tillë.

Sistemi, i titulluar modeli i zbulimit të përdoruesve me qëllim të keq (MMD), shfrytëzon Mësimi metrikë, një teknikë që përdoret zakonisht në vizionin kompjuterik dhe sistemet rekomanduese, së bashku me një Rrjet Neural Recurrent (RNN), për të identifikuar dhe etiketuar rezultatet e rishikuesve të tillë, të cilët dokumenti i emërton Përdorues profesionistë me qëllim të keq (PMU).

E shkëlqyeshme! 1 yll

Shumica e rishikimeve të tregtisë elektronike në internet ofrojnë dy forma të komenteve të përdoruesve: një vlerësim me yje (ose një vlerësim nga 10) dhe një rishikim të bazuar në tekst, dhe në një rast tipik, këto do të korrespondojnë logjikisht (d.m.th., një vlerësim i keq do të shoqërohet nga një vlerësim i ulët).

Megjithatë, PMU-të zakonisht e përmbysin këtë logjikë, ose duke lënë një rishikim të keq teksti me një vlerësim të lartë, ose një vlerësim të dobët të shoqëruar nga një rishikim i mirë.

Kjo lejon që rishikimi i përdoruesit të shkaktojë dëme reputacionin pa nxitur filtrat relativisht të thjeshtë të vendosur nga faqet e tregtisë elektronike për të identifikuar dhe adresuar rezultatet e rishikuesve negativë me qëllim të keq. Nëse një filtër i bazuar në Përpunimin e Gjuhës Natyrore (NLP) identifikon invektiv në tekstin e një rishikimi, ky 'flamur' anulohet efektivisht nga vlerësimi i lartë yll (ose dhjetor) që ka caktuar gjithashtu PMU, duke e bërë në mënyrë efektive përmbajtjen me qëllim të keq 'neutrale' , nga pikëpamja statistikore.

Një shembull se si një rishikim me qëllim të keq mund të përzihet, statistikisht, me rishikime të vërteta, nga këndvështrimi i një sistemi filtrimi bashkëpunues që po përpiqet të identifikojë një sjellje të tillë. Burimi: https://arxiv.org/pdf/2205.09673.pdf

Një shembull se si një rishikim me qëllim të keq mund të përzihet, statistikisht, me rishikime të vërteta, nga këndvështrimi i një sistemi filtrimi bashkëpunues që po përpiqet të identifikojë një sjellje të tillë.  Burimi: https://arxiv.org/pdf/2205.09673.pdf

Gazeta e re vë në dukje se qëllimi i një PMU është shpesh të zhvasë para nga shitësit me pakicë në internet në këmbim të ndryshimit të vlerësimeve negative dhe/ose një premtimi për të mos postuar komente të mëtejshme negative. Në disa raste, aktorët janë ad hoc individët duke kërkuar zbritje, edhe pse shpesh NJPMN-ja po ekziston punësuar rastësisht nga konkurrentët e viktimës.

Mbyllja e komenteve negative

Gjenerata aktuale e detektorëve të automatizuar për rishikime të tilla përdor Filtrim bashkëpunues ose a modeli i bazuar në përmbajtje, dhe janë duke kërkuar për "të jashtëzakonshëm" të qartë dhe të paqartë - rishikime të cilat janë në mënyrë të njëtrajtshme negative në të dyja metodat e reagimit, dhe që ndryshojnë dukshëm nga tendenca e përgjithshme e ndjenjës dhe vlerësimit të rishikimit.

Nënshkrimi tjetër klasik që kyçin filtra të tillë është një frekuencë e lartë postimi, ndërsa një PMU do të postojë në mënyrë strategjike dhe vetëm herë pas here (pasi çdo rishikim mund të përfaqësojë ose një komision individual, ose një fazë në një strategji më të gjatë të krijuar për të errësuar metrikën e 'frekuencës' ).

Prandaj, studiuesit e punimit të ri kanë integruar polaritetin e çuditshëm të rishikimeve profesionale me qëllim të keq në një sistem të dedikuar, duke rezultuar në një algoritëm që është pothuajse në të njëjtin nivel me aftësinë e një recensuesi njerëzor për të 'ndjerë erën e një miu' në pabarazinë midis vlerësimit dhe rishikimit. përmbajtjen e tekstit.

Arkitektura konceptuale për MMD, përbëhet nga dy module qendrore: Profilizimi i përdoruesit me qëllim të keq (MUP) dhe Mësimi metrikë i vëmendjes (MLC, në gri).

Arkitektura konceptuale për MMD, përbëhet nga dy module qendrore: Profilizimi i përdoruesit me qëllim të keq (MUP) dhe Mësimi metrikë i vëmendjes (MLC, në gri).

Krahasimi me qasjet e mëparshme

Meqenëse MMD është, thonë autorët, sistemi i parë që përpiqet të identifikojë PMU-të bazuar në stilin e tyre të postimit skizofrenik, nuk ka punë të drejtpërdrejta paraprake me të cilat mund të krahasohet. Prandaj, studiuesit vendosën sistemin e tyre kundër një numri algoritmesh përbërësish nga të cilët varen shpesh filtrat tradicionalë të automatizuar, duke përfshirë K-means++ Clustering; i nderuari Zbulimi i statistikave të jashtme (SOD); Hysadin; Gjysmë e trishtuar; CNN-i trishtuarDhe Sistemi i rekomandimit për zbulimin e përdoruesve të shpifur (SDRS).

E testuar kundër grupeve të të dhënave të etiketuara nga Amazon dhe Yelp, MMD është në gjendje të identifikojë kritikuesit profesionistë në internet me shkallën më të lartë të saktësisë, pohojnë autorët. Bold përfaqëson MMD, ndërsa ylli (*) tregon performancën më të mirë. Në rastin e mësipërm, MMD u mposht vetëm në dy detyra, nga një teknologji e pavarur (MUP) që tashmë është e përfshirë në të, por që nuk është e veglave si parazgjedhje për detyrën në fjalë.

E testuar kundër grupeve të të dhënave të etiketuara nga Amazon dhe Yelp, MMD është në gjendje të identifikojë kritikuesit profesionistë në internet me shkallën më të lartë të saktësisë, pohojnë autorët. Bold përfaqëson MMD, ndërsa ylli (*) tregon performancën më të mirë. Në rastin e mësipërm, MMD u mposht vetëm në dy detyra, nga një teknologji e pavarur (MUP) që tashmë është e përfshirë në të, por që nuk është e veglave si parazgjedhje për detyrën në fjalë.

Në këtë rast, MMD u përball me grupe të dhënash të paetiketuara nga Taobao dhe Jindong, duke e bërë atë në mënyrë efektive një detyrë mësimore të pambikëqyrur. Përsëri, MMD është përmirësuar vetëm nga një nga teknologjitë e tij përbërëse, shumë të përshtatura për detyrën për qëllime testimi.

Në këtë rast, MMD u përball me grupe të dhënash të paetiketuara nga Taobao dhe Jindong, duke e bërë atë në mënyrë efektive një detyrë mësimore të pambikëqyrur. Përsëri, MMD është përmirësuar vetëm nga një nga teknologjitë e tij përbërëse, shumë të përshtatura për detyrën për qëllime testimi.

Studiuesit vëzhgojnë:

'[Në] të katër grupet e të dhënave, modeli ynë i propozuar MMD (MLC+MUP) i tejkalon të gjitha linjat bazë për sa i përket rezultatit F. Vini re se MMD është një kombinim i MLC dhe MUP, i cili siguron epërsinë e tij ndaj modeleve të mbikëqyrura dhe të pambikëqyrura në përgjithësi.'

Dokumenti gjithashtu sugjeron që MMD mund të shërbejë si një metodë e dobishme para-përpunimi për sistemet tradicionale të automatizuara të filtrave dhe ofron rezultate eksperimentale në një numër grupesh të dhënash, duke përfshirë Filtrim bashkëpunues i bazuar në përdorues (UBCF), Filtrim bashkëpunues i bazuar në artikuj (IBCF), Faktorizimi i matricës (MF-eALS), Renditja e personalizuar Bayesian (MF-BPR), dhe Filtrim bashkëpunues nervor (NCF).

Në kushtet e Raporti i goditjeve (HR) dhe Fitimi kumulativ i skontuar i normalizuar (NDCG) në rezultatet e këtyre shtimeve të testuara, autorët thonë:

Midis të katër grupeve të të dhënave, MMD përmirëson ndjeshëm modelet e rekomandimit për sa i përket HR dhe NDCG. Në mënyrë të veçantë, MMD mund të rrisë performancën e HR me 28.7% mesatarisht dhe HDCG me 17.3% mesatarisht.

"Duke fshirë përdoruesit profesionistë me qëllim të keq, MMD mund të përmirësojë cilësinë e grupeve të të dhënave. Pa falsifikimin e këtyre përdoruesve profesionistë me qëllim të keq [përgjigje], grupi i të dhënave bëhet më i madh [intuitive].'

La letër titullohet Zbuloni një përdorues keqdashës profesional me mësimin metrikë në sistemin e rekomanduesves, dhe vjen nga studiues në Departamentin e Shkencave dhe Teknologjisë Kompjuterike në Universitetin Jilin; Laboratori kryesor i Përpunimit Inteligjent të Informacionit të Akademisë Kineze të Shkencave në Pekin; dhe Shkolla e Biznesit në Rutgers në Nju Xhersi.

Të dhënat dhe Qasja

Zbulimi i PMU-ve është një sfidë multimodale, pasi duhet të merren parasysh dy parametra jo ekuivalent (një vlerësim yll/dhjetor me vlerë numerike dhe një rishikim i bazuar në tekst). Autorët e punimit të ri pohojnë se asnjë punë e mëparshme nuk e ka trajtuar këtë sfidë.

MMD punëson një Rrjeti nervor periodik hierarkik me vëmendje të dyfishtë (HDAN) për të asimiluar përmbajtjen e rishikimit në një pikë ndjenjash.

Projektimi i një rishikimi në një rezultat sentimenti me HDAN, i cili kontribuon në futjen e fjalëve dhe futjen e fjalive për të marrë një rezultat sentimenti.

Projektimi i një rishikimi në një rezultat sentimenti me HDAN, i cili kontribuon në futjen e fjalëve dhe futjen e fjalive për të marrë një rezultat sentimenti.

HDAN përdor mekanizmat e vëmendjes për të caktuar pesha për secilën fjalë dhe për secilën fjali. Në imazhin e mësipërm, autorët thonë, fjala varfër qartë duhet t'i jepet peshë më e madhe se fjalët konkurruese në rishikim.

Për projektin, HDAN mori vlerësimet për produktet në katër grupe të dhënash si të vërteta bazë. Të dhënat ishin  Amazon.com; Yelp për RecSys (2013); dhe dy grupe të dhënash të 'botës reale' (në vend se eksperimentale), nga Taobao dhe Jindong.

MMD përdor mësimin metrikë, i cili përpiqet të vlerësojë një distancë të saktë midis entiteteve në mënyrë që të karakterizojë grupin e përgjithshëm të marrëdhënieve në të dhëna.

MMD fillon me a një kodim i nxehtë për të zgjedhur përdoruesin dhe artikullin, nëpërmjet një Modeli të Faktorit Latent (LFM), i cili merr një rezultat vlerësimi bazë. Ndërkohë, HDAN projekton përmbajtjen e rishikimit në rezultatin e ndjenjave si të dhëna shtesë.

Rezultatet më pas përpunohen në një model të Profilizimit të Përdoruesit me qëllim të keq (MUP), i cili nxjerr vektor i boshllëkut të ndjenjave – pabarazia midis vlerësimit dhe rezultatit të vlerësuar të ndjenjës së përmbajtjes së tekstit të rishikimit. Në këtë mënyrë, për herë të parë, PMU-të mund të kategorizohen dhe etiketohen.

Të mësuarit metrikë të bazuar në vëmendje për grupim.

Të mësuarit metrikë të bazuar në vëmendje për grupim.

Mësimi metrikë për grupim (MLC) përdor këto etiketa dalëse për të krijuar një metrikë kundrejt së cilës llogaritet probabiliteti që një rishikim i përdoruesit të jetë me qëllim të keq.

Testet njerëzore

Përveç rezultateve sasiore të detajuara më sipër, studiuesit kryen një studim përdoruesi që u ngarkoi 20 studentëve identifikimin e rishikimeve me qëllim të keq, bazuar vetëm në përmbajtjen dhe vlerësimin e yjeve. Pjesëmarrësve iu kërkua të vlerësonin komentet si 0 (për rishikuesit 'normal') ose 1 (për një përdorues profesionist me qëllim të keq).

Nga një ndarje 50/50 midis rishikimeve normale dhe keqdashëse, studentët etiketuan mesatarisht 24 përdorues të vërtetë pozitivë dhe 24 përdorues të vërtetë negativë. Për krahasim, MMD ishte në gjendje të etiketonte mesatarisht 23 përdorues të vërtetë pozitivë dhe 24 përdorues të vërtetë negativë, duke operuar pothuajse në nivel njerëzor dhe duke tejkaluar linjat bazë për detyrën.

Studentët kundër MMD. Ylli [*] tregon rezultatet më të mira dhe bold tregon rezultatet e MMD.

Studentët kundër MMD. Ylli [*] tregon rezultatet më të mira dhe bold tregon rezultatet e MMD.

Autorët përfundojnë:

“Në thelb, MMD është një zgjidhje e përgjithshme, e cila jo vetëm që mund të zbulojë përdoruesit profesionistë me qëllim të keq që janë eksploruar në këtë punim, por gjithashtu të shërbejë si një bazë e përgjithshme për zbulimet e përdoruesve me qëllim të keq. Me më shumë të dhëna, si imazhi, video ose zëri, ideja e MMD mund të jetë udhëzuese për të zbuluar hendekun e ndjenjave midis titullit dhe përmbajtjes së tyre, gjë që ka një të ardhme të ndritur për të kundërshtuar strategji të ndryshme maskimi në aplikacione të ndryshme.'

 

Botuar për herë të parë më 20 maj 2022.

Shkrimtar për mësimin e makinerive, inteligjencën artificiale dhe të dhënat e mëdha.
Faqja personale: martinanderson.ai
Kontaktoni: [email mbrojtur]
Twitter: @manders_ai