tunggul Ngadeteksi 'Profesional' Tinjauan Online Jahat sareng Pembelajaran Mesin - Unite.AI
Connect with kami

Kacerdasan buatan

Ngadeteksi 'Profesional' Ulasan Online jahat sareng Pembelajaran Mesin

mm
diropéa on

Kolaborasi panilitian anyar antara Cina sareng AS nawiskeun cara pikeun ngadeteksi ulasan e-commerce jahat anu dirancang pikeun ngarusak pesaing atanapi ngagampangkeun meres, ku cara ngungkit paripolah tandatangan para pamariksaan sapertos kitu.

Sistim nu, judulna model deteksi pamaké jahat (MMD), ngamangpaatkeun Métrik Learning, hiji téhnik biasa dianggo dina visi komputer jeung sistem nyarankeun, bareng jeung Recurrent Neural Network (RNN), pikeun ngaidentipikasi jeung labél kaluaran reviewers misalna, nu ngaran kertas. Pamaké jahat profésional (PMU).

Hebat! 1 béntang

Paling ulasan ecommerce online nyadiakeun dua bentuk eupan balik pamaké: rating béntang (atawa rating kaluar tina 10) sarta review dumasar-téks, sarta dina kasus has, ieu bakal pakait logis (ie, review goréng bakal dibarengan ku a rating handap).

PMUs, kumaha oge, ilaharna subvert logika ieu, boh ku ninggalkeun review téks goréng jeung rating luhur, atawa rating goréng dibarengan ku review alus.

Hal ieu ngamungkinkeun ulasan pamaké pikeun ngabalukarkeun karuksakan reputasi tanpa memicu saringan kawilang basajan deployed ku situs e-commerce pikeun ngaidentipikasi jeung alamat kaluaran reviewers négatip jahat. Upami saringan dumasar kana Natural Language Processing (NLP) ngaidentipikasi invective dina téks ulasan, 'bandéra' ieu sacara efektif dibatalkeun ku rating bintang luhur (atanapi desimal) anu ogé ditugaskeun ku PMU, sacara efektif ngajantenkeun eusi jahat 'nétral'. , tina sudut pandang statistik.

Conto kumaha ulasan jahat tiasa dicampur, sacara statistik, sareng ulasan asli, tina sudut pandang sistem panyaring kolaborasi anu nyobian ngaidentipikasi paripolah sapertos kitu. Sumber: https://arxiv.org/pdf/2205.09673.pdf

Conto kumaha ulasan jahat tiasa dicampur, sacara statistik, sareng ulasan asli, tina sudut pandang sistem panyaring kolaborasi anu nyobian ngaidentipikasi paripolah sapertos kitu.  Sumber: https://arxiv.org/pdf/2205.09673.pdf

Tulisan anyar nyatakeun yén niat PMU sering nyéépkeun artos ti pangecér online pikeun ngabalikeun amandemen ulasan négatip, sareng / atanapi janji pikeun henteu ngeposkeun ulasan négatip salajengna. Dina sababaraha kasus, aktor nu AD hoc individu néangan diskon, sanajan mindeng PMU keur padamel ku pesaing korban.

Cloaking ulasan négatip

Generasi ayeuna tina detéktor otomatis pikeun ulasan sapertos nganggo Collaborative Filtering atanapi a modél dumasar eusi, sareng milarian 'outlier' anu jelas sareng teu ambigu - ulasan anu saragam négatif dina duanana metode eupan balik, sareng anu béda-béda utamana tina tren umum sentimen ulasan sareng rating.

Tanda tangan klasik sanésna anu dikonci saringan sapertos kitu nyaéta frekuensi posting anu luhur, sedengkeun PMU bakal masangkeun sacara strategis sareng ngan ukur aya kalana (sabab unggal ulasan tiasa ngagambarkeun komisi individu, atanapi tahap dina strategi anu langkung panjang anu dirancang pikeun ngabingungkeun métrik 'frékuénsi'. ).

Ku alatan éta, panalungtik makalah anyar geus ngahijikeun polaritasna aneh tina ulasan jahat profésional kana sistem dedicated, hasilna algoritma nu ampir sarimbag jeung kamampuh hiji reviewer manusa pikeun 'bau beurit' dina disparity antara rating jeung resensi. eusi téks.

Arsitéktur konseptual pikeun MMD, diwangun ku dua modul sentral: Malicious User Profiling (MUP) sareng Attention Metric Learning (MLC, abu-abu).

Arsitéktur konseptual pikeun MMD, diwangun ku dua modul sentral: Malicious User Profiling (MUP) sareng Attention Metric Learning (MLC, abu-abu).

Ngabandingkeun jeung pendekatan saméméhna

Kusabab MMD nyaéta, pangarang nyatakeun, sistem munggaran anu nyobian ngaidentipikasi PMUs dumasar kana gaya posting schizophrenic maranéhna, teu aya karya langsung langsung ngalawan nu ngabandingkeun éta. Ku alatan éta, peneliti diadu sistem maranéhanana ngalawan sababaraha algoritma komponén nu saringan otomatis tradisional remen gumantung, kaasup K-means ++ Clustering; anu dihormat Deteksi Outlier Statistik (SOD); Hysad; Semi-sedih; CNN-sedih; jeung Pitenah pamaké Deteksi Recommender System (SDRS).

Diuji ngalawan set data anu dilabélan ti Amazon sareng Yelp, MMD tiasa ngaidentipikasi detractors online profésional kalayan tingkat akurasi pangluhurna, pangarang ngaku. Kandel ngagambarkeun MMD, sedengkeun tanda bintang (*) nunjukkeun kinerja anu pangsaéna. Dina kasus di luhur, MMD ieu keok dina ngan dua tugas, ku téhnologi mandiri (MUP) nu geus diasupkeun kana eta, tapi nu teu tooled sacara standar pikeun tugas di leungeun.

Diuji ngalawan set data anu dilabélan ti Amazon sareng Yelp, MMD tiasa ngaidentipikasi detractors online profésional kalayan tingkat akurasi pangluhurna, pangarang ngaku. Kandel ngagambarkeun MMD, sedengkeun tanda bintang (*) nunjukkeun kinerja anu pangsaéna. Dina kasus di luhur, MMD ieu keok dina ngan dua tugas, ku téhnologi mandiri (MUP) nu geus diasupkeun kana eta, tapi nu teu tooled sacara standar pikeun tugas di leungeun.

Dina hal ieu, MMD diadu sareng set data anu teu dilabélan ti Taobao sareng Jindong, sahingga sacara efektif janten tugas diajar anu henteu diawasi. Sakali deui, MMD ngan ukur dironjatkeun ku salah sahiji téknologi konstituénna, diadaptasi pisan pikeun tugas pikeun tujuan tés.

Dina hal ieu, MMD diadu sareng set data anu teu dilabélan ti Taobao sareng Jindong, sahingga sacara efektif janten tugas diajar anu henteu diawasi. Sakali deui, MMD ngan ukur dironjatkeun ku salah sahiji téknologi konstituénna, diadaptasi pisan pikeun tugas pikeun tujuan tés.

Para panalungtik niténan:

'[Dina] sadayana opat set data, modél MMD (MLC+MUP) anu diusulkeun kami langkung saé sadayana garis dasar dina hal F-skor. Catet yén MMD mangrupakeun kombinasi MLC jeung MUP, nu mastikeun kaunggulan na leuwih model diawaskeun jeung unsupervised sacara umum.'

Tulisan éta ogé nunjukkeun yén MMD tiasa dianggo salaku padika pra-prosés anu mangpaat pikeun sistem saringan otomatis tradisional, sareng nyayogikeun hasil ékspérimén dina sababaraha set data, kalebet Nyaring kolaborasi dumasar-pamaké (UBCF), Nyaring kolaborasi dumasar-item (IBCF), Faktorisasi matriks (MF-eALS), Peringkat pribadi Bayesian (MF-BPR), jeung Nyaring Kolaborasi Neural (NCF).

Dina pangartian Rasio Hit (HR) jeung Gain kumulatif diskon dinormalisasi (NDCG) dina hasil augmentasi anu diuji ieu, panulis nyatakeun:

'Di antara opat set data, MMD ningkatkeun modél rekomendasi sacara signifikan dina hal HR sareng NDCG. Husus, MMD tiasa ningkatkeun kinerja SDM rata-rata 28.7% sareng HDCG rata-rata 17.3%.

'Ku ngahapus pangguna jahat profésional, MMD tiasa ningkatkeun kualitas set data. Tanpa ieu palsu pamaké jahat profésional ' [éupan balik], dataset jadi leuwih [intuitif].'

nu keretas judulna Deteksi Pamaké jahat Profesional sareng Pangajaran Métrik dina Sistem Rekomendasis, sarta asalna ti peneliti di Jurusan Élmu Komputer jeung Téhnologi di Universitas Jilin; Lab Key of Processing Émbaran calakan Akademi Élmu Cina di Beijing; jeung Sakola Usaha di Rutgers di New Jersey.

Data jeung Pendekatan

Ngadeteksi PMUs mangrupakeun tantangan multimodal, saprak dua parameter non-sarimbag (hiji béntang-nilai numerik / rating desimal sarta review dumasar-téks) kudu dianggap. Panulis makalah anyar negeskeun yén teu aya karya sateuacana anu ngarengsekeun tantangan ieu.

MMD employs a Hierarki Dual-Perhatian jaringan Neural ngulang (HDAN) pikeun asimilasi eusi resensi kana skor sentimen.

Projecting resensi kana skor sentimen jeung HDAN, nu nyumbang embedding kecap jeung embedding kalimah dina urutan pikeun ménta skor sentimen.

Projecting resensi kana skor sentimen jeung HDAN, nu nyumbang embedding kecap jeung embedding kalimah dina urutan pikeun ménta skor sentimen.

HDAN ngagunakeun mékanisme perhatian pikeun nangtukeun beurat ka unggal kecap, jeung unggal kalimah. Dina gambar di luhur, pangarang nyatakeun, kecap poorer kudu jelas jadi ditugaskeun beurat gede ti competing kecap dina resensi.

Pikeun proyék éta, HDAN nyandak rating pikeun produk dina opat set data salaku bebeneran taneuh. Dataset éta  Amazon.com; Yelp pikeun RecSys (2013); sareng dua set data 'dunya nyata' (tinimbang ékspérimén), ti Taobao sareng Jindong.

MMD ngungkit Métrik Learning, anu nyobian ngira-ngira jarak anu akurat antara éntitas pikeun ngacirian grup hubungan sakabéh dina data.

MMD dimimitian ku a encoding hiji-panas pikeun milih pangguna sareng barang, ngalangkungan Modél Faktor Laten (LFM), anu kéngingkeun skor rating dasar. Samentara éta, HDAN proyék eusi review kana skor sentimen salaku data adjunct.

Hasilna teras diolah janten modél Malicious User Profiling (MUP), anu ngahasilkeun vektor gap sentimen – bédana antara rating jeung estimasi skor sentimen tina eusi téks resensi. Ku cara kieu, pikeun kahiji kalina, PMU tiasa digolongkeun sareng dilabélan.

Diajar Métrik dumasar-perhatian pikeun clustering.

Diajar Métrik dumasar-perhatian pikeun clustering.

Métrik Learning for Clustering (MLC) nganggo labél kaluaran ieu pikeun ngadamel métrik anu diitung kamungkinan kamungkinan ulasan pangguna jahat.

Uji Manusa

Salian hasil kuantitatif diwincik di luhur, panalungtik ngalaksanakeun ulikan pamaké nu tasked 20 siswa kalawan ngaidentipikasi ulasan jahat, ngan dumasar kana eusi na rating béntang. Peserta dipenta pikeun meunteun ulasan salaku 0 (pikeun reviewers 'normal') atawa 1 (pikeun pamaké jahat profésional).

Tina 50/50 pamisah antara ulasan normal sareng jahat, para siswa dilabélan 24 positip leres sareng 24 pangguna négatip anu rata-rata. Ku ngabandingkeun, MMD tiasa labél 23 leres positip sareng 24 pangguna négatip leres rata-rata, operasi ampir di tingkat manusa, sareng ngalangkungan garis dasar pikeun tugas éta.

Murid vs MMD. Asterisk [*] nunjukkeun hasil anu pangsaéna, sareng kandel nunjukkeun hasil MMD.

Murid vs MMD. Asterisk [*] nunjukkeun hasil anu pangsaéna, sareng kandel nunjukkeun hasil MMD.

Nu nulis disimpulkeun:

'Intina, MMD mangrupikeun solusi umum, anu henteu ngan ukur tiasa ngadeteksi pangguna jahat profésional anu ditalungtik dina tulisan ieu tapi ogé janten dasar umum pikeun deteksi pangguna jahat. Kalayan langkung seueur data, sapertos gambar, pidéo, atanapi sora, ideu MMD tiasa janten instruktif pikeun ngadeteksi gap sentimen antara judul sareng eusina, anu gaduh masa depan anu cerah pikeun ngalawan strategi masking anu béda dina aplikasi anu béda.'

 

Mimiti diterbitkeun 20 Méi 2022.