Connect with us

Kecerdasan buatan

Mengapa AI Tidak Memberikan Rekomendasi Produk yang Lebih Baik

mm

Jika Anda tertarik dengan hal-hal yang tidak biasa, ada dua alasan mengapa pencarian Anda untuk item dan produk kemungkinan besar kurang terkait dengan minat Anda dibandingkan dengan rekan-rekan ‘mainstream’ Anda; baik Anda adalah ‘edge case’ moneterisasi yang minatnya hanya akan dipenuhi jika Anda juga berada di kategori daya beli ekonomi yang lebih tinggi (misalnya, produk dan layanan yang terkait dengan ‘manajemen kekayaan’); atau algoritma pencarian yang Anda gunakan menggunakan collaborative filtering (CF), yang mengutamakan minat mayoritas.

Karena collaborative filtering lebih murah dan lebih mapan daripada algoritma dan kerangka kerja lain yang potensial lebih mampu, memungkinkan kedua kasus ini berlaku.

Hasil pencarian berbasis CF akan memprioritaskan item yang dianggap populer di kalangan ‘orang seperti Anda’, sebaik mungkin kerangka host memahami jenis konsumen Anda.

Jika Anda enggan untuk memberikan informasi profil data kepada sistem host – misalnya, tidak cenderung menekan tombol ‘Suka’ di Netflix dan layanan konten video lainnya – Anda kemungkinan besar akan diklasifikasikan secara generik dalam interaksi awal Anda dengan sistem, dan rekomendasi yang Anda terima akan mencerminkan tren yang paling populer.

Di platform streaming, ini bisa berarti direkomendasikan apa pun acara dan film yang saat ini ‘hot’, seperti acara TV realitas dan dokumen pembunuhan forensik, terlepas dari minat Anda pada hal-hal tersebut. Begitu juga dengan platform rekomendasi buku, yang cenderung menawarkan buku terlaris saat ini dan baru-baru ini, sepertinya secara sewenang-wenang.

Secara teori, bahkan pengguna yang hati-hati dengan data seharusnya akhirnya mendapatkan hasil yang lebih baik dari sistem tersebut berdasarkan cara mereka menggunakan dan hal-hal yang mereka cari, karena sebagian besar kerangka pencarian memberikan pengguna kemampuan terbatas untuk mengedit riwayat penggunaan mereka.

Warna Apa Pun yang Anda Sukai, Selama Ini Hitam

Namun, menurut sebuah studi baru dari Austria, keunggulan collaborative filtering atas content-based filtering (yang berusaha untuk mendefinisikan hubungan antara produk bukan hanya mempertimbangkan popularitas agregat), dan pendekatan alternatif lainnya, cenderung membuat sistem pencarian menuju popularity bias jangka panjang, di mana hasil yang jelas populer dipromosikan kepada pengguna akhir yang tidak mungkin terkesan oleh mereka.

Makalah tersebut menemukan bahwa pengguna yang tidak tertarik dengan item populer menerima ‘rekomendasi yang jauh lebih buruk’ daripada pengguna dengan minat sedang atau tinggi pada popularitas, dan (mungkin tautologis) bahwa item populer direkomendasikan lebih sering daripada item yang tidak populer. Peneliti juga menyimpulkan bahwa pengguna dengan minat rendah pada item populer cenderung memiliki profil pengguna yang lebih besar yang dapat memperbaiki sistem rekomendasi – jika saja sistem tersebut bisa menghilangkan kecanduan mereka pada ‘metrik kerumunan’.

Membandingkan popularitas dengan kompleksitas profil pengguna menunjukkan bahwa pengguna 'marginal' yang tidak tertarik dengan konten arus utama sebenarnya memiliki lebih banyak potensi konten untuk ditambang oleh sistem rekomendasi; tetapi karena pengguna tersebut tidak mengikuti tren, tampaknya ini adalah kesempatan yang terlewatkan.

Membandingkan popularitas dengan kompleksitas profil pengguna menunjukkan bahwa pengguna ‘marginal’ yang tidak tertarik dengan konten arus utama sebenarnya memiliki lebih banyak potensi konten untuk ditambang oleh sistem rekomendasi; tetapi karena pengguna tersebut tidak mengikuti tren, tampaknya ini adalah kesempatan yang terlewatkan. Sumber: https://arxiv.org/pdf/2203.00376.pdf

Makalah tersebut berjudul Popularity Bias in Collaborative Filtering-Based Multimedia Recommender Systems, dan berasal dari peneliti di now-Center GmbH di Graz, dan Graz University of Technology.

Domain yang Diliput

Membangun pada karya sebelumnya yang mempelajari sektor individu (seperti rekomendasi buku), makalah baru ini mempelajari empat domain: buku digital (melalui dataset BookCrossing); film (melalui MovieLens); musik (melalui Last.fm); dan anime (melalui MyAnimeList).

Studi ini menerapkan empat algoritma rekomendasi multimedia populer (MMRS) collaborative filtering melawan dataset dibagi menjadi tiga kelompok pengguna, sesuai dengan kecenderungan mereka untuk menerima ‘hasil populer’: LowPop, MedPop, dan HighPop. Kelompok pengguna difilter menjadi 1000 kelompok ukuran sama, berdasarkan kemungkinan paling rendah, rata-rata, dan paling mungkin untuk memfavoritkan ‘hasil populer’.

Dalam mengomentari hasilnya, penulis menyatakan:

‘[Kami] menemukan bahwa kemungkinan suatu item multimedia untuk direkomendasikan sangat berkorelasi dengan popularitas item tersebut [dan] bahwa pengguna dengan kecenderungan yang lebih rendah untuk popularitas (LowPop) menerima rekomendasi multimedia yang jauh lebih buruk daripada pengguna dengan kecenderungan sedang (MedPop) dan tinggi (HighPop) untuk item populer…

‘Hasil kami menunjukkan bahwa meskipun pengguna dengan minat rendah pada item populer cenderung memiliki profil pengguna yang lebih besar, mereka menerima akurasi rekomendasi yang terendah. Oleh karena itu, penelitian lebih lanjut diperlukan untuk mengurangi popularity bias di MMRS, baik pada tingkat item maupun pengguna.’

Di antara algoritma yang dievaluasi adalah dua K-Nearest Neighbors (KNN) varian, UserKNN dan UserKNNAvg. Yang pertama dari ini tidak menghasilkan peringkat rata-rata untuk pengguna target dan item. Sebuah non-negatif matrix factorization varian (NMF) juga diuji, bersama dengan algoritma CoClustering.

Protokol evaluasi mempertimbangkan tugas rekomendasi sebagai tantangan prediksi, diukur oleh peneliti dalam hal mean absolute error (MAE), melawan protokol validasi silang lima lipat yang melebihi split biasa 80/20 antara data pelatihan dan pengujian.

Hasilnya menunjukkan jaminan hampir pasti popularity bias di bawah collaborative filtering. Pertanyaannya, secara argumentatif, adalah apakah ini dianggap sebagai masalah oleh perusahaan multi-miliar dolar yang saat ini mengintegrasikan CF ke dalam algoritma pencarian mereka.

Di seluruh empat dataset yang dipelajari melalui empat rekomendasi Collaborative Filtering populer, setiap hasil menunjukkan bahwa item media populer lebih mungkin untuk direkomendasikan daripada penawaran yang tidak populer.

Di seluruh empat dataset yang dipelajari melalui empat rekomendasi Collaborative Filtering populer, setiap hasil menunjukkan bahwa item media populer lebih mungkin untuk direkomendasikan daripada penawaran yang tidak populer.

Jalan ‘Mudah’ Keluar

Meskipun collaborative filtering semakin digunakan sebagai satu bagian dari strategi algoritma pencarian yang lebih luas, ini memiliki saham yang kuat di sektor pencarian, dan logika serta potensi profitabilitasnya menarik untuk dipahami.

Secara inheren, CF pada dasarnya memuat tugas evaluasi nilai konten ke pengguna akhir, dan menggunakan penerimaan konten oleh mereka sebagai indeks nilai dan potensi daya tariknya kepada pelanggan lain. Dengan analogi, ini pada dasarnya adalah peta ‘buzz’ meja air.

Content-based filtering (CBF) lebih sulit, tetapi bisa potensial memberikan hasil yang lebih relevan. Di sektor visi komputer, sejumlah besar penelitian saat ini sedang dikeluarkan untuk mengkategorikan konten video dan berusaha untuk menghasilkan domain, fitur, dan konsep tingkat tinggi melalui analisis audio dan video di output film dan TV.

Salah satu dari banyak proyek penelitian selama lima tahun terakhir yang berusaha untuk menghasilkan fitur semantik dari konten film, untuk menghasilkan rekomendasi 'adjacent' yang lebih pintar. Sumber: https://arxiv.org/pdf/1701.00199.pdf

Salah satu dari banyak proyek penelitian selama lima tahun terakhir yang berusaha untuk menghasilkan fitur semantik dari konten film, untuk menghasilkan rekomendasi ‘adjacent’ yang lebih pintar. Sumber: https://arxiv.org/pdf/1701.00199.pdf

Namun, ini adalah upaya yang relatif baru, dan terikat dalam perjuangan umum saat ini untuk mengkuantifikasi, mengisolasi, dan mengeksploitasi konsep dan fitur tingkat tinggi dalam pengetahuan domain.

Siapa yang Menggunakan Collaborative Filtering?

Pada saat penulisan, mesin rekomendasi Netflix yang sering dikritik masih terfokus pada berbagai pendekatan collaborative filtering, menerapkan berbagai teknologi tambahan dalam upaya terus-menerus untuk menghasilkan rekomendasi yang lebih relevan bagi pengguna.

Mesin pencari Amazon berevolusi dari adopsi awal collaborative filtering berbasis pengguna ke metode collaborative filtering item-item, yang menempatkan penekanan lebih besar pada riwayat pembelian pelanggan. Secara alami, ini dapat menyebabkan jenis ketidakakuratan yang berbeda, seperti filter bubbles, atau penekanan berlebihan pada data yang langka. Dalam kasus terakhir, jika pelanggan Amazon yang jarang membuat pembelian ‘tidak biasa’, seperti set operetta untuk teman yang menyukai opera, mungkin tidak ada alternatif pembelian yang cukup untuk mencerminkan preferensi pelanggan sendiri untuk mencegah pembelian ini dari menjadi pengaruh pada rekomendasi mereka sendiri.

Collaborative filtering juga digunakan secara luas oleh Facebook, bersama dengan pendekatan lain, dan juga oleh LinkedIn, YouTube, dan Twitter.

 

Dipublikasikan pertama kali 2 Maret 2022.

Penulis tentang machine learning, spesialis domain dalam sintesis gambar manusia. Mantan kepala konten penelitian di Metaphysic.ai.