Штучний Інтелект

Використання відгуків для створення системи рекомендацій, яка працює

опублікований 1 Лютого, 2022

оновлений 9 Грудня, 2022

Мартін Андерсон

Якщо ви коли-небудь купували товар онлайн і дивувалися безглуздості та непридатності «супутніх товарів», які переслідують процес купівлі та післяпродажного обслуговування, ви вже розумієте, що популярні та мейнстрімні рекомендаційні системи як правило, не вміють розуміти взаємозв’язок між потенційними покупками.

Якщо ви купуєте малоймовірний і рідкісний товар, наприклад духовку, рекомендації щодо інших печей, швидше за все, будуть зайвими, хоча найгірші системи рекомендацій не визнають цьогоНаприклад, у 2000-х роках система рекомендацій TiVO створила ранню суперечку в цьому секторі зміна уявної сексуальності користувача, який згодом намагався «ремаскулінізувати» свій профіль, вибираючи фільми про війну – грубий підхід до перегляду алгоритмів.

Що ще гірше, вам не потрібно нічого купувати (наприклад) на Amazon або починати дивитися фільм, опис якого ви переглядаєте, на будь-якій великій потоковій платформі, щоб інформаційний голод алгоритми рекомендацій весело рушають хибним шляхом; пошуку, затримки та кліків на сторінках «деталі» достатньо, і ця мізерна (і, ймовірно, неправильна) інформація, ймовірно, буде зберігатися під час майбутніх сеансів перегляду платформи.

Спроба змусити систему рекомендацій забути

Іноді можливо втрутитися: Netflix пропонує систему «великих пальців вгору/вниз», яка теоретично повинна допомогти її алгоритмам машинного навчання видалити певні вбудовані концепції та слова з вашого профілю рекомендацій (хоча її ефективність... був допитаний, і залишається набагато легше розробити персоналізований алгоритм рекомендації з нуля ніж для видалення небажаних онтологій), тоді як Amazon дозволяє вам видалити заголовки з вашої історії клієнтів, що має знизити будь-які небажані домени, які проникли у ваші рекомендації.

Hulu має a подібна особливість, тоді як у HBO Max частково відступив від систем рекомендацій, що містять лише алгоритм, зважаючи на їхні поточні недоліки.

Жоден із цих суто споживчих вражень навіть не торкається поширеної та зростаючої критики «пасивних» систем рекомендацій рекламних платформ (де настає помітна зміна через громадський гнів), або запальна тема рекомендацій штучного інтелекту в соціальних мережах, де такі сайти, як YouTube, Twitter та Facebook продовжувати терпіти критику за нерелевантні або навіть шкідливі рекомендації.

Здається, машина не знає, чого ми хочемо, хіба що ми самі цього хочемо. сусідній пункт який з’явився під час нашого пошуку – навіть якщо цей товар по суті є дублікатом або альтернативою основного предмета, який ми могли щойно придбати, а не потенційної додаткової чи додаткової покупки.

Точні рекомендації з даними відгуків

Нова дослідницька співпраця з Китаю та Австралії пропонує новий метод для вирішення таких невідповідних рекомендацій, використовуючи відгуки зовнішніх користувачів, щоб краще зрозуміти реальні відносини між товарами під час сеансу покупки. У тестах архітектура перевершила всі поточні найсучасніші методи, даючи надію на системи рекомендацій, які мають кращу внутрішню карту залежностей елементів:

RI-GNN перевершує основних конкурентів з точки зору точності зв’язків між елементами, показуючи найкращі результати в сеансах із більш ніж п’ятьма елементами. Систему перевірено на основі наборів даних про товари для домашніх тварин і фільми та ТБ Дані огляду Amazon (2018). Джерело: https://arxiv.org/pdf/2201.12532.pdf

Крім того, проєкт вирішує значну проблему створення рекомендацій навіть в анонімних сесіях, де система рекомендацій не має доступу до інформації, наданої користувачами, такої як історія покупок або власні онлайн-відгуки користувача про попередні покупки.

Новий папір це називається Переосмислення суміжних залежностей у рекомендаціях на основі сеансу, і походить від дослідників з Технологічного університету Qilu та Пекінського технологічного інституту в Китаї, Університету RMIT у Мельбурні та Австралійського інституту штучного інтелекту при Технологічному університеті Сіднея.

Що далі?

Основне завдання рекомендацій на основі сеансів (SBR) полягає у визначенні «наступного» товару на основі поточного товару на основі його розрахованого зв'язку з поточним товаром. На практиці це може проявлятися як список «Пов'язаних товарів» на сторінці товару для пташиної клітки на веб-сайті електронної комерції.

Якщо ви купуєте пташину клітку, що ще вам, ймовірно, знадобиться? Ну, як мінімум, вам знадобиться птах, щоб посадити його в неї – це... справжня залежність. Проте клітка для птахів фігурує в онтології товари для тварин, де птахи не продаються. Збочено, корм для котів знаходиться в тій самій онтології, хоча додавання миски для годування котів як пов’язаної рекомендації для продукту в клітці для птахів є помилкова залежність – помилкова і хибна асоціація.

З паперу: істинні та хибні зв’язки між декількома елементами, візуалізовані праворуч як діаграма між елементами.

Як це часто буває в архітектурах машинного навчання, переконати систему рекомендацій, що «віддалена» сутність (птах взагалі не міститься в продукти для домашніх тварин) можуть мати внутрішній і важливий зв’язок із предметом, тоді як предмети, які належать до однієї категорії та дуже близькі за функціями та центральною концепцією (наприклад, миска для годування котів), може бути ортогональним або прямо протилежним закупівлі, яка розглядається.

Єдиний спосіб створити ці зіставлення між «несуміжними» сутностями — це краудсорсинг проблеми, оскільки відповідні зв'язки є аспектом людського досвіду, їх неможливо вгадати програмно та, ймовірно, виходять за межі доступних традиційних підходів до маркування наборів даних, таких як Amazon Mechanical Turk.

Тому дослідники застосували механізми обробки природної мови (NLP) для вилучення ключових слів з відгуків про продукт і використовували частоти з цих аналізів для створення вбудовувань, здатних «зіставляти» на перший погляд віддалені елементи.

Архітектура нейронної мережі Inter-item Graph (RI-GNN), уточненої за допомогою огляду.

Архітектура та дані

Як зазначається в новій статті, попередні роботи подібного характеру використовували історію рецензій зареєстрованого користувача для створення елементарних зіставлень. DeepCONN та RNS обидва використовували цей підхід. Однак це не враховує той факт, що користувач міг не написати жодних відгуків або будь-які відгуки, що стосуються певного товару, який «виходить за межі» його звичайних купівельних звичок. Крім того, це щось на зразок підходу «білої скриньки», оскільки він передбачає, що користувач уже достатньо взаємодіяв з торговою точкою, щоб створити обліковий запис і увійти в систему.

Розширена графова нейронна мережа (GNN), запропонована дослідниками, використовує більш орієнтований на оракул підхід, виводячи справжні залежності апріорний, так що, імовірно, анонімний і вийшов з системи користувач може отримати більш релевантні рекомендації з мінімальними введеннями.

Система, доповнена оглядом, називається Удосконалена нейронна мережа Inter-item Graph (РІ-ГНН). Дослідники перевірили його проти двох набори даних від Amazon, зоотоварів та Фільми та телебачення. Хоча це досить акуратно вирішує проблему доступності оглядів, реалізація в дикій природі повинна буде знайти та отримати відповідну базу даних оглядів. Теоретично таким джерелом набору даних може бути що завгодно: від публікацій у соціальних мережах до відповідей у Quora.

Відображення зв’язків високого рівня такого характеру, крім того, були б цінними для низки програм машинного навчання, окрім систем рекомендацій. Багато поточних проектів ускладнюються відсутністю між- та внутрішньодоменного відображення через обмежені кошти та масштаби, тоді як комерційний поштовх дійсно обізнаної та краудсорсингової системи рекомендацій електронної комерції міг би потенційно заповнити цю прогалину.

Метрики та тестування

Автори протестували RI-GNN на двох версіях кожного набору даних, кожна з яких складається з історії покупок користувача та загальних відгуків про продукт. Елементи, що з'являлися менше п'яти разів, були видалені, а історія користувача розділена на одиниці по тижню. Перша версія набору даних включала всі сеанси з більш ніж одним елементом, а друга – всі сеанси з більш ніж п'ятьма елементами.

Проект використовував P@K (точність) і MRR@K (середній взаємний ранг) для оціночних показників. Випробувані конкуруючі архітектури: S-KNN; GRU4Rec; S-POP; STAMP; BERT4Rec; DHCN; GCE-GNN; СР-ГННІ NARM.

Фреймворк тренувався партіями по 100 шт Адам зі швидкістю вивчення 0.001, з кількістю тем, встановлених 24 і 20 відповідно, для зоотоварів та Фільми та телебачення.

Вперше опубліковано 1 лютого 2022 р.