Inteligência artificial

Usando avaliações para criar um sistema de recomendação que funcione

Publicado 1 de fevereiro de 2022

Atualização do 9 de dezembro de 2022

Martin Anderson

Se você já comprou um produto on-line e ficou maravilhado com a inanidade e a inaplicabilidade dos "itens relacionados" que assombram o processo de compra e pós-venda, você já entendeu que os produtos populares e convencionais sistemas de recomendação tendem a ficar aquém em termos de compreensão das relações entre as compras em potencial.

Se você comprar um item improvável e pouco frequente, como um forno, as recomendações para outros fornos provavelmente serão supérfluas, embora os piores sistemas de recomendação falha em reconhecer isso. Na década de 2000, por exemplo, o sistema de recomendação do TiVO criou uma controvérsia inicial neste setor ao reatribuindo a sexualidade percebida de um usuário que posteriormente tentou "remasculinizar" seu perfil de usuário selecionando filmes de guerra – uma abordagem grosseira para revisão de algoritmo.

Pior ainda, você não precisa realmente comprar nada na (por exemplo) Amazon, ou realmente começar a assistir a um filme cuja descrição você está navegando em qualquer grande plataforma de streaming, para sedento de informação algoritmos de recomendação para começar alegremente no caminho errado; pesquisas, permanências e cliques nas páginas de "detalhes" são suficientes, e essas informações escassas (e provavelmente incorretas) provavelmente serão perpetuadas em futuras sessões de navegação na plataforma.

Tentando fazer um sistema de recomendação esquecer

Às vezes é possível intervir: a Netflix fornece um sistema de "polegar para cima/baixo" que, em teoria, deve ajudar seus algoritmos de aprendizado de máquina a remover certos conceitos e palavras incorporados do seu perfil de recomendações (embora sua eficácia tenha foi questionado, e continua muito mais fácil desenvolver um algoritmo de recomendação personalizado do zero do que remover ontologias indesejadas), enquanto a Amazon permite que você remover títulos do histórico do cliente, o que deve rebaixar todos os domínios indesejados que se infiltraram em suas recomendações.

Hulu tem um característica semelhante, enquanto o HBO Max tem parcialmente recuado de sistemas de recomendação apenas de algoritmos, em face de suas deficiências atuais.

Nenhuma dessas experiências estritamente ao nível do consumidor sequer aborda a crítica generalizada e crescente aos sistemas de recomendação de plataformas de publicidade 'passivas' (onde mudança notável está chegando devido à ira pública), ou o tópico incendiário das recomendações de IA de mídia social, onde sites como “First in the Fight”., Twitter e Facebook continuam a suportar críticas por recomendações não relevantes ou mesmo prejudiciais.

A máquina parece não saber o que queremos, a menos que queiramos o item adjacente que surgiu em nossa pesquisa - mesmo que esse item seja essencialmente uma duplicata ou alternativa ao item principal que podemos ter acabado de comprar, em vez de uma possível compra complementar ou auxiliar.

Recomendações precisas com dados de revisão

Uma nova colaboração de pesquisa da China e da Austrália oferece um novo método para abordar essas recomendações não apropriadas, usando avaliações de usuários externos para obter uma melhor compreensão das relações reais entre os itens em uma sessão de compras. Nos testes, a arquitetura superou todos os métodos atuais do estado da arte, oferecendo esperança para sistemas de recomendação que tenham um melhor mapa interno das dependências dos itens:

O RI-GNN supera os principais concorrentes em termos de precisão das relações entre os itens, apresentando melhor desempenho em sessões com mais de cinco itens. O sistema foi testado contra os conjuntos de dados Pet Supplies and Movies and TV de Dados de avaliação da Amazon (2018). Fonte: https://arxiv.org/pdf/2201.12532.pdf

Além disso, o projeto aborda o desafio notável de criar recomendações mesmo em sessões anônimas, onde o sistema de recomendação não tem acesso aos detalhes fornecidos pelo usuário, como histórico de compras ou avaliações on-line do próprio usuário sobre compras anteriores.

O novo papel é chamado Repensando a dependência adjacente em recomendações baseadas em sessão, e vem de pesquisadores da Qilu University of Technology e do Beijing Institute of Technology na China, da RMIT University em Melbourne e do Australian Artificial Intelligence Institute da University of Technology Sydney.

O que vem por aí?

A principal tarefa das recomendações baseadas em sessão (RBS) é determinar o "próximo" item a partir do item atual, com base em sua relação calculada com o item atual. Em termos práticos, isso poderia se manifestar como uma lista de "Itens relacionados" na página de um item de uma gaiola de pássaros em um site de comércio eletrônico.

Se você está comprando uma gaiola para pássaros, o que mais você provavelmente vai precisar? Bem, no mínimo, você vai precisar de um pássaro para colocar nela – isso é um verdadeira dependência. No entanto, a gaiola é destaque na ontologia produtos para animais de estimação, onde as aves não são vendidas. Perversamente, comida de gato fica na mesma ontologia, embora anexar uma tigela para alimentação de gatos como uma recomendação associada para um produto de gaiola de pássaro seja um falsa dependência – uma associação equivocada e equivocada.

Do papel: relacionamentos verdadeiros e falsos entre vários itens, visualizados à direita como um gráfico entre itens.

Como acontece frequentemente em arquiteturas de aprendizagem de máquina, é um desafio persuadir um sistema de recomendação de que uma entidade 'distante' (pássaro não apresenta nada em produtos para animais de estimação) podem ter uma relação intrínseca e importante com um item, enquanto itens que estão na mesma categoria, e muito próximos em função e conceito central (como comedouro para gato), pode ser ortogonal ou diretamente oposta à compra considerada.

A única maneira de criar esses mapeamentos entre entidades "não adjacentes" é terceirizar o problema, uma vez que os relacionamentos em questão são uma faceta da experiência humana, não podem ser adivinhados programaticamente e provavelmente estão além do escopo acessível de abordagens convencionais para rotulagem de conjuntos de dados, como Amazon Mechanical Turk.

Portanto, os pesquisadores empregaram mecanismos de Processamento de Linguagem Natural (PLN) para extrair palavras importantes de avaliações de um produto e usaram frequências dessas análises para criar embeddings capazes de "corresponder" itens aparentemente distantes.

A arquitetura para rede neural de gráficos entre itens refinada por revisão (RI-GNN).

Arquitetura e Dados

Como observa o novo artigo, trabalhos anteriores de natureza semelhante exploraram o histórico de revisão do próprio usuário conectado para fornecer mapeamentos rudimentares. DeepCONN e RNS Ambas utilizaram essa abordagem. No entanto, isso desconsidera o fato de que um usuário pode não ter escrito nenhuma avaliação, ou qualquer avaliação pertinente a um item específico que esteja "fora" de seus hábitos de compra habituais. Além disso, essa é uma abordagem de "caixa branca", pois pressupõe que o usuário já tenha se envolvido o suficiente com a loja para criar uma conta e fazer login.

A Graph Neural Network (GNN) estendida proposta pelos pesquisadores adota uma abordagem mais orientada a oráculos, derivando dependências verdadeiras a priori, para que, presumivelmente, o usuário anônimo e desconectado possa experimentar recomendações mais relevantes com entrada mínima necessária.

O sistema de revisão aumentada é intitulado Rede neural de gráfico entre itens refinada e revisada (RI-GNN). Os pesquisadores o testaram contra dois conjuntos de dados da Amazon, Suprimentos para animais de estimação e Filmes e TV. Embora isso resolva o problema de disponibilidade de revisão de forma bastante organizada, uma implementação in-the-wild precisaria localizar e coletar um banco de dados de revisões apropriado. Essa fonte de conjunto de dados poderia, em teoria, ser qualquer coisa, desde postagens em uma rede social até respostas no Quora.

Além disso, mapeamentos de relacionamento de alto nível dessa natureza seriam valiosos para uma variedade de aplicativos de aprendizado de máquina além dos sistemas de recomendação. Muitos projetos atuais são prejudicados pela falta de mapeamento inter e intradomínio devido a fundos e escopo limitados, enquanto o ímpeto comercial de um sistema de recomendação de comércio eletrônico verdadeiramente conhecedor e de crowdsourcing poderia potencialmente preencher essa lacuna.

Métricas e testes

Os autores testaram o RI-GNN em duas versões de cada conjunto de dados, cada uma composta pelo histórico de compras do usuário e avaliações gerais do produto. Itens que apareceram menos de cinco vezes foram removidos e o histórico do usuário foi dividido em unidades de uma semana. A primeira versão do conjunto de dados incluiu todas as sessões com mais de um item, e a segunda, todas as sessões com mais de cinco itens.

O projeto utilizou P@K (Precisão) e MRR@K (Mean Reciprocal Rank) para suas métricas de avaliação. As arquiteturas rivais testadas foram: S-KNN; GRU4Rec; S-POP; CARIMBO; BERT4Rec; DHCN; GCE-GNN; SR-GNN; e NARM.

A estrutura foi treinada em lotes de 100 em Adam a uma taxa de aprendizagem de 0.001, com o número de tópicos definido para 24 e 20, respectivamente, para Suprimentos para animais de estimação e Filmes e TV.

Publicado pela primeira vez em 1º de fevereiro de 2022.

Tópicos relacionados:processamento de linguagem natural PNL recomendação motor de recomendação mecanismo de recomendação pesquisa