Inteligência artificial

Utilizando Avaliações para Criar um Sistema de Recomendação que Funciona

Published February 1, 2022

Updated April 28, 2026

Martin Anderson

Se você já comprou um produto online e se maravilhou com a inutilidade e não aplicabilidade dos ‘itens relacionados’ que assombram o processo de compra e pós-venda, você já entende que os sistemas de recomendação populares e mainstream tendem a falhar em termos de compreender as relações entre compras prospectivas.

Se você comprar um item improvável e infrequente, como um forno, as recomendações para outros fornos são prováveis de serem supérfluas, embora os piores sistemas de recomendação não reconheçam isso. Na década de 2000, por exemplo, o sistema de recomendação da TiVO criou uma controvérsia precoce nesse setor ao reatribuir a sexualidade percebida de um usuário, que subsequentemente buscou ‘remasculinizar’ seu perfil de usuário selecionando filmes de guerra – uma abordagem crua para a revisão de algoritmos.

Pior ainda, você não precisa comprar nada em (por exemplo) Amazon, ou começar a assistir a um filme cuja descrição você está navegando em qualquer plataforma de streaming importante, para que algoritmos de recomendação famintos de informações comecem alegremente pelo caminho errado; buscas, permanências e cliques nas páginas de ‘detalhes’ são suficientes, e essas informações escassas (e provavelmente incorretas) provavelmente serão perpetuadas em futuras sessões de navegação na plataforma.

Tentando Fazer um Sistema de Recomendação Esquecer

Às vezes é possível intervir: a Netflix fornece um sistema de ‘polegar para cima/para baixo’ que, em teoria, deve ajudar seus algoritmos de aprendizado de máquina a remover certos conceitos e palavras incorporados de seu perfil de recomendações (embora sua eficácia tenha sido questionada, e permanece muito mais fácil evoluir um algoritmo de recomendação personalizado do zero do que remover ontologias indesejadas), enquanto a Amazon permite que você remova títulos de sua história de cliente, o que deve rebaixar qualquer domínio indesejado que tenha infiltrado suas recomendações.

A Hulu tem um recursos semelhante, enquanto a HBO Max retrocedeu parcialmente dos sistemas de recomendação apenas de algoritmo, diante de suas limitações atuais.

Nenhuma dessas experiências estritamente de nível de consumidor toca na crítica generalizada e crescente dos sistemas de recomendação de plataformas de publicidade ‘passivas’ (onde notável mudança está vindo devido à ira pública), ou no tópico incendiário das recomendações de IA de mídia social, onde sites como YouTube, Twitter e Facebook continuam a sofrer críticas por recomendações não relevantes ou até danosas.

A máquina não parece saber o que queremos, a menos que queiramos o item adjacente que surgiu em nossa busca – mesmo que esse item seja essencialmente uma duplicata ou alternativa ao item principal que acabamos de comprar, em vez de uma compra complementar ou auxiliar potencial.

Recomendações Precisas com Dados de Avaliação

Uma nova colaboração de pesquisa da China e da Austrália oferece um método novo para lidar com essas recomendações não apropriadas, usando avaliações de usuários externas para obter uma compreensão melhor das relações reais entre itens em uma sessão de compras. Em testes, a arquitetura superou todos os métodos atuais de ponta, oferecendo esperança para sistemas de recomendação que tenham um mapa interno melhor das dependências dos itens:

RI-GNN supera os principais concorrentes em termos de precisão das relações entre itens, apresentando o melhor desempenho em sessões com mais de cinco itens. O sistema foi testado contra os conjuntos de dados de Suprimentos para Pets e Filmes e TV da Amazon Review Data (2018). Source: https://arxiv.org/pdf/2201.12532.pdf

Além disso, o projeto aborda o desafio notável de criar recomendações mesmo em sessões anônimas, onde o sistema de recomendação não tem acesso a detalhes contribuídos pelo usuário, como histórico de compras ou as próprias avaliações do usuário de compras anteriores.

O novo artigo é chamado de Rethinking Adjacent Dependency in Session-based Recommendations, e vem de pesquisadores da Qilu University of Technology e do Beijing Institute of Technology na China, da RMIT University em Melbourne e do Australian Artificial Intelligence Institute da University of Technology Sydney.

O Que Vem a Seguir?

A tarefa central das recomendações baseadas em sessão (SBR) é determinar o ‘próximo’ item a partir do item atual, com base em sua relação calculada com o item atual. Em termos práticos, isso pode se manifestar como uma lista de ‘Itens relacionados’ em uma página de item para uma gaiola de pássaro em um site de comércio eletrônico.

Se você estiver comprando uma gaiola de pássaro, o que mais você provavelmente precisará? Bem, no mínimo, você precisará de um pássaro para colocar nela – essa é uma dependência verdadeira. No entanto, a gaiola de pássaro é apresentada na ontologia produtos para pets, onde os pássaros não são vendidos. Perversamente, alimento para gatos está na mesma ontologia, embora anexar uma tigela de alimentação para gatos como uma recomendação associada para um produto de gaiola de pássaro seja uma dependência falsa – uma associação enganosa e mal orientada.

Do artigo: relações verdadeiras e falsas entre vários itens, visualizadas à direita como um gráfico de itens.

Como é tão frequentemente o caso em arquiteturas de aprendizado de máquina, é um desafio persuadir um sistema de recomendação de que uma entidade ‘distante’ (pássaro não é apresentado em produtos para pets) pode ter uma relação intrínseca e importante com um item, enquanto itens que estão na mesma categoria e muito próximos em função e conceito central (como tigela de alimentação para gatos) podem ser ortogonais ou diretamente opostos à compra sendo considerada.

A única maneira de criar esses mapeamentos entre entidades ‘não adjacentes’ é crowdsourcer o problema, pois as relações em questão são um aspecto da experiência humana, não podem ser adivinhadas programaticamente e provavelmente estão além do escopo financeiro de abordagens convencionais de rotulagem de conjuntos de dados, como Amazon Mechanical Turk.

Portanto, os pesquisadores empregaram mecanismos de Processamento de Linguagem Natural (NLP) para extrair palavras salientes de avaliações de um produto e usaram frequências dessas análises para criar embeddings capazes de ‘combinar’ itens aparentemente distantes.

A arquitetura para Review-refined Inter-item Graph Neural Network (RI-GNN).

Arquitetura e Dados

Como o novo artigo observa, trabalhos anteriores de natureza semelhante exploraram o histórico de avaliações de um usuário conectado para fornecer mapeamentos rudimentares. DeepCONN e RNS usaram essa abordagem. No entanto, isso desconsidera o fato de que um usuário pode não ter escrito nenhuma avaliação ou nenhuma avaliação pertinente a um item particular que esteja ‘fora do alcance’ de seus hábitos de compra habituais. Além disso, essa é uma abordagem de ‘caixa branca’, pois supõe que o usuário já se engajou suficientemente com a loja para criar uma conta e fazer login.

A rede neural gráfica estendida (GNN) proposta pelos pesquisadores adota uma abordagem mais oracle-driven, derivando dependências verdadeiras a priori, para que, presumivelmente, o usuário anônimo e desconectado possa experimentar recomendações mais relevantes com entrada mínima necessária.

O sistema de recomendação aprimorado por avaliações é intitulado Review-refined Inter-item Graph Neural Network (RI-GNN). Os pesquisadores testaram-no contra dois conjuntos de dados da Amazon, Suprimentos para Pets e Filmes e TV. Embora isso resolva o problema da disponibilidade de avaliações de forma bastante elegante, uma implementação in-the-wild precisaria localizar e raspar um banco de dados de avaliações apropriado. Tal fonte de conjunto de dados poderia, em teoria, ser qualquer coisa, desde postagens em uma rede social até respostas no Quora.

Mapeamentos de relacionamentos de alto nível dessa natureza também seriam valiosos para uma variedade de aplicações de aprendizado de máquina além dos sistemas de recomendação. Muitos projetos atuais são limitados pela falta de mapeamento inter e intra-domínio devido a fundos e escopo limitados, enquanto o impulso comercial de um sistema de recomendação de comércio eletrônico realmente conhecedor e crowdsourcado poderia potencialmente preencher essa lacuna.

Métricas e Testes

Os autores testaram o RI-GNN contra duas versões de cada conjunto de dados, cada um dos quais é composto por um histórico de compras do usuário e avaliações gerais do produto. Itens que aparecem menos de cinco vezes foram removidos, e o histórico do usuário foi dividido em unidades de uma semana. A primeira versão do conjunto de dados apresentou todas as sessões com mais de um item, e a segunda apresentou todas as sessões com mais de cinco itens.

O projeto usou P@K (Precisão) e MRR@K (Rank Médio Recíproco) para suas métricas de avaliação. As arquiteturas rivais testadas foram: S-KNN; GRU4Rec; S-POP; STAMP; BERT4Rec; DHCN; GCE-GNN; SR-GNN; e NARM.

A estrutura foi treinada em lotes de 100 no Adam com uma taxa de aprendizado de 0,001, com o número de tópicos definido para 24 e 20, respectivamente, para Suprimentos para Pets e Filmes e TV.

Publicado pela primeira vez em 1º de fevereiro de 2022.