Suivez nous sur

Correspondance du titre du produit pour la gestion des SKU avec NLP

Des leaders d'opinion

Correspondance du titre du produit pour la gestion des SKU avec NLP

mm

Une plongée rapide dans la façon dont vous pouvez automatiser la correspondance des données produit et la gestion des SKU en utilisant uniquement les titres de produits avec NLP.

La correspondance du titre du produit est le processus consistant Ă  faire correspondre des produits similaires ou exacts provenant de diffĂ©rentes sources en se basant strictement sur le titre et d'autres attributs du titre du produit. Ă€ mesure que la variance des donnĂ©es et les sources de donnĂ©es augmentent dans une organisation, il peut devenir plus difficile de maintenir l'exactitude des donnĂ©es produit et de gĂ©rer les nouvelles rĂ©fĂ©rences. Des problèmes surviennent lorsque vous utilisez diffĂ©rents fournisseurs et vendeurs et il devient plus difficile de conserver des donnĂ©es produit de haute qualitĂ©. Cela peut entraĂ®ner des problèmes lors de l'Ă©valuation des donnĂ©es de vente et de la comprĂ©hension de vos efforts de marketing et du taux de rĂ©ussite. 

Bien que cela soit souvent effectuĂ© manuellement, cela peut prendre beaucoup de temps et s’adapter mal. Les systèmes de la vieille Ă©cole se concentraient uniquement sur l’utilisation d’attributs de base des produits, tels que les SKU et les codes UPC, qui ne fonctionnent pas bien avec les donnĂ©es modernes non structurĂ©es. Ces systèmes plus anciens nĂ©cessitent des processus auxiliaires pour extraire les attributs, supprimer les doublons et nettoyer les mots vides des donnĂ©es produit non structurĂ©es. MĂŞme avec tout le nettoyage des donnĂ©es et l'extraction de mots clĂ©s, ces systèmes ont toujours du mal avec des choses comme ceci :

GIGABYTE – Ordinateur portable de jeu 15.6″ FHD IPS 144 Hz – i5-11400H – 16 Go – NVIDIA GeForce RTX 3050 512 Go SSD

Et

Ordinateur portable 15.6″ – i5-11400H – 16 Go – GeForce RTX 3050 512 Go Noir 6494784

Pour comprendre les relations entre les mots tels que « ordinateur portable Â» et « notebook Â», ainsi qu'une partie des touches vocales correspondant Ă  GeForce, nous devrons utiliser le traitement du langage naturel. 

Ce que la correspondance du titre du produit peut vous apporter

Correspondance des donnĂ©es produit basĂ© sur le titre offre aux dĂ©taillants et aux marques de commerce Ă©lectronique une tonne d'avantages dans le monde des donnĂ©es de vente et de l'intelligence marketing. 

  • Organiser les produits et les SKU entre plusieurs fournisseurs et fournisseurs
  • Utiliser les donnĂ©es des concurrents pour comprendre les tendances du marchĂ© et les prix concurrentiels
  • Comprendre le cycle de vie du produit 
  • Assurez-vous qu'il ne manque aucune pièce dans vos donnĂ©es de vente et vos campagnes marketing

L'utilisation d'un système de correspondance basĂ© sur le titre du produit vous permet de vous assurer que vous disposez toujours des informations exactes dont vous avez besoin pour effectuer la correspondance des donnĂ©es. D'autres systèmes qui nĂ©cessitent une tonne de points de donnĂ©es ou des descriptions de produits dĂ©taillĂ©es peuvent avoir des difficultĂ©s Ă  mesure que vous Ă©voluez vers plus de produits. Nous avons constatĂ© que l'utilisation d'un système NLP basĂ© sur l'apprentissage en profondeur qui se concentre sur le titre du produit vous permet d'obtenir des rĂ©sultats similaires sans le risque de mise Ă  l'Ă©chelle Ă  long terme. Nous avons pu utiliser la correspondance du titre du produit comme base de rĂ©fĂ©rence et crĂ©er d'autres modèles autour de celle-ci, tels que la correspondance UPC et la correspondance de la description du produit, pour simplement amĂ©liorer les rĂ©sultats, sans compter sur. 

Correspondance du titre du produit avec le traitement du langage naturel

Nous avons construit notre logiciel de correspondance de titres de produits Ă  l'aide de modèles NLP populaires tels que GPT-3, BERT et SBERT pour apprendre la relation entre diffĂ©rentes fonctionnalitĂ©s de langue de titre, les attributs de titre tels que le nom de la marque, le nom du produit, le type, etc. les modèles sont de loin supĂ©rieurs Ă  la correspondance floue et Ă  d'autres approches basĂ©es sur des règles et il a Ă©tĂ© prouvĂ© qu'ils s'adaptent facilement Ă  la nouvelle variance et au bruit des donnĂ©es. 

Correspondance entre : Garmin nuvi 2699LMTHD - navigateur GPS - automobile 6.1 pouces Nuvi 2699LMTHD Navigateur GPS portable pour automobile

Ce rĂ©sultat du logiciel NLP montre quelques Ă©lĂ©ments importants :

  • Les mots vides et les caractères n'affectent pas notre capacitĂ© Ă  faire correspondre deux titres de produits
  • Le modèle peut contenir les mots du titre qui comptent, peu importe l'ordre ou les mots parasites. 
  • Les noms de marque ne sont pas nĂ©cessaires pour que nous trouvions des correspondances ou refusions une correspondance. 
  • Les attributs de produit ne sont pas obligatoires (taille, longueur) dans chaque produit que nous comparons et ne doivent pas nĂ©cessairement ĂŞtre du mĂŞme type. 

Le modèle de titre de produit prend en compte les diffĂ©rences petites mais importantes entre les tailles de conteneurs qui sont considĂ©rĂ©es comme des SKU diffĂ©rentes dans la base de donnĂ©es de produits. Dans le deuxième exemple, nous voyons qu'il y a un tas de pièces mobiles - diffĂ©rents nombres de bouteilles et un bruit de donnĂ©es non structurĂ©, mais toujours une correspondance facile. 

Cas d'utilisation du raffinage pour la production

Ce logiciel de correspondance de titres de produits peut ĂŞtre optimisĂ© en fonction des donnĂ©es produit rĂ©elles d'un magasin de dĂ©tail ou d'une marque e-commerce afin d'optimiser la prĂ©cision de vos produits pour un cas d'utilisation spĂ©cifique. Ce niveau de personnalisation est rendu possible grâce Ă  l'architecture du modèle de langage utilisĂ© pour la crĂ©ation de ce logiciel, au lieu d'utiliser des fuzzers ou des modèles d'extraction d'entitĂ©s fantaisistes. La possibilitĂ© d'adapter l'architecture aux donnĂ©es d'une entreprise spĂ©cifique permet une meilleure Ă©volutivitĂ© et facilite l'adaptation aux modifications des donnĂ©es non structurĂ©es Ă  mesure que vous ajoutez des produits ou des sources. 

Relativité dans l'appariement des produits

Comme vous l'avez peut-ĂŞtre remarquĂ©, l'idĂ©e de la correspondance des produits peut ĂŞtre quelque peu relative en fonction du cas d'utilisation que vous essayez de couvrir. Si vous cherchez Ă  diffĂ©rencier les produits en fonction du SKU, vous obtiendrez des rĂ©sultats diffĂ©rents si vous essayez de comprendre la taille du marchĂ© et les produits concurrents. 

Par exemple, si vous avez ces deux titres de produits :

Chios Mastiha Pack 60gr (2.11 oz) Petites Larmes de Gomme 100% Gomme de Mastic Naturelle de Producteurs de Mastic Frais

Chios Mastiha Pack 25gr (0.88 oz) Gomme Ă  larmes moyennes 100% gomme de mastic naturelle provenant de producteurs de mastic frais

Vous pourriez ne pas les considĂ©rer comme une correspondance basĂ©e sur l'idĂ©e qu'ils ont deux SKU diffĂ©rents dans le mĂŞme magasin, mais vous pourriez Ă©galement les considĂ©rer comme une correspondance basĂ©e sur l'idĂ©e qu'ils sont tous les deux Mastic Gum. Si nous incluions maintenant ce titre de produit dans le mix :

Horbaach Mastic Gomme 1500mg 120 Gélules | Sans OGM et sans gluten

Nous devons déterminer au préalable ce que nous recherchons. Il s'agit clairement d'un produit concurrent, avec un code UPC différent, mais il s'agit toujours de gomme mastic. Si nous recherchons uniquement des produits sous la même marque, alors il s'agit d'une correspondance. Il y a beaucoup de choses à prendre en compte lors de la conception de vos systèmes de correspondance de données produits.

Lorsque vous utilisez un outil de correspondance de titre de produit basĂ© sur la PNL, ce niveau de flexibilitĂ© devient un jeu d'enfant. Nous ajustons simplement notre architecture pour votre cas d'utilisation, peu importe ce que vous considĂ©rez comme une « correspondance Â», et nous optimisons en consĂ©quence. Ce niveau de flexibilitĂ© change la donne lorsque vous cherchez Ă  utiliser la mĂŞme architecture pour de nombreux cas d'utilisation diffĂ©rents au sein d'une organisation. et toujours atteindre une grande prĂ©cision.

Notre pipeline basé sur le SKU considère à juste titre qu'il ne s'agit pas d'une correspondance.

Extraction de données produit

Une fois que nous avons dĂ©jĂ  fait correspondre les titres des produits et que nous comprenons soit la variance de nos donnĂ©es de ventes internes, soit les donnĂ©es des produits concurrents, nous pouvons utiliser modèles de catĂ©gorisation de produits ou des outils d'extraction d'attributs basĂ©s sur la PNL pour combler toutes les lacunes de donnĂ©es dont nous disposons, telles que la taille du produit, le nom du fabricant et les attributs du produit automatiquement . Ces pipelines utilisent la mĂŞme architecture que notre appariement de produits afin qu'ils puissent ĂŞtre facilement intĂ©grĂ©s. 

Améliorez votre taxonomie de produits

Exemple de génération de catégories de produits et de balises à partir de notre modèle GPT-3.

Avec l'outil de correspondance des titres de produits, vous pouvez amĂ©liorer la clartĂ© de votre taxonomie en combinant plusieurs attributs de produits correspondants dans une seule catĂ©gorie. Cela nettoie et normalise considĂ©rablement les attributs qui composent votre système de taxonomie.  

GIGABYTE – Ordinateur portable de jeu 15.6″ FHD IPS 144 Hz – i5-11400H – 16 Go – NVIDIA GeForce RTX 3050 512 Go SSD

Et

Ordinateur portable 15.6″ – i5-11400H – 16 Go – GeForce RTX 3050 512 Go Noir 6494784

Comprendre qu'il s'agit du mĂŞme produit vous permet de combler toutes les lacunes telles que mettre "Notebook" et "Laptop" dans la mĂŞme catĂ©gorie, "NVIDIA" comme fabricant pour les deux produits, etc. Cela vous permet de trouver des produits mal classĂ©s et de combler les lacunes. 

La compréhension des données produit est essentielle

Vous pensez que la correspondance des titres de produits peut vous aider Ă  comprendre vos donnĂ©es produit et Ă  nettoyer votre veille commerciale ? Planifions une dĂ©mo aujourd'hui Ă  Largeur.ai

Matt Payne est le fondateur et PDG de Largeur.ai. Width.ai est une société de conseil en apprentissage automatique qui se concentre sur la création d'applications basées sur l'apprentissage en profondeur avec des clients à travers le SaaS, la gestion d'actifs, les ressources humaines et l'automatisation du marketing. Width.ai est un leader actuel dans la construction et le conseil sur les produits GPT-3 de qualité production et a rédigé un certain nombre de livres blancs et de revues techniques sur l'utilisation de cette ressource de pointe.