Des leaders d'opinion
Correspondance du titre du produit pour la gestion des SKU avec NLP

Une plongée rapide dans la façon dont vous pouvez automatiser la correspondance des données produit et la gestion des SKU en utilisant uniquement les titres de produits avec NLP.
La correspondance du titre du produit est le processus consistant à faire correspondre des produits similaires ou exacts provenant de différentes sources en se basant strictement sur le titre et d'autres attributs du titre du produit. À mesure que la variance des données et les sources de données augmentent dans une organisation, il peut devenir plus difficile de maintenir l'exactitude des données produit et de gérer les nouvelles références. Des problèmes surviennent lorsque vous utilisez différents fournisseurs et vendeurs et il devient plus difficile de conserver des données produit de haute qualité. Cela peut entraîner des problèmes lors de l'évaluation des données de vente et de la compréhension de vos efforts de marketing et du taux de réussite.
Bien que cela soit souvent effectué manuellement, cela peut prendre beaucoup de temps et s’adapter mal. Les systèmes de la vieille école se concentraient uniquement sur l’utilisation d’attributs de base des produits, tels que les SKU et les codes UPC, qui ne fonctionnent pas bien avec les données modernes non structurées. Ces systèmes plus anciens nécessitent des processus auxiliaires pour extraire les attributs, supprimer les doublons et nettoyer les mots vides des données produit non structurées. Même avec tout le nettoyage des données et l'extraction de mots clés, ces systèmes ont toujours du mal avec des choses comme ceci :
GIGABYTE – Ordinateur portable de jeu 15.6″ FHD IPS 144 Hz – i5-11400H – 16 Go – NVIDIA GeForce RTX 3050 512 Go SSD
Et
Ordinateur portable 15.6″ – i5-11400H – 16 Go – GeForce RTX 3050 512 Go Noir 6494784
Pour comprendre les relations entre les mots tels que « ordinateur portable » et « notebook », ainsi qu'une partie des touches vocales correspondant à GeForce, nous devrons utiliser le traitement du langage naturel.
Ce que la correspondance du titre du produit peut vous apporter
Correspondance des données produit basé sur le titre offre aux détaillants et aux marques de commerce électronique une tonne d'avantages dans le monde des données de vente et de l'intelligence marketing.
- Organiser les produits et les SKU entre plusieurs fournisseurs et fournisseurs
- Utiliser les données des concurrents pour comprendre les tendances du marché et les prix concurrentiels
- Comprendre le cycle de vie du produit
- Assurez-vous qu'il ne manque aucune pièce dans vos données de vente et vos campagnes marketing
L'utilisation d'un système de correspondance basé sur le titre du produit vous permet de vous assurer que vous disposez toujours des informations exactes dont vous avez besoin pour effectuer la correspondance des données. D'autres systèmes qui nécessitent une tonne de points de données ou des descriptions de produits détaillées peuvent avoir des difficultés à mesure que vous évoluez vers plus de produits. Nous avons constaté que l'utilisation d'un système NLP basé sur l'apprentissage en profondeur qui se concentre sur le titre du produit vous permet d'obtenir des résultats similaires sans le risque de mise à l'échelle à long terme. Nous avons pu utiliser la correspondance du titre du produit comme base de référence et créer d'autres modèles autour de celle-ci, tels que la correspondance UPC et la correspondance de la description du produit, pour simplement améliorer les résultats, sans compter sur.
Correspondance du titre du produit avec le traitement du langage naturel
Nous avons construit notre logiciel de correspondance de titres de produits à l'aide de modèles NLP populaires tels que GPT-3, BERT et SBERT pour apprendre la relation entre différentes fonctionnalités de langue de titre, les attributs de titre tels que le nom de la marque, le nom du produit, le type, etc. les modèles sont de loin supérieurs à la correspondance floue et à d'autres approches basées sur des règles et il a été prouvé qu'ils s'adaptent facilement à la nouvelle variance et au bruit des données.
Correspondance entre : Garmin nuvi 2699LMTHD - navigateur GPS - automobile 6.1 pouces Nuvi 2699LMTHD Navigateur GPS portable pour automobile
Ce résultat du logiciel NLP montre quelques éléments importants :
- Les mots vides et les caractères n'affectent pas notre capacité à faire correspondre deux titres de produits
- Le modèle peut contenir les mots du titre qui comptent, peu importe l'ordre ou les mots parasites.
- Les noms de marque ne sont pas nécessaires pour que nous trouvions des correspondances ou refusions une correspondance.
- Les attributs de produit ne sont pas obligatoires (taille, longueur) dans chaque produit que nous comparons et ne doivent pas nécessairement être du même type.
Le modèle de titre de produit prend en compte les différences petites mais importantes entre les tailles de conteneurs qui sont considérées comme des SKU différentes dans la base de données de produits. Dans le deuxième exemple, nous voyons qu'il y a un tas de pièces mobiles - différents nombres de bouteilles et un bruit de données non structuré, mais toujours une correspondance facile.
Cas d'utilisation du raffinage pour la production
Ce logiciel de correspondance de titres de produits peut être optimisé en fonction des données produit réelles d'un magasin de détail ou d'une marque e-commerce afin d'optimiser la précision de vos produits pour un cas d'utilisation spécifique. Ce niveau de personnalisation est rendu possible grâce à l'architecture du modèle de langage utilisé pour la création de ce logiciel, au lieu d'utiliser des fuzzers ou des modèles d'extraction d'entités fantaisistes. La possibilité d'adapter l'architecture aux données d'une entreprise spécifique permet une meilleure évolutivité et facilite l'adaptation aux modifications des données non structurées à mesure que vous ajoutez des produits ou des sources.
Relativité dans l'appariement des produits
Comme vous l'avez peut-être remarqué, l'idée de la correspondance des produits peut être quelque peu relative en fonction du cas d'utilisation que vous essayez de couvrir. Si vous cherchez à différencier les produits en fonction du SKU, vous obtiendrez des résultats différents si vous essayez de comprendre la taille du marché et les produits concurrents.
Par exemple, si vous avez ces deux titres de produits :
Chios Mastiha Pack 60gr (2.11 oz) Petites Larmes de Gomme 100% Gomme de Mastic Naturelle de Producteurs de Mastic Frais
Chios Mastiha Pack 25gr (0.88 oz) Gomme Ă larmes moyennes 100% gomme de mastic naturelle provenant de producteurs de mastic frais
Vous pourriez ne pas les considérer comme une correspondance basée sur l'idée qu'ils ont deux SKU différents dans le même magasin, mais vous pourriez également les considérer comme une correspondance basée sur l'idée qu'ils sont tous les deux Mastic Gum. Si nous incluions maintenant ce titre de produit dans le mix :
Horbaach Mastic Gomme 1500mg 120 Gélules | Sans OGM et sans gluten
Nous devons déterminer au préalable ce que nous recherchons. Il s'agit clairement d'un produit concurrent, avec un code UPC différent, mais il s'agit toujours de gomme mastic. Si nous recherchons uniquement des produits sous la même marque, alors il s'agit d'une correspondance. Il y a beaucoup de choses à prendre en compte lors de la conception de vos systèmes de correspondance de données produits.
Lorsque vous utilisez un outil de correspondance de titre de produit basé sur la PNL, ce niveau de flexibilité devient un jeu d'enfant. Nous ajustons simplement notre architecture pour votre cas d'utilisation, peu importe ce que vous considérez comme une « correspondance », et nous optimisons en conséquence. Ce niveau de flexibilité change la donne lorsque vous cherchez à utiliser la même architecture pour de nombreux cas d'utilisation différents au sein d'une organisation. et toujours atteindre une grande précision.

Notre pipeline basé sur le SKU considère à juste titre qu'il ne s'agit pas d'une correspondance.
Extraction de données produit
Une fois que nous avons déjà fait correspondre les titres des produits et que nous comprenons soit la variance de nos données de ventes internes, soit les données des produits concurrents, nous pouvons utiliser modèles de catégorisation de produits ou des outils d'extraction d'attributs basés sur la PNL pour combler toutes les lacunes de données dont nous disposons, telles que la taille du produit, le nom du fabricant et les attributs du produit automatiquement . Ces pipelines utilisent la même architecture que notre appariement de produits afin qu'ils puissent être facilement intégrés.
Améliorez votre taxonomie de produits

Exemple de génération de catégories de produits et de balises à partir de notre modèle GPT-3.
Avec l'outil de correspondance des titres de produits, vous pouvez améliorer la clarté de votre taxonomie en combinant plusieurs attributs de produits correspondants dans une seule catégorie. Cela nettoie et normalise considérablement les attributs qui composent votre système de taxonomie.
GIGABYTE – Ordinateur portable de jeu 15.6″ FHD IPS 144 Hz – i5-11400H – 16 Go – NVIDIA GeForce RTX 3050 512 Go SSD
Et
Ordinateur portable 15.6″ – i5-11400H – 16 Go – GeForce RTX 3050 512 Go Noir 6494784
Comprendre qu'il s'agit du même produit vous permet de combler toutes les lacunes telles que mettre "Notebook" et "Laptop" dans la même catégorie, "NVIDIA" comme fabricant pour les deux produits, etc. Cela vous permet de trouver des produits mal classés et de combler les lacunes.
La compréhension des données produit est essentielle
Vous pensez que la correspondance des titres de produits peut vous aider à comprendre vos données produit et à nettoyer votre veille commerciale ? Planifions une démo aujourd'hui à Largeur.ai.