Connect with us

Produkt-Titel-Matching für SKU-Verwaltung mit NLP

Vordenker

Produkt-Titel-Matching für SKU-Verwaltung mit NLP

mm

Eine schnelle Einführung in die Automatisierung der Produkt-Daten-Matching und SKU-Verwaltung mithilfe von Produkt-Titeln und NLP.

Das Produkt-Titel-Matching ist der Prozess, bei dem ähnliche oder identische Produkte aus verschiedenen Quellen anhand des Titels und anderer Überschriftenattribute des Produkts abgeglichen werden. Wenn die Datenvarianz und die Datenquellen in einem Unternehmen wachsen, kann es schwieriger werden, die Produkt-Daten genau zu halten und neue SKUs zu verwalten. Probleme entstehen, wenn verschiedene Lieferanten und Händler verwendet werden und es schwieriger wird, hochwertige Produkt-Daten zu erhalten. Dies kann zu Problemen bei der Auswertung von Verkaufsdaten und der Bewertung von Marketing-Efforts und Erfolgsraten führen.

Während dies oft manuell durchgeführt wird, kann es sehr zeitaufwendig werden und skaliert schlecht. Alte Systeme, die sich auf die Verwendung von grundlegenden Produkt-Attributen wie SKUs und UPC-Codes konzentrieren, die nicht gut mit modernen unstrukturierten Daten funktionieren, erfordern zusätzliche Prozesse, um Attribute zu extrahieren, Duplikate zu entfernen und Stoppwörter aus den unstrukturierten Produkt-Daten zu entfernen. Selbst mit all den Daten-Reinigungs- und Schlüsselwort-Extraktions-Verfahren kämpfen diese Systeme noch mit Dingen wie diesem:

GIGABYTE – 15,6″ FHD IPS 144Hz Gaming Laptop – i5-11400H – 16GB – NVIDIA GeForce RTX 3050 512 GB SSD

Und

15,6″ Notebook – i5-11400H – 16GB – GeForce RTX 3050 512 GB Schwarz 6494784

Um Wort-Beziehungen wie “Laptop” und “Notebook” und Teile von Schlüsselwörtern zu verstehen, um GeForce abzugleichen, müssen wir die natürliche Sprach-Verarbeitung (NLP) verwenden.

Was Produkt-Titel-Matching für Sie bieten kann

Produkt-Daten-Matching basierend auf dem Titel bietet Händlern und E-Commerce-Marken eine Vielzahl von Vorteilen in der Welt der Verkaufs-Daten und Marketing-Intelligenz.

  • Organisieren Sie Produkte und SKUs über mehrere Lieferanten und Händler hinweg
  • Verwenden Sie Wettbewerbs-Daten, um Markttrends und Wettbewerbs-Preise zu verstehen
  • Verstehen Sie den Produkt-Lebens-Zyklus
  • Stellen Sie sicher, dass es keine fehlenden Teile in Ihren Verkaufs-Daten und Marketing-Kampagnen gibt

Die Verwendung eines Produkt-Titel-basierten Abgleich-Systems ermöglicht es Ihnen, sicherzustellen, dass Sie immer die genauen Informationen haben, die Sie benötigen, um Daten-Abgleich durchzuführen. Andere Systeme, die eine Vielzahl von Daten-Punkten oder detaillierte Produkt-Beschreibungen erfordern, können kämpfen, wenn Sie auf mehr Produkte skaliert werden. Wir haben festgestellt, dass die Verwendung eines tiefen Lern-basierten NLP-Systems, das sich auf Produkt-Titel konzentriert, es ermöglicht, ähnliche Ergebnisse ohne das langfristige Skalierungs-Risiko zu erzielen. Wir haben es geschafft, Produkt-Titel-Abgleich als Basis zu verwenden und andere Modelle wie UPC-Abgleich und Produkt-Beschreibungs-Abgleich zu erstellen, um die Ergebnisse zu verbessern, anstatt sich darauf zu verlassen.

Produkt-Titel-Matching mit natürlicher Sprach-Verarbeitung

Wir haben unsere Produkt-Titel-Abgleich-Software mit populären NLP-Modellen wie GPT-3, BERT und SBERT entwickelt, um die Beziehung zwischen verschiedenen Titel-Sprach-Features, Titel-Attributen wie Marken-Name, Produkt-Name, Typ usw. zu erlernen. Diese tiefen Lern-basierten Modelle sind weit überlegen gegenüber fuzzy-Matching und anderen regel-basierten Ansätzen und sind bewiesen, leicht mit neuen Daten-Varianz und Rauschen zu skalierten.

Abgleich zwischen: Garmin nuvi 2699LMTHD — GPS-Navigator — Automotive 6.1 in nuvi 2699LMTHD Automobile Portable GPS-Navigator

Dieses Ergebnis aus der NLP-Software zeigt einige wichtige Dinge:

  • Stoppwörter und Zeichen beeinflussen nicht unsere Fähigkeit, zwei Produkt-Titel abzugleichen
  • Das Modell kann die Wörter im Titel erkennen, die wichtig sind, unabhängig von der Reihenfolge oder Rausch-Wörtern.
  • Marken-Namen sind nicht erforderlich, um Abgleich zu finden oder abzulehnen.
  • Produkt-Attribute sind nicht erforderlich (Größe, Länge) in jedem Produkt, das wir vergleichen, und müssen nicht dieselbe Art sein.

Das Produkt-Titel-Modell erkennt kleine, aber wichtige Unterschiede zwischen Behälter-Größen, die als verschiedene SKUs im Produkt-Datenbank betrachtet werden. Im zweiten Beispiel sehen wir, dass es viele bewegliche Teile gibt – verschiedene Flaschen-Zahlen und unstrukturierte Daten-Rauschen, aber immer noch einen einfachen Abgleich.

Verfeinern für Produktions-Use-Case

Dieses Produkt-Titel-Abgleich-Software-Produkt kann auf die tatsächlichen Produkt-Daten eines Einzelhändlers oder einer E-Commerce-Marke fein abgestimmt werden, um die Genauigkeit über andere Produkte für Ihren spezifischen Use-Case zu steigern. Diese Ebene der Anpassung ist aufgrund der Sprach-Modell-Architektur möglich, die zum Bau des Produkt-Titel-Abgleichs verwendet wurde, anstatt gimmick-hafter Fuzzer-Abgleich oder Entity-Extraktions-Modelle zu verwenden. Die Fähigkeit, die Architektur für ein bestimmtes Unternehmens-Daten anpassen zu können, ermöglicht eine bessere Skalierbarkeit sowie eine einfachere Anpassung an Änderungen in unstrukturierten Daten, wenn Sie mehr Produkte oder Quellen hinzufügen.

Relativität im Produkt-Abgleich

Wie Sie vielleicht bemerkt haben, kann die Idee des Produkt-Abgleichs relativ sein, abhängig von dem Use-Case, den Sie abdecken möchten. Wenn Sie Produkte basierend auf SKU unterscheiden möchten, werden Sie andere Ergebnisse benötigen als wenn Sie den Markt-Größe und Wettbewerbs-Produkte verstehen möchten.

Zum Beispiel, wenn Sie diese beiden Produkt-Titel haben:

Chios Mastiha Pack 60gr (2,11 oz) Small Tears Gum 100% Natural Mastic Gum From Mastic Growers Fresh

Chios Mastiha Pack 25gr (0,88oz) Medium Tears Gum 100% Natural Mastic Gum From Mastic Growers Fresh

Sie könnten sie als nicht abgleichbar betrachten, basierend auf der Idee, dass sie zwei verschiedene SKUs in demselben Laden haben, aber auch als abgleichbar betrachten, basierend auf der Idee, dass sie beide Mastic-Gum sind. Wenn wir nun diesen Produkt-Titel in die Mischung aufnehmen:

Horbaach Mastic Gum 1500mg 120 Capsules | Non-GMO & Gluten Free

Wir müssen vorher entscheiden, was wir abgleichen. Dies ist offensichtlich ein Wettbewerbs-Produkt und hat einen anderen UPC-Code, aber es ist immer noch Mastic-Gum und wenn wir nur nach Produkten unter demselben “Schirm” suchen, dann ist dies ein Abgleich. Viel zu beachten, wenn Sie Ihr Produkt-Daten-Abgleich-System entwerfen.

Wenn Sie ein NLP-basiertes Produkt-Titel-Abgleich-Tool verwenden, wird diese Ebene der Flexibilität zu einem Kinderspiel. Wir stimmen einfach unsere Architektur auf Ihren Use-Case ab, unabhängig davon, was Sie als “Abgleich” betrachten, und optimieren es daraufhin. Diese Ebene der Flexibilität ist ein Spiel-Changer, wenn Sie nach einer Architektur suchen, die für viele verschiedene Use-Cases innerhalb eines Unternehmens verwendet werden kann und immer noch eine hohe Genauigkeit erreicht. und immer noch eine hohe Genauigkeit erreicht.

Unsere SKU-basierte Pipeline betrachtet dies korrekt als kein Abgleich.

Produkt-Daten-Extraktion

Sobald wir bereits Produkt-Titel abgeglichen haben und eine Vorstellung von unserer internen Verkaufs-Daten-Varianz oder Wettbewerbs-Produkt-Daten haben, können wir Produkt-Kategorisierungs-Modelle oder NLP-basierte Attribut-Extraktions-Tools verwenden, um Lücken in unseren Daten wie Produkt-Größe, Hersteller-Name und Produkt-Attribute automatisch zu füllen. Diese Pipelines verwenden die gleiche Architektur wie unser Produkt-Abgleich, sodass sie leicht integriert werden können.

Verbessern Sie Ihre Produkt-Taxonomie

Beispiel für die Generierung von Produkt-Kategorien und -Tags aus unserem GPT-3-Modell.

Mit dem Produkt-Titel-Abgleich-Tool können Sie die Klarheit Ihrer Taxonomie verbessern, indem Sie mehrere abgleichende Produkt-Attribute zusammen in eine einzige Kategorie kombinieren. Dies reinigt und standardisiert die Attribute, die Ihre Taxonomie-System ausmachen.

GIGABYTE – 15,6″ FHD IPS 144Hz Gaming Laptop – i5-11400H – 16GB – NVIDIA GeForce RTX 3050 512 GB SSD

Und

15,6″ Notebook – i5-11400H – 16GB – GeForce RTX 3050 512 GB Schwarz 6494784

Das Verstehen, dass dies beide das gleiche Produkt sind, ermöglicht es Ihnen, Lücken wie “Notebook” und “Laptop” in der gleichen Kategorie, “NVIDIA” als Hersteller für beide Produkte und so weiter zu füllen. Dies ermöglicht es Ihnen, fehlkategorisierte Produkte zu finden und Lücken zu füllen.

Produkt-Daten-Verständnis ist der Schlüssel

Denken Sie, dass Produkt-Titel-Abgleich Ihnen helfen kann, Ihre Produkt-Daten zu verstehen und Ihre Verkaufs-Intelligenz zu reinigen? Lassen Sie uns heute eine Demo bei Width.ai planen.

Matt Payne ist der Gründer und CEO von Width.ai. Width.ai ist ein Beratungsunternehmen für maschinelles Lernen, das sich auf die Entwicklung von Deep-Learning-Anwendungen mit Kunden aus den Bereichen SaaS, Asset-Management, Personalwesen und Marketing-Automatisierung konzentriert. Width.ai ist derzeit Marktführer bei der Entwicklung und Beratung von Produktionsgrad-GPT-3-Produkten und hat eine Reihe von Whitepapers und technischen Bewertungen über die Verwendung dieser hochmodernen Ressourcen verfasst.