Gedachte leiders
Matching van producttitels voor SKU-beheer met NLP

Een snelle duik in hoe u het matchen van productgegevens en SKU-beheer kunt automatiseren met alleen producttitels met NLP.
Het matchen van producttitels is het proces van het matchen van vergelijkbare of exacte producten uit verschillende bronnen, strikt gebaseerd op de titel en andere kopkenmerken van het product. Naarmate gegevensvariantie en gegevensbronnen in een organisatie groeien, kan het moeilijker worden om productgegevens nauwkeurig te houden en nieuwe SKU's te beheren. Er doen zich problemen voor bij het gebruik van verschillende leveranciers en verkopers en het bijhouden van productgegevens van hoge kwaliteit wordt moeilijker. Dit kan problemen veroorzaken bij het evalueren van verkoopgegevens en het begrijpen van uw marketinginspanningen en het succespercentage.
Hoewel dit vaak handmatig wordt gedaan, kan het extreem tijdrovend worden en slecht schaalbaar zijn. Ouderwetse systemen concentreerden zich op het gebruik van basisproductkenmerken zoals SKU's en UPC-codes die niet goed werken met moderne ongestructureerde gegevens. Deze oudere systemen vereisen hulpprocessen om attributen te extraheren, duplicaten te verwijderen en stopwoorden uit de ongestructureerde productgegevens op te schonen. Zelfs met al het opschonen van gegevens en het extraheren van trefwoorden worstelen deze systemen nog steeds met dit soort dingen:
GIGABYTE – 15.6″ FHD IPS 144Hz gaminglaptop – i5-11400H – 16GB – NVIDIA GeForce RTX 3050 512 GB SSD
En
15.6-inch notebook – i5-11400H – 16 GB – GeForce RTX 3050 512 GB zwart 6494784
Om woordrelaties zoals 'laptop' en 'notebook' en woordsoortsleutels die overeenkomen met GeForce te begrijpen, moeten we natuurlijke taalverwerking gebruiken.
Wat het matchen van producttitels voor u kan betekenen
Matching van productgegevens gebaseerd op titel biedt retailers en e-commercemerken tal van voordelen in de wereld van verkoopgegevens en marketinginformatie.
- Organiseer producten en SKU's over meerdere verkopers en leveranciers
- Gebruik gegevens van concurrenten om markttrends en concurrerende prijzen te begrijpen
- Begrijp de levenscyclus van producten
- Zorg ervoor dat er geen ontbrekende onderdelen zijn in uw verkoopgegevens en marketingcampagnes
Door een op producttitels gebaseerd matchingsysteem te gebruiken, kunt u ervoor zorgen dat u altijd over de exacte informatie beschikt die u nodig hebt om gegevens te matchen. Andere systemen die een heleboel datapunten of diepgaande productbeschrijvingen nodig hebben, kunnen het moeilijk krijgen naarmate u naar meer producten schaalt. We hebben ontdekt dat het gebruik van een op deep learning gebaseerd NLP-systeem dat zich richt op de producttitel, u in staat stelt vergelijkbare resultaten te behalen zonder het risico van schaalvergroting op de lange termijn. We hebben het matchen van producttitels als uitgangspunt kunnen gebruiken en er andere modellen omheen kunnen bouwen, zoals UPC-matching en productbeschrijvingsmatching, om eenvoudig de resultaten te verbeteren, niet om erop te vertrouwen.
Matching van producttitels met natuurlijke taalverwerking
We hebben onze software voor het matchen van producttitels gebouwd met behulp van populaire NLP-modellen zoals GPT-3, BERT en SBERT om de relatie te leren tussen verschillende titeltaalkenmerken, titelattributen zoals merknaam, productnaam, type enz. Deze op diep leren gebaseerde modellen zijn veel beter dan fuzzy matching en andere op regels gebaseerde benaderingen en het is bewezen dat ze gemakkelijk kunnen worden geschaald met nieuwe gegevensvariantie en ruis.
Matching tussen: Garmin nuvi 2699LMTHD - GPS-navigator - automotive 6.1 inch nuvi 2699LMTHD Draagbare GPS-navigator voor in de auto
Dit resultaat van de NLP-software laat een paar belangrijke dingen zien:
- Stopwoorden en tekens hebben geen invloed op ons vermogen om twee producttitels te matchen
- Het model kan de woorden in de titel die er toe doen, ongeacht de volgorde of eventuele ruiswoorden zijn.
- Merknamen zijn voor ons niet vereist om overeenkomsten te vinden of een overeenkomst te weigeren.
- Productkenmerken zijn niet vereist (maat, lengte) in elk product dat we vergelijken en hoeven niet van hetzelfde type te zijn.
Het producttitelmodel pikt kleine maar belangrijke verschillen op tussen containerformaten die in de productdatabase als verschillende SKU's worden beschouwd. In het tweede voorbeeld zien we dat er een heleboel bewegende delen zijn – verschillende flesaantallen en ongestructureerde gegevensruis, maar nog steeds een gemakkelijke match.
Verfijning voor productie use case
Deze software voor het matchen van producttitels kan worden verfijnd op basis van de werkelijke productgegevens van een winkel of e-commercemerk, om de nauwkeurigheid te verbeteren ten opzichte van andere producten voor uw specifieke toepassing. Deze mate van maatwerk is mogelijk dankzij de taalmodelarchitectuur die wordt gebruikt om de producttitelmatcher te bouwen, in plaats van gimmicky fuzzermatchers of entiteitsextractiemodellen. De mogelijkheid om de architectuur te verfijnen voor de data van een specifiek bedrijf zorgt voor betere schaalbaarheid en maakt het veel gemakkelijker om aan te passen aan veranderingen in ongestructureerde data naarmate u meer producten of bronnen toevoegt.
Relativiteit bij productafstemming
Zoals je misschien hebt gemerkt, kan het idee van productafstemming enigszins relatief zijn, afhankelijk van de use case die je probeert te dekken. Als u producten wilt differentiëren op basis van SKU, wilt u andere resultaten dan wanneer u de marktomvang en concurrerende producten probeert te begrijpen.
Als u bijvoorbeeld deze twee producttitels heeft:
Chios Mastiha Pack 60gr (2.11 oz) Kleine Tranen Kauwgom 100% Natuurlijke Mastiekgom Van Mastiekkwekers Vers
Chios Mastiha Pack 25gr (0.88oz) Medium Tears Gom 100% Natuurlijke Mastiekgom Van Mastiekkwekers Vers
Je zou ze niet als een match kunnen beschouwen op basis van het idee dat ze twee verschillende SKU's in dezelfde winkel hebben, maar je zou ze ook als een match kunnen beschouwen op basis van het idee dat ze allebei Mastic Gum zijn. Als we nu deze producttitel in de mix zouden opnemen:
Horbaach Mastiekgom 1500mg 120 Capsules | Niet-GMO en glutenvrij
We moeten van tevoren bepalen waar we op matchen. Dit is duidelijk een product van een concurrent met een andere UPC-code, maar het is nog steeds Mastic Gum. Als we gewoon op zoek zijn naar producten onder dezelfde 'paraplu', dan is dit een match. Er is veel om over na te denken bij het ontwerpen van uw systemen voor productdatamatching.
Wanneer u een op NLP gebaseerde tool voor het matchen van producttitels gebruikt, wordt dit niveau van flexibiliteit een fluitje van een cent. We stemmen eenvoudigweg onze architectuur af op uw gebruikssituatie, ongeacht wat u als een "match" beschouwt, en optimaliseren daarnaartoe. Dit niveau van flexibiliteit is een game-wisselaar wanneer u dezelfde architectuur wilt gebruiken voor veel verschillende use-cases binnen een organisatie en toch een hoge nauwkeurigheid bereiken.

Onze op SKU gebaseerde pijplijn beschouwt dit terecht als een 'no match'.
Extractie van productgegevens
Zodra we de producttitels al hebben gematcht en inzicht hebben in de afwijking van onze interne verkoopgegevens of productgegevens van concurrenten, kunnen we deze gebruiken modellen voor productcategorisering of op NLP gebaseerde hulpmiddelen voor het extraheren van attributen om eventuele gegevenslacunes op te vullen die we hebben, zoals productgrootte, naam van de fabrikant en productkenmerken webmaster.. Deze pijplijnen gebruiken dezelfde architectuur als onze productmatching, zodat ze eenvoudig kunnen worden geïntegreerd.
Verbeter uw producttaxonomie

Voorbeeld van het genereren van productcategorieën en tags uit ons GPT-3-model.
Met de tool voor het matchen van producttitels kunt u de duidelijkheid van uw taxonomie verbeteren door meerdere overeenkomende productkenmerken samen te voegen tot één categorie. Dit ruimt de attributen waaruit uw taxonomiesysteem bestaat enorm op en standaardiseert deze.
GIGABYTE – 15.6″ FHD IPS 144Hz gaminglaptop – i5-11400H – 16GB – NVIDIA GeForce RTX 3050 512 GB SSD
En
15.6-inch notebook – i5-11400H – 16 GB – GeForce RTX 3050 512 GB zwart 6494784
Als u begrijpt dat dit allebei hetzelfde product is, kunt u hiaten opvullen, zoals "Notebook" en "Laptop" in dezelfde categorie plaatsen, "NVIDIA" als de fabrikant voor beide producten, enzovoort. Hiermee kunt u verkeerd gecategoriseerde producten vinden en eventuele hiaten opvullen.
Inzicht in productgegevens is essentieel
Denkt u dat het matchen van producttitels u kan helpen uw productgegevens te begrijpen en uw verkoopinformatie op te schonen? Laten we vandaag een demo plannen op Breedte.ai.