Kontakt med oss

Tankeledere

Produkttittel Matching For SKU Management Med NLP

mm

Et raskt dykk inn i hvordan du kan automatisere produktdatamatching og SKU-administrasjon kun ved å bruke produkttitler med NLP.

Matching av produkttittel er prosessen med å matche lignende eller eksakte produkter fra forskjellige kilder, utelukkende basert på tittelen og andre overskriftsattributter til produktet. Etter hvert som dataavvik og datakilder vokser i en organisasjon, kan det bli vanskeligere å holde produktdata nøyaktige og administrere nye SKU-er. Problemer dukker opp når du bruker forskjellige leverandører og leverandører, og det blir vanskeligere å holde produktdata av høy kvalitet. Dette kan forårsake problemer når du evaluerer salgsdata og forstår markedsføringsinnsatsen din og suksessraten. 

Selv om dette ofte gjøres manuelt, kan det bli ekstremt tidkrevende og skaleres dårlig. Gamle skolesystemer fokuserte bare på å bruke grunnleggende produktattributter som SKU-er og UPC-koder som ikke fungerer godt med moderne ustrukturerte data. Disse eldre systemene krever hjelpeprosesser for å trekke ut attributter, fjerne duplikater og rense stoppord fra de ustrukturerte produktdataene. Selv med all datarensingen og søkeordutvinningen sliter disse systemene fortsatt med ting som dette:

GIGABYTE – 15.6″ FHD IPS 144Hz bærbar PC – i5-11400H – 16 GB – NVIDIA GeForce RTX 3050 512 GB SSD

Og

15.6" bærbar PC – i5-11400H – 16 GB – GeForce RTX 3050 512 GB svart 6494784

For å forstå ordrelasjoner som «bærbar PC» og «notisbok», og en del av taletastene for å matche GeForce, må vi bruke naturlig språkbehandling. 

Hva produkttittelmatching kan gi deg

Matching av produktdata basert på tittel gir forhandlere og e-handelsmerker massevis av fordeler i en verden av salgsdata og markedsføringsintelligens. 

  • Organiser produkter og SKU-er på tvers av flere leverandører og leverandører
  • Bruk konkurrentdata for å forstå markedstrender og konkurransedyktige priser
  • Forstå produktets livssyklus 
  • Sørg for at det ikke mangler deler i salgsdataene og markedsføringskampanjene dine

Ved å bruke et produkttittelbasert matchingssystem kan du sikre at du alltid har den nøyaktige informasjonen du trenger for å utføre datamatching. Andre systemer som krever massevis av datapunkter eller dyptgående produktbeskrivelser kan slite når du skalerer til flere produkter. Vi har funnet ut at bruk av et dyplæringsbasert NLP-system som fokuserer på produkttittel lar deg få lignende resultater uten langsiktig skaleringsrisiko. Vi har vært i stand til å bruke produkttittelmatching som en grunnlinje og bygge andre modeller rundt det, for eksempel UPC-matching og produktbeskrivelsesmatching for ganske enkelt å forbedre resultatene, ikke stole på. 

Produkttittel samsvarer med naturlig språkbehandling

Vi har bygget programvaren vår for samsvarende produkttittel ved å bruke populære NLP-modeller som GPT-3, BERT og SBERT for å lære forholdet mellom ulike tittelspråkfunksjoner, tittelattributter som merkenavn, produktnavn, type osv. Disse dyplæringsbaserte Modeller er langt overlegne over fuzzy matching og andre regelbaserte tilnærminger og har bevist at de lett kan skaleres med nye datavarianser og støy. 

Matching mellom: Garmin nuvi 2699LMTHD – GPS-navigator – 6.1 tommers bil nuvi 2699LMTHD Bærbar GPS-navigator for bil

Dette resultatet fra NLP-programvaren viser noen viktige ting:

  • Stoppord og tegn påvirker ikke vår evne til å matche to produkttitler
  • Modellen kan ordene i tittelen som betyr noe uansett rekkefølge eller eventuelle støyord er dem. 
  • Merkenavn kreves ikke for at vi skal finne treff eller avslå treff. 
  • Produktattributter er ikke obligatoriske (størrelse, lengde) i hvert produkt vi sammenligner og trenger ikke å være av samme type. 

Produkttittelmodellen fanger opp små, men viktige forskjeller mellom beholderstørrelser som regnes som forskjellige SKU-er i produktdatabasen. I det andre eksemplet ser vi at det er en haug med bevegelige deler – forskjellige flasketall og ustrukturert datastøy, men fortsatt en enkel match. 

Raffinering for produksjonsbruk

Denne programvaren for produkttittelmatching kan finjusteres på en butikks eller et netthandelsmerkes faktiske produktdata for å forbedre nøyaktigheten utover andre produkter for ditt spesifikke brukstilfelle. Dette tilpasningsnivået er tilgjengelig på grunn av språkmodellarkitekturen som brukes til å bygge produkttittelmatcheren, i stedet for å bruke gimmicky fuzzer-matchere eller enhetsutvinningsmodeller. Muligheten til å finjustere arkitekturen for et bestemt selskaps data gir bedre skalerbarhet, og det blir mye enklere å tilpasse seg endringer i ustrukturerte data etter hvert som du legger til flere produkter eller kilder. 

Relativitet i produktmatching

Som du kanskje har lagt merke til, kan ideen om produktmatching være noe relativ basert på hvilken brukssituasjon du prøver å dekke. Hvis du ønsker å differensiere produkter basert på SKU, vil du ha andre resultater enn hvis du prøver å forstå markedsstørrelse og konkurrentprodukter. 

For eksempel hvis du har disse to produkttitlene:

Chios Mastiha Pack 60gr (2.11 oz) Small Tears Gum 100% Natural Mastic Gum Fra Mastic Producers Fresh

Chios Mastiha Pack 25gr (0.88oz) Medium Tears Gum 100% Natural Mastic Gum Fra Mastic Producers Fresh

Du kan vurdere dem som ikke en match basert på ideen om at de har to forskjellige SKU-er i samme butikk, men du kan også vurdere dem som en match basert på ideen om at de begge er Mastic Gum. Hvis vi nå inkluderer denne produkttittelen i blandingen:

Horbaach Mastic Gum 1500mg 120 kapsler | Ikke-GMO og glutenfri

Vi må bestemme på forhånd hva vi matcher for. Dette er helt klart et konkurrentprodukt og har en annen UPC-kode, men det er fortsatt Mastic Gum, og hvis vi bare ser etter produkter under samme «paraply», så er dette en match. Det er mye å tenke på når du designer matchingsystemer for produktdata.

Når du bruker et NLP-basert verktøy for matching av produkttittel, blir dette fleksibilitetsnivået en lek. Vi finjusterer ganske enkelt arkitekturen vår for ditt bruksområde uansett hva du anser som en "match" og optimaliserer mot det. Dette fleksibilitetsnivået endrer spillet når man ønsker å bruke den samme arkitekturen for mange forskjellige brukstilfeller i en organisasjon og fortsatt oppnå høy nøyaktighet.

Vår SKU-baserte pipeline anser korrekt at dette ikke samsvarer.

Utvinning av produktdata

Når vi allerede har matchet produkttitler og har en forståelse av enten vår interne salgsdataavvik eller konkurrentproduktdata kan vi bruke produktkategoriseringsmodeller eller NLP-baserte attributtekstraksjonsverktøy for å fylle ut eventuelle datahull vi har, for eksempel produktstørrelse, produsentnavn og produktattributter automatisk. Disse rørledningene bruker samme arkitektur som vår produktmatching, slik at de enkelt kan integreres. 

Forbedre produkttaksonomien

Eksempel på generering av produktkategorier og tagger fra vår GPT-3-modell.

Med samsvarsverktøyet for produkttittel kan du forbedre klarheten i taksonomien din ved å kombinere flere samsvarende produktattributter sammen til en enkelt kategori. Dette rydder i stor grad opp og standardiserer attributtene som utgjør taksonomisystemet ditt.  

GIGABYTE – 15.6″ FHD IPS 144Hz bærbar PC – i5-11400H – 16 GB – NVIDIA GeForce RTX 3050 512 GB SSD

Og

15.6-tommers bærbar PC – i5-11400H – 16 GB – GeForce RTX 3050 512 GB svart 6494784

Når du forstår at disse begge er det samme produktet, kan du fylle ut eventuelle hull, for eksempel å sette "Notebook" og "Bærbar" i samme kategori, "NVIDIA" som produsenten for begge produktene og så videre. Dette lar deg finne feilkategoriserte produkter og fylle ut eventuelle hull. 

Produktdataforståelse er nøkkelen

Tror du at produkttittelmatching kan hjelpe deg med å forstå produktdataene dine og rydde opp i salgsintelligensen din? La oss planlegge en demo i dag kl Width.ai

Matt Payne er grunnlegger og administrerende direktør i Width.ai. Width.ai er et maskinlæringskonsulentfirma som fokuserer på å bygge dyplæringsbaserte applikasjoner med kunder på tvers av SaaS, kapitalforvaltning, menneskelige ressurser og markedsføringsautomatisering. Width.ai er en nåværende leder innen bygging og rådgivning om produksjonsgrad GPT-3-produkter og har skrevet en rekke whitepapers og tekniske anmeldelser om bruk av denne toppmoderne ressursen.