škrbina Podudaranje naziva proizvoda za SKU upravljanje s NLP-om - Unite.AI
Povežite se s nama

Vođe misli

Podudaranje naziva proizvoda za SKU upravljanje s NLP-om

mm

Objavljeno

 on

Kratak pregled načina na koji možete automatizirati podudaranje podataka o proizvodu i upravljanje SKU-om koristeći samo naslove proizvoda s NLP-om.

Uparivanje naslova proizvoda je postupak uparivanja sličnih ili točnih proizvoda iz različitih izvora koji se temelji isključivo na naslovu i drugim atributima naslova proizvoda. Kako varijance podataka i izvori podataka rastu u organizaciji, može postati teže održavati točne podatke o proizvodu i upravljati novim SKU-ovima. Problemi se pojavljuju kada se koriste različiti dobavljači i prodavači, a čuvanje visokokvalitetnih podataka o proizvodu postaje teže. To može uzrokovati probleme pri procjeni podataka o prodaji i razumijevanju vaših marketinških napora i stope uspjeha. 

Iako se to često radi ručno, može oduzeti mnogo vremena i loše se mjeri. Sustavi stare škole fokusirani su samo na korištenje osnovnih atributa proizvoda kao što su SKU i UPC kodovi koji ne funkcioniraju dobro s modernim nestrukturiranim podacima. Ovi stariji sustavi zahtijevaju pomoćne procese za izdvajanje atributa, uklanjanje duplikata i čišćenje zaustavnih riječi iz nestrukturiranih podataka o proizvodu. Čak i uz svo čišćenje podataka i izdvajanje ključnih riječi, ovi se sustavi i dalje bore s ovakvim stvarima:

GIGABYTE – 15.6″ FHD IPS 144Hz gaming prijenosno računalo – i5-11400H – 16GB – NVIDIA GeForce RTX 3050 512 GB SSD

I

Prijenosno računalo od 15.6 inča – i5-11400H – 16 GB – GeForce RTX 3050 512 GB crna 6494784

Da bismo razumjeli odnose riječi kao što su "laptop" i "notebook", i ključeve dijela govora koji odgovaraju GeForceu, trebat ćemo koristiti obradu prirodnog jezika. 

Što vam podudaranje naslova proizvoda može pružiti

Podudaranje podataka o proizvodu na temelju naslova pruža trgovcima na malo i robnim markama e-trgovine mnoštvo prednosti u svijetu podataka o prodaji i marketinške inteligencije. 

  • Organizirajte proizvode i SKU-ove za više prodavača i dobavljača
  • Upotrijebite podatke o konkurenciji da biste razumjeli tržišne trendove i konkurentne cijene
  • Razumijevanje životnog ciklusa proizvoda 
  • Osigurajte da u vašim podacima o prodaji i marketinškim kampanjama ne nedostaju dijelovi

Korištenje sustava podudaranja temeljenog na nazivu proizvoda omogućuje vam da uvijek imate točne informacije koje su vam potrebne za izvođenje podudaranja podataka. Ostali sustavi koji zahtijevaju gomilu podatkovnih točaka ili detaljnih opisa proizvoda mogu imati poteškoća dok se širite na više proizvoda. Utvrdili smo da korištenje NLP sustava temeljenog na dubokom učenju koji se fokusira na naziv proizvoda omogućuje postizanje sličnih rezultata bez dugoročnog rizika skaliranja. Uspjeli smo upotrijebiti podudaranje naslova proizvoda kao osnovu i izgraditi druge modele oko toga, kao što je podudaranje UPC-a i podudaranje opisa proizvoda kako bismo jednostavno poboljšali rezultate, a ne oslanjali se na njih. 

Usklađivanje naslova proizvoda s obradom prirodnog jezika

Izradili smo naš softver za podudaranje naslova proizvoda koristeći popularne NLP modele kao što su GPT-3, BERT i SBERT kako bismo naučili odnos između različitih značajki jezika naslova, atributa naslova kao što su naziv robne marke, naziv proizvoda, vrsta itd. Ovi temeljeni na dubokom učenju modeli su daleko bolji od neizrazitog podudaranja i drugih pristupa temeljenih na pravilima i dokazano se lako skaliraju s novom varijancom podataka i šumom. 

Podudaranje između: Garmin nuvi 2699LMTHD — GPS navigator — automobilski 6.1 in nuvi 2699LMTHD automobilski prijenosni GPS navigator

Ovaj rezultat NLP softvera pokazuje nekoliko važnih stvari:

  • Zaustavne riječi i znakovi ne utječu na našu sposobnost povezivanja dva naslova proizvoda
  • Model može riječi u naslovu koje su bitne bez obzira na redoslijed ili bilo kakve šumne riječi. 
  • Imena robnih marki nisu potrebna da bismo pronašli podudaranja ili odbili podudaranje. 
  • Atributi proizvoda nisu potrebni (veličina, duljina) u svakom proizvodu koji uspoređujemo i ne moraju biti iste vrste. 

Model naslova proizvoda uzima u obzir male, ali važne razlike između veličina spremnika koji se u bazi proizvoda smatraju različitim SKU-ovima. U drugom primjeru vidimo da postoji hrpa pokretnih dijelova - različiti brojevi boca i nestrukturirani podatkovni šum, ali još uvijek lako podudaranje. 

Rafiniranje za proizvodni slučaj

Ovaj softverski proizvod za podudaranje naslova proizvoda može se fino podesiti na stvarnim podacima o proizvodu maloprodajne trgovine ili robne marke e-trgovine kako bi točnost nadmašila druge proizvode za vaš specifični slučaj upotrebe. Ova razina prilagodbe dostupna je zbog arhitekture jezičnog modela koja se koristi za izradu alata za podudaranje naslova proizvoda, umjesto upotrebe lažnih fuzzer podudaranja ili modela ekstrakcije entiteta. Sposobnost finog podešavanja arhitekture za podatke određene tvrtke omogućuje bolju skalabilnost, a postaje puno lakše prilagoditi se promjenama u nestrukturiranim podacima kako dodajete više proizvoda ili izvora. 

Relativnost u podudaranju proizvoda

Kao što ste mogli primijetiti, ideja o podudaranju proizvoda može biti donekle relativna na temelju slučaja upotrebe koji pokušavate pokriti. Ako želite razlikovati proizvode na temelju SKU-a, željet ćete drugačije rezultate nego ako pokušavate razumjeti veličinu tržišta i konkurentske proizvode. 

Na primjer, ako imate ova dva naslova proizvoda:

Chios Mastiha pakiranje 60gr (2.11 oz) Small Tears guma 100% prirodna guma od mastike od svježih proizvođača mastike

Chios Mastiha pakiranje 25gr (0.88oz) Medium Tears guma 100% prirodna guma za mastiku od svježih proizvođača mastike

Mogli biste ih smatrati ne podudaranjem na temelju ideje da imaju dva različita SKU-a u istoj trgovini, ali biste ih također mogli smatrati podudaranjem na temelju ideje da su oba Mastic Gum. Ako sada uključimo ovaj naslov proizvoda u miks:

Horbaach Mastic Guma 1500 mg 120 kapsula | Bez GMO-a i bez glutena

Moramo unaprijed odlučiti za što odgovaramo. Ovo je očito konkurentski proizvod i ima drugačiji UPC kod, ali još uvijek je Mastic Gum i ako samo tražimo proizvode pod istim "kišobranom", onda je ovo podudaranje. O mnogočemu treba razmišljati kada dizajnirate svoje sustave za podudaranje podataka o proizvodu.

Kada koristite NLP temeljen alat za podudaranje naslova proizvoda, ova razina fleksibilnosti postaje povjetarac. Jednostavno fino prilagođavamo našu arhitekturu za vaš slučaj upotrebe bez obzira što smatrate "podudaranjem" i optimiziramo prema tome. Ova razina fleksibilnosti mijenja pravila igre kada želite koristiti istu arhitekturu za mnoge različite slučajeve upotrebe unutar organizacije i još uvijek postižu visoku točnost.

Naš cjevovod temeljen na SKU-u ispravno smatra da se to ne podudara.

Ekstrakcija podataka o proizvodu

Nakon što smo već uskladili naslove proizvoda i shvatili varijancu naših internih podataka o prodaji ili podatke o konkurentskim proizvodima koje možemo koristiti modeli kategorizacije proizvoda ili alate za izdvajanje atributa temeljene na NLP-u za popunjavanje svih praznina u podacima koje imamo, kao što su veličina proizvoda, naziv proizvođača i atributi proizvoda automatsko. Ovi cjevovodi koriste istu arhitekturu kao i naše podudaranje proizvoda tako da se mogu lako integrirati. 

Poboljšajte svoju taksonomiju proizvoda

Primjer generiranja kategorija proizvoda i oznaka iz našeg GPT-3 modela.

Pomoću alata za podudaranje naziva proizvoda možete poboljšati jasnoću svoje taksonomije kombiniranjem više atributa proizvoda koji se podudaraju u jednu kategoriju. Ovo uvelike čisti i standardizira atribute koji čine vaš sustav taksonomije.  

GIGABYTE – 15.6″ FHD IPS 144Hz gaming prijenosno računalo – i5-11400H – 16GB – NVIDIA GeForce RTX 3050 512 GB SSD

I

Prijenosno računalo 15.6″ – i5-11400H – 16GB – GeForce RTX 3050 512 GB crna 6494784

Razumijevanje da su oba isti proizvod omogućuje vam da popunite sve praznine kao što je stavljanje “Notebook” i “Laptop” u istu kategoriju, “NVIDIA” kao proizvođača za oba proizvoda i tako dalje. To vam omogućuje da pronađete pogrešno kategorizirane proizvode i popunite sve praznine. 

Razumijevanje podataka o proizvodu je ključno

Mislite da vam podudaranje naslova proizvoda može pomoći u razumijevanju podataka o proizvodu i očistiti vašu prodajnu inteligenciju? Zakažimo demo danas u Širina.ai

Matt Payne je osnivač i izvršni direktor Širina.ai. Width.ai je konzultantska tvrtka za strojno učenje usmjerena na izgradnju aplikacija temeljenih na dubokom učenju s klijentima diljem SaaS-a, upravljanja imovinom, ljudskih resursa i automatizacije marketinga. Width.ai je trenutni lider u izgradnji i savjetovanju o GPT-3 proizvodima proizvodne razine i napisao je niz bijelih knjiga i tehničkih recenzija o korištenju ovog najsuvremenijeg izvora.