peň Zhoda názvu produktu pre správu SKU s NLP - Unite.AI
Spojte sa s nami

Myšlienkoví vodcovia

Zhoda názvu produktu pre správu SKU s NLP

mm

uverejnené

 on

Rýchly ponor do toho, ako môžete automatizovať párovanie údajov o produktoch a správu SKU pomocou iba názvov produktov s NLP.

Priraďovanie názvu produktu je proces porovnávania podobných alebo presných produktov z rôznych zdrojov založený výlučne na názve a iných atribútoch nadpisu produktu. Keďže v organizácii narastajú rozdiely v údajoch a zdroje údajov, môže byť ťažšie udržiavať presné údaje o produktoch a spravovať nové SKU. Problémy vznikajú pri využívaní rôznych dodávateľov a predajcov a udržiavanie vysoko kvalitných údajov o produktoch sa stáva ťažším. To môže spôsobiť problémy pri vyhodnocovaní údajov o predaji a pochopení vášho marketingového úsilia a miery úspešnosti. 

Aj keď sa to často robí ručne, môže to byť mimoriadne časovo náročné a zle sa škáluje. Staré školské systémy sa zameriavali len na používanie základných atribútov produktov, ako sú kódy SKU a UPC, ktoré nefungujú dobre s modernými neštruktúrovanými údajmi. Tieto staršie systémy vyžadujú pomocné procesy na extrakciu atribútov, odstránenie duplikátov a vyčistenie stop slov z neštruktúrovaných údajov o produkte. Dokonca aj po tom všetkom čistení údajov a extrakcii kľúčových slov tieto systémy stále zápasia s vecami ako je toto:

GIGABYTE – 15.6″ FHD IPS 144Hz herný notebook – i5-11400H – 16 GB – NVIDIA GeForce RTX 3050 512 GB SSD

a

15.6″ notebook – i5-11400H – 16 GB – GeForce RTX 3050 512 GB čierny 6494784

Aby sme porozumeli slovným vzťahom, ako sú „laptop“ a „notebook“ a klávesom časti reči, aby zodpovedali GeForce, budeme musieť použiť spracovanie prirodzeného jazyka. 

Čo vám môže poskytnúť zhoda názvu produktu

Zhoda údajov o produkte na základe názvu poskytuje maloobchodníkom a značkám elektronického obchodu množstvo výhod vo svete údajov o predaji a marketingových informácií. 

  • Usporiadajte produkty a SKU u viacerých predajcov a dodávateľov
  • Použite údaje o konkurencii na pochopenie trhových trendov a konkurenčných cien
  • Pochopte životný cyklus produktu 
  • Uistite sa, že vo vašich predajných údajoch a marketingových kampaniach nechýbajú žiadne časti

Používanie systému porovnávania založeného na názve produktu vám umožňuje zabezpečiť, aby ste vždy mali presné informácie, ktoré potrebujete na vykonanie párovania údajov. Iné systémy, ktoré vyžadujú veľké množstvo údajových bodov alebo podrobných popisov produktov, môžu mať problémy, keď sa rozšírite do viacerých produktov. Zistili sme, že používanie systému NLP založeného na hlbokom učení, ktorý sa zameriava na názov produktu, vám umožňuje dosiahnuť podobné výsledky bez dlhodobého rizika škálovania. Dokázali sme použiť zhodu názvu produktu ako základnú líniu a vytvoriť okolo nej ďalšie modely, ako je zhoda UPC a zhoda popisu produktu, aby sme jednoducho zlepšili výsledky, nie sa na ne spoliehali. 

Zhoda názvu produktu so spracovaním prirodzeného jazyka

Náš softvér na porovnávanie názvov produktov sme vytvorili pomocou populárnych modelov NLP, ako sú GPT-3, BERT a SBERT, aby sme sa naučili vzťah medzi rôznymi funkciami jazyka názvov, atribútmi názvu, ako je názov značky, názov produktu, typ atď. modely sú oveľa lepšie ako fuzzy párovanie a iné prístupy založené na pravidlách a je dokázané, že sa dajú ľahko škálovať s novými rozptylmi údajov a šumom. 

Zhoda medzi: Garmin nuvi 2699LMTHD – GPS navigátor – automobilový 6.1-palcový Automobilový prenosný GPS navigátor nuvi 2699LMTHD

Tento výsledok zo softvéru NLP ukazuje niekoľko dôležitých vecí:

  • Istotné slová a znaky neovplyvňujú našu schopnosť spojiť dva názvy produktov
  • Model môže slová v názve, na ktorých záleží, bez ohľadu na poradie alebo akékoľvek šumové slová. 
  • Názvy značiek nie sú potrebné, aby sme našli zhody alebo odmietli zhodu. 
  • Atribúty produktu nie sú povinné (veľkosť, dĺžka) v každom produkte, ktorý porovnávame, a nemusia byť rovnakého typu. 

Model názvu produktu zachytáva malé, ale dôležité rozdiely medzi veľkosťami kontajnerov, ktoré sa v databáze produktov považujú za rôzne SKU. V druhom príklade vidíme, že existuje veľa pohyblivých častí – rôzne počty fliaš a neštruktúrovaný dátový šum, ale stále je to ľahké. 

Rafinácia pre prípad výrobného použitia

Tento softvérový produkt zhodný s názvom produktu možno doladiť na skutočných údajoch o produktoch značky maloobchodu alebo elektronického obchodu, aby sa presnosť posunula v porovnaní s inými produktmi pre váš konkrétny prípad použitia. Táto úroveň prispôsobenia je k dispozícii vďaka architektúre jazykového modelu, ktorá sa používa na zostavenie porovnávača názvov produktu, namiesto použitia nezvyčajných porovnávačov fuzzerov alebo modelov extrakcie entít. Schopnosť doladiť architektúru pre údaje konkrétnej spoločnosti umožňuje lepšiu škálovateľnosť a zároveň je oveľa jednoduchšie prispôsobiť sa zmenám v neštruktúrovaných údajoch, keď pridávate ďalšie produkty alebo zdroje. 

Relativita pri párovaní produktov

Ako ste si mohli všimnúť, myšlienka priraďovania produktov môže byť do istej miery relatívna podľa toho, aký prípad použitia sa snažíte pokryť. Ak chcete odlíšiť produkty na základe SKU, budete chcieť iné výsledky, ako keby ste sa snažili pochopiť veľkosť trhu a konkurenčné produkty. 

Ak máte napríklad tieto dva názvy produktov:

Balenie chioskej mastichy 60 g (2.11 oz) žuvačka Small Tears 100 % prírodná mastichová guma od pestovateľov mastichy čerstvá

Balenie chioskej mastichy 25 g (0.88 oz) žuvačka Medium Tears 100 % prírodná mastichová guma od pestovateľov mastichy čerstvá

Môžete ich považovať za nezhodné na základe myšlienky, že majú dve rôzne SKU v tom istom obchode, ale môžete ich považovať aj za zhodu na základe myšlienky, že obaja sú Mastic Gum. Ak teraz zahrnieme tento názov produktu do mixu:

Mastichová guma Horbaach 1500 mg 120 kapsúl | Bez GMO a bez lepku

Musíme sa vopred rozhodnúť, na čo sa hodíme. Toto je jednoznačne produkt konkurencie a má iný kód UPC, ale stále je to Mastic Gum a ak hľadáme produkty pod rovnakým „dáždnikom“, potom je to zhoda. Pri navrhovaní systémov na porovnávanie údajov o produktoch je potrebné myslieť na veľa vecí.

Keď používate nástroj na porovnávanie názvov produktov založený na NLP, táto úroveň flexibility sa stáva hračkou. Jednoducho doladíme našu architektúru pre váš prípad použitia bez ohľadu na to, čo považujete za „zhodu“ a podľa toho optimalizujeme. Táto úroveň flexibility mení hru pri hľadaní použitia rovnakej architektúry pre mnoho rôznych prípadov použitia v rámci organizácie a stále dosahujú vysokú presnosť.

Náš kanál založený na SKU to správne považuje za nezhodu.

Extrakcia údajov o produkte

Keď už priradíme názvy produktov a pochopíme buď naše interné rozdiely v údajoch o predaji alebo údaje o produktoch konkurentov, môžeme použiť modely kategorizácie produktov alebo nástroje na extrakciu atribútov založené na NLP na vyplnenie akýchkoľvek medzier v údajoch, ktoré máme, ako je veľkosť produktu, názov výrobcu a atribúty produktu automaticky. Tieto potrubia používajú rovnakú architektúru ako naše párovanie produktov, takže ich možno ľahko integrovať. 

Zlepšite svoju taxonómiu produktov

Príklad generovania kategórií produktov a značiek z nášho modelu GPT-3.

Pomocou nástroja na porovnávanie názvov produktov môžete zlepšiť prehľadnosť svojej taxonómie spojením viacerých zhodných atribútov produktov do jednej kategórie. To výrazne vyčistí a štandardizuje atribúty, ktoré tvoria váš systém taxonómie.  

GIGABYTE – 15.6″ FHD IPS 144Hz herný notebook – i5-11400H – 16 GB – NVIDIA GeForce RTX 3050 512 GB SSD

a

15.6″ notebook – i5-11400H – 16 GB – GeForce RTX 3050 512 GB čierna 6494784

Pochopenie toho, že ide o ten istý produkt, vám umožňuje vyplniť akékoľvek medzery, ako je uvedenie „Notebook“ a „Laptop“ do rovnakej kategórie, „NVIDIA“ ako výrobca pre oba produkty atď. To vám umožní nájsť nesprávne kategorizované produkty a vyplniť všetky medzery. 

Kľúčom je pochopenie údajov o produkte

Myslíte si, že zhoda názvov produktov vám môže pomôcť porozumieť údajom o produkte a vyčistiť informácie o predaji? Naplánujme si dnes demo na Width.ai

Matt Payne je zakladateľom a generálnym riaditeľom spoločnosti Width.ai. Width.ai je konzultačná firma zameraná na strojové učenie, ktorá sa zameriava na vytváranie aplikácií založených na hlbokom učení s klientmi v rámci SaaS, správy aktív, ľudských zdrojov a automatizácie marketingu. Spoločnosť Width.ai je súčasným lídrom v oblasti budovania a poradenstva v oblasti produktov GPT-3 výrobnej triedy a napísala množstvo dokumentov a technických recenzií o používaní tohto najmodernejšieho zdroja.