Seguici sui social

Leader del pensiero

Corrispondenza del titolo del prodotto per la gestione degli SKU con la PNL

mm

Un rapido approfondimento su come automatizzare la corrispondenza dei dati di prodotto e la gestione degli SKU utilizzando solo i titoli dei prodotti con NLP.

La corrispondenza del titolo del prodotto è il processo di corrispondenza di prodotti simili o esatti provenienti da fonti diverse in base rigorosamente al titolo e ad altri attributi del titolo del prodotto. Man mano che la varianza dei dati e le origini dati crescono in un'organizzazione, può diventare più difficile mantenere i dati di prodotto accurati e gestire nuovi SKU. I problemi sorgono quando si utilizzano fornitori e venditori diversi e mantenere dati di prodotto di alta qualità diventa più difficile. Ciò può causare problemi durante la valutazione dei dati di vendita e la comprensione degli sforzi di marketing e della percentuale di successo. 

Sebbene questa operazione venga spesso eseguita manualmente, può richiedere molto tempo e scarsamente scalabile. I sistemi della vecchia scuola si concentravano solo sull’utilizzo degli attributi di base del prodotto come SKU e codici UPC che non funzionano bene con i moderni dati non strutturati. Questi sistemi più vecchi richiedono processi ausiliari per estrarre attributi, rimuovere duplicati e pulire le parole chiave dai dati di prodotto non strutturati. Anche con tutta la pulizia dei dati e l'estrazione delle parole chiave, questi sistemi continuano a lottare con cose come queste:

GIGABYTE – Laptop da gioco FHD IPS 15.6Hz da 144″ – i5-11400H – 16 GB – SSD NVIDIA GeForce RTX 3050 da 512 GB

E altre ancora…

Notebook da 15.6″ – i5-11400H – 16 GB – GeForce RTX 3050 512 GB Nero 6494784

Per comprendere le relazioni tra parole come "laptop" e "notebook" e parte dei tasti vocali che corrispondono a GeForce, dovremo utilizzare l'elaborazione del linguaggio naturale. 

Cosa può offrirti la corrispondenza del titolo del prodotto

Corrispondenza dei dati di prodotto basato sul titolo offre ai rivenditori e ai marchi di e-commerce un sacco di vantaggi nel mondo dei dati di vendita e dell'intelligenza di marketing. 

  • Organizza prodotti e SKU tra più venditori e fornitori
  • Utilizza i dati della concorrenza per comprendere le tendenze del mercato e i prezzi competitivi
  • Comprendere il ciclo di vita del prodotto 
  • Assicurati che non ci siano pezzi mancanti nei dati di vendita e nelle campagne di marketing

L'utilizzo di un sistema di corrispondenza basato sul titolo del prodotto ti consente di assicurarti di avere sempre le informazioni esatte necessarie per eseguire la corrispondenza dei dati. Altri sistemi che richiedono un sacco di punti dati o descrizioni approfondite del prodotto possono avere difficoltà quando si passa a più prodotti. Abbiamo scoperto che l'utilizzo di un sistema di PNL basato sul deep learning che si concentra sul titolo del prodotto consente di ottenere risultati simili senza il rischio di scalabilità a lungo termine. Siamo stati in grado di utilizzare la corrispondenza del titolo del prodotto come base e costruire altri modelli attorno ad essa come la corrispondenza UPC e la corrispondenza della descrizione del prodotto per migliorare semplicemente i risultati, non fare affidamento. 

Corrispondenza del titolo del prodotto con l'elaborazione del linguaggio naturale

Abbiamo creato il nostro software di corrispondenza del titolo del prodotto utilizzando modelli NLP popolari come GPT-3, BERT e SBERT per apprendere la relazione tra le diverse caratteristiche della lingua del titolo, gli attributi del titolo come il nome del marchio, il nome del prodotto, il tipo ecc. i modelli sono di gran lunga superiori rispetto alla corrispondenza fuzzy e ad altri approcci basati su regole e hanno dimostrato di scalare facilmente con la nuova varianza e il rumore dei dati. 

Corrispondenza tra: Garmin nuvi 2699LMTHD - navigatore GPS - automotive 6.1 in Navigatore GPS portatile per auto nuvi 2699LMTHD

Questo risultato del software PNL mostra alcune cose importanti:

  • Parole non significative e caratteri non influiscono sulla nostra capacità di abbinare due titoli di prodotto
  • Il modello può le parole nel titolo che contano indipendentemente dall'ordine o eventuali parole non significative sono loro. 
  • I nomi dei marchi non sono necessari per trovare corrispondenze o rifiutare una corrispondenza. 
  • Gli attributi del prodotto non sono obbligatori (taglia, lunghezza) in ogni prodotto che stiamo confrontando e non devono essere dello stesso tipo. 

Il modello del titolo del prodotto rileva piccole ma importanti differenze tra le dimensioni dei contenitori che sono considerate SKU diversi nel database dei prodotti. Nel secondo esempio vediamo che ci sono un sacco di parti in movimento: diversi conteggi di bottiglie e rumore di dati non strutturati, ma comunque una corrispondenza facile. 

Caso d'uso di raffinamento per la produzione

Questo software di abbinamento dei titoli di prodotto può essere ottimizzato in base ai dati di prodotto effettivi di un negozio al dettaglio o di un marchio di e-commerce, per ottenere un'accuratezza superiore a quella di altri prodotti per il tuo caso d'uso specifico. Questo livello di personalizzazione è possibile grazie all'architettura del modello linguistico utilizzata per creare il matcher dei titoli di prodotto, anziché ricorrere a fuzzer matcher o modelli di estrazione di entità. La possibilità di ottimizzare l'architettura per i dati di un'azienda specifica consente una migliore scalabilità e semplifica notevolmente l'adattamento ai cambiamenti nei dati non strutturati man mano che si aggiungono più prodotti o fonti. 

Relatività nella corrispondenza dei prodotti

Come avrai notato, l'idea della corrispondenza dei prodotti può essere in qualche modo relativa in base al caso d'uso che stai cercando di coprire. Se stai cercando di differenziare i prodotti in base allo SKU, vorrai risultati diversi rispetto a se stavi cercando di comprendere le dimensioni del mercato e i prodotti della concorrenza. 

Ad esempio, se hai questi due titoli di prodotto:

Chios Mastiha Pack 60gr (2.11 oz) Piccole lacrime Gomma 100% gomma di mastice naturale da coltivatori di mastice fresca

Chios Mastiha Pack 25gr (0.88oz) Gomma a lacrime medie 100% Gomma mastice naturale dai coltivatori di mastice fresco

Potresti considerarli non corrispondenti in base all'idea che abbiano due SKU diversi all'interno dello stesso negozio, ma potresti anche considerarli una corrispondenza basata sull'idea che siano entrambi Mastic Gum. Se ora includessimo questo titolo di prodotto nel mix:

Gomma Mastice Horbaach 1500mg 120 Capsule | Non OGM e senza glutine

Dobbiamo decidere in anticipo per cosa effettuare la corrispondenza. Questo è chiaramente un prodotto della concorrenza e ha un codice UPC diverso, ma è pur sempre Mastic Gum e se stiamo cercando prodotti sotto lo stesso "ombrello", allora questa è una corrispondenza. Ci sono molti aspetti a cui pensare quando si progettano i sistemi di corrispondenza dei dati di prodotto.

Quando utilizzi uno strumento di corrispondenza dei titoli dei prodotti basato sulla PNL, questo livello di flessibilità diventa un gioco da ragazzi. Perfezioniamo semplicemente la nostra architettura per il tuo caso d'uso, indipendentemente da ciò che consideri una "corrispondenza" e ottimizziamo per questo. Questo livello di flessibilità è un punto di svolta quando si cerca di utilizzare la stessa architettura per molti casi d'uso diversi all'interno di un'organizzazione e raggiungere comunque un'elevata precisione.

La nostra pipeline basata su SKU considera correttamente questo non corrispondere.

Estrazione dei dati del prodotto

Una volta che abbiamo già abbinato i titoli dei prodotti e abbiamo compreso la varianza dei nostri dati di vendita interni o i dati dei prodotti della concorrenza, possiamo utilizzare modelli di categorizzazione dei prodotti o strumenti di estrazione degli attributi basati sulla PNL per colmare eventuali lacune nei dati che abbiamo come dimensioni del prodotto, nome del produttore e attributi del prodotto automaticamente. Queste pipeline utilizzano la stessa architettura della nostra corrispondenza di prodotti in modo che possano essere facilmente integrate. 

Migliora la tassonomia dei tuoi prodotti

Esempio di generazione di categorie di prodotti e tag dal nostro modello GPT-3.

Con lo strumento di corrispondenza del titolo del prodotto puoi migliorare la chiarezza della tua tassonomia combinando più attributi di prodotti corrispondenti in un'unica categoria. Questo ripulisce e standardizza notevolmente gli attributi che compongono il tuo sistema di tassonomia.  

GIGABYTE – Laptop da gioco FHD IPS 15.6Hz da 144″ – i5-11400H – 16 GB – SSD NVIDIA GeForce RTX 3050 da 512 GB

E altre ancora…

Notebook da 15.6″ – i5-11400H – 16 GB – GeForce RTX 3050 512 GB Nero 6494784

Capire che questi sono entrambi lo stesso prodotto ti consente di colmare eventuali lacune come mettere "Notebook" e "Laptop" nella stessa categoria, "NVIDIA" come produttore per entrambi i prodotti e così via. Questo ti consente di trovare prodotti classificati in modo errato e di colmare eventuali lacune. 

La comprensione dei dati di prodotto è fondamentale

Pensi che la corrispondenza del titolo del prodotto possa aiutarti a comprendere i tuoi dati di prodotto e ripulire la tua intelligenza di vendita? Fissiamo una demo oggi alle Larghezza.ai

Matt Payne è il fondatore e CEO di Larghezza.ai. Width.ai è una società di consulenza di machine learning focalizzata sulla creazione di applicazioni basate su deep learning con clienti in SaaS, gestione delle risorse, risorse umane e automazione del marketing. Width.ai è attualmente leader nella creazione e consulenza di prodotti GPT-3 di livello di produzione e ha scritto una serie di white paper e revisioni tecniche sull'utilizzo di questa risorsa all'avanguardia.