Лідери думок

Збіґнвання назв товарів для керування SKU з використанням NLP

Published February 14, 2022

Updated April 28, 2026

Matt Payne

Швидкий огляд того, як ви можете автоматизувати збіґнвання даних про товари та керування SKU, використовуючи лише назви товарів з NLP.

Збіґнвання назв товарів – це процес збіґнвання подібних або ідентичних товарів з різних джерел, заснований виключно на назві та інших атрибутах заголовку товару. Коли дані та джерела зростають в організації, може стати складніше підтримувати точність даних про товари та керувати новими SKU. Проблеми виникають при використанні різних постачальників та виробників, а також при підтриманні високої якості даних про товари. Це може спричинити проблеми при оцінці даних про продажі та розумінні маркетингових зусиль та рівня успіху.

Хоча це часто робиться вручну, це може стати дуже thờiратно та не масштабується добре. Старіші системи, які використовували лише базові атрибути товарів, такі як SKU та коди UPC, не працюють добре з сучасними неструктурованими даними. Ці старіші системи вимагають допоміжних процесів для витягування атрибутів, видалення дублікатів та очищення стоп-слів з неструктурованих даних про товари. Навіть з усіма даними про очищення та витягування ключових слів ці системи все ще мають труднощі з такими речами:

GIGABYTE – 15.6″ FHD IPS 144Hz Gaming Laptop – i5-11400H – 16GB – NVIDIA GeForce RTX 3050 512 GB SSD

15.6″ Notebook – i5-11400H – 16GB – GeForce RTX 3050 512 GB Black 6494784

Щоб зрозуміти відношення слів, такі як “лептоп” та “ноутбук”, та ключові слова для збіґнвання GeForce, нам потрібно використовувати обробку природної мови.

Що може забезпечити збіґнвання назв товарів для вас

Збіґнвання даних про товари на основі назви забезпечує рітейлерам та електронним торговельним брендам багато переваг у сфері даних про продажі та маркетингової розвідки.

Організувати товари та SKU по декількох постачальниках та виробниках
Використовувати дані конкурентів для розуміння ринкових тенденцій та конкурентної ціни
Розуміти життєвий цикл продукту
Забезпечити відсутність відсутніх даних у ваших даних про продажі та маркетингових кампаніях

Використання системи збіґнвання назв товарів дозволяє вам завжди мати точну інформацію, необхідну для виконання збіґнвання даних. Інші системи, які вимагають великої кількості даних або глибоких описів товарів, можуть мати труднощі при масштабуванні. Ми виявили, що використання глибокого навчання на основі мови для збіґнвання назв товарів дозволяє отримувати подібні результати без довгострокових ризиків масштабування. Ми змогли використовувати збіґнвання назв товарів як базу та побудувати інші моделі навколо нього, такі як збіґнвання UPC та опису товарів, щоб просто покращити результати, а не залежати від них.

Збіґнвання назв товарів з обробкою природної мови

Ми побудували нашу програму збіґнвання назв товарів, використовуючи популярні моделі NLP, такі як GPT-3, BERT та SBERT, щоб вивчити відношення між різними мовними ознаками назви, такими як бренд, назва продукту, тип тощо. Ці моделі глибокого навчання значно кращі за розмиті збіґннення та інші правила, засновані на підходах, та доведено, що легко масштабуються з новими даними та шумом.

Збіґнвання між: Garmin nuvi 2699LMTHD â€” GPS-навігація â€” автомобіль 6.1 вnuvi 2699LMTHD Автомобільний портативний GPS-навігація

Цей результат програми NLP показує кілька важливих речей:

Стоп-слова та символи не впливають на нашу здатність збігати дві назви товарів
Модель може визначити слова в назві, які мають значення, незалежно від порядку або шумових слів.
Бренд не потрібен для того, щоб ми знайшли збіґннення або відхилили його.
Атрибути товарів не потрібні (розмір, довжина) у кожному товарі, який ми порівнюємо, та не повинні бути однаковими.

Модель назви товарів виявляє маленькі, але важливі відмінності між розмірами контейнерів, які вважаються різними SKU в базі даних товарів. У другому прикладі ми бачимо, що є багато рухомих частин – різні кількості пляшок та неструктуровані дані шуму, але все ж таки легке збіґннення.

Уточнення для виробничого використання

Ця програма збіґнвання назв товарів може бути дофільтрована на фактичних даних про товари рітейлерської торгівлі або електронного бренду, щоб đẩyити точність понад інші продукти для вашого конкретного використання. Цей рівень налаштування доступний завдяки архітектурі мови, використаній для побудови збіґннення назв товарів, замість використання хитрих фузерів або моделей витягування сутностей. Можливість дофільтрувати архітектуру для конкретної компанії дозволяє краще масштабуватися, а також легше пристосовуватися до змін неструктурованих даних при додаванні нових товарів або джерел.

Відносність у збіґнненні товарів

Як ви, можливо, помітили, ідея збіґннення товарів може бути відносною залежно від того, яке використання ви намагаєтеся покрити. Якщо ви намагаєтеся відрізнити товари на основі SKU, ви хочете різні результати, ніж якщо ви намагаєтеся зрозуміти ринковий розмір та товари конкурентів.

Наприклад, якщо у вас є такі дві назви товарів:

Chios Mastiha Pack 60gr (2.11 oz) Small Tears Gum 100% Natural Mastic Gum From Mastic Growers Fresh

Chios Mastiha Pack 25gr (0.88oz) Medium Tears Gum 100% Natural Mastic Gum From Mastic Growers Fresh

Ви можете вважати їх не збігненими на основі ідеї, що вони мають два різні SKU всередині однієї таєї ж магазину, але також можете вважати їх збігненими на основі ідеї, що вони обидва Мастикова гумка. Якщо ми тепер включимо цю назву товарів у суміш:

Horbaach Mastic Gum 1500mg 120 Capsules | Non-GMO & Gluten Free

Нам потрібно вирішити заздалегідь, для чого ми збіґнуємо. Це явно товар конкурента та має інший код UPC, але це все ж таки Мастикова гумка, і якщо ми просто шукаємо товари під однією та тією ж “навіскою”, то це збіґннення. Багато чого потрібно подумати при проектуванні систем збіґннення даних про товари.

Коли ви використовуєте інструмент збіґннення назв товарів на основі NLP, цей рівень гнучкості стає легким. Ми просто дофільтруємо нашу архітектуру для вашого використання, незалежно від того, що ви вважаєте “збіґнненням”, та оптимізуємо його для цього. Цей рівень гнучкості є революційним при використанні однієї та тієї ж архітектури для багатьох різних випадків використання всередині організації та досягненні високої точності.і все ж таки досягати високої точності.

Наш конвеєр на основі SKU правильно вважає це не збігненим.

Витягування даних про товари

Як тільки ми вже збігнули назви товарів та маємо розуміння наших внутрішніх даних про продажі чи даних про товари конкурентів, ми можемо використовувати моделі категоризації товарів або інструменти витягування атрибутів на основі NLP, щоб заповнити будь-які прогалини в наших даних про товари, такі як розмір товарів, назва виробника, атрибути товарів автоматично. Ці конвеєри використовують одну й ту ж архітектуру, що й наше збіґннення назв товарів, тому їх можна легко інтегрувати.

Покращення вашої таксономії товарів

Приклад генерації категорій та тегів товарів з нашої моделі GPT-3.

З інструментом збіґннення назв товарів ви можете покращити ясність вашої таксономії, об’єднавши декілька збігнених атрибутів товарів в одну категорію. Це значно очищує та стандартизує атрибути, які складають вашу систему таксономії.

GIGABYTE – 15.6″ FHD IPS 144Hz Gaming Laptop – i5-11400H – 16GB – NVIDIA GeForce RTX 3050 512 GB SSD

15.6″ Notebook – i5-11400H – 16GB – GeForce RTX 3050 512 GB Black 6494784

Розуміння того, що це однакові товари, дозволяє вам заповнити будь-які прогалини, такі як розміщення “Ноутбук” та “Лептоп” в одну категорію, “NVIDIA” як виробник для обидвох товарів тощо. Це дозволяє вам знайти товари, які неправильно категоризовані, та заповнити будь-які прогалини.

Знання даних про товари є ключем

Підумайте, що збіґннення назв товарів може допомогти вам зрозуміти ваші дані про товари та очистити вашу розвідку продажів? Запланіруйте демонстрацію сьогодні на Width.ai.