Лідери думок
Відповідність назви продукту для управління SKU за допомогою NLP

Коротке занурення в те, як можна автоматизувати зіставлення даних про продукти та керування SKU, використовуючи лише назви продуктів за допомогою NLP.
Зіставлення назв продукту – це процес зіставлення схожих або точних продуктів із різних джерел виключно на основі назви та інших атрибутів заголовка продукту. Оскільки розбіжності в даних і джерела даних зростають в організації, стає важче підтримувати точність даних про продукти та керувати новими SKU. Проблеми виникають, коли використовуються різні постачальники та продавці, і зберігати високоякісні дані про продукт стає важче. Це може спричинити проблеми під час оцінки даних про продажі та розуміння ваших маркетингових зусиль і рівня успіху.
Хоча це часто робиться вручну, це може зайняти дуже багато часу та погано масштабується. Старі шкільні системи зосереджувалися лише на використанні базових атрибутів продукту, таких як SKU та коди UPC, які погано працюють із сучасними неструктурованими даними. Ці старіші системи потребують допоміжних процесів для вилучення атрибутів, видалення дублікатів і очищення стоп-слів із неструктурованих даних продукту. Навіть незважаючи на очищення даних і вилучення ключових слів, ці системи все ще мають проблеми з такими речами:
GIGABYTE – Ігровий ноутбук 15.6″ FHD IPS 144 Гц – i5-11400H – 16 ГБ – NVIDIA GeForce RTX 3050 512 ГБ SSD
і
Ноутбук 15.6″ – i5-11400H – 16 ГБ – GeForce RTX 3050 512 ГБ Чорний 6494784
Щоб зрозуміти зв’язки слів, наприклад «ноутбук» і «ноутбук», і ключі частин мови, які відповідають GeForce, нам потрібно використовувати обробку природної мови.
Що може надати вам зіставлення назв продукту
Збіг даних про товар на основі назви надає роздрібним торговцям і брендам електронної комерції масу переваг у світі даних про продажі та маркетингової інформації.
- Упорядковуйте продукти та артикули між кількома постачальниками та постачальниками
- Використовуйте дані про конкурентів, щоб зрозуміти ринкові тенденції та конкурентоспроможні ціни
- Зрозумійте життєвий цикл продукту
- Переконайтеся, що у ваших даних про продажі та маркетингових кампаніях немає жодних недоліків
Використання системи зіставлення на основі назви продукту дозволяє вам завжди мати точну інформацію, необхідну для зіставлення даних. Інші системи, які вимагають маси точок даних або детальних описів продукту, можуть відчувати труднощі, коли ви масштабуєте більше продуктів. Ми виявили, що використання системи НЛП на основі глибокого навчання, яка зосереджується на назві продукту, дозволяє отримати схожі результати без довгострокового ризику масштабування. Нам вдалося використати відповідність назви продукту як базову лінію та побудувати на її основі інші моделі, наприклад відповідність UPC та відповідність опису продукту, щоб просто покращити результати, а не покладатися на них.
Зіставлення назви продукту з обробкою природної мови
Ми розробили наше програмне забезпечення зіставлення назв продукту, використовуючи такі популярні моделі NLP, як GPT-3, BERT і SBERT, щоб вивчати взаємозв’язок між різними функціями мови назви, такими атрибутами назви, як назва бренду, назва продукту, тип тощо. моделі значно перевершують нечітку відповідність та інші підходи, засновані на правилах, і доведено, що вони легко масштабуються з новою дисперсією даних і шумом.
Збіг між: Garmin nuvi 2699LMTHD — GPS-навігатор — автомобільний 6.1 дюйма Портативний автомобільний GPS-навігатор nuvi 2699LMTHD
Цей результат програмного забезпечення NLP демонструє кілька важливих речей:
- Стоп-слова та символи не впливають на нашу здатність зіставляти дві назви продуктів
- Модель може використовувати слова в назві, які мають значення незалежно від порядку, або будь-які шумові слова.
- Назви торгових марок не потрібні, щоб ми знаходили збіги або відхиляли збіг.
- Атрибути продукту не є обов’язковими (розмір, довжина) для кожного продукту, який ми порівнюємо, і не обов’язково мають бути одного типу.
Модель назви продукту враховує невеликі, але важливі відмінності між розмірами контейнерів, які вважаються різними артикулами в базі даних продуктів. У другому прикладі ми бачимо купу рухомих частин – різну кількість пляшок і неструктурований шум даних, але все одно легко збігаються.
Переробка для виробництва
Цей програмний продукт для зіставлення назв товарів можна точно налаштувати на основі фактичних даних про товар роздрібного магазину або бренду електронної комерції, щоб перевершити точність інших товарів для вашого конкретного випадку використання. Такий рівень налаштування доступний завдяки архітектурі мовної моделі, яка використовується для створення зіставлення назв товарів, замість використання хитрих фаззерів або моделей вилучення сутностей. Можливість точно налаштувати архітектуру для даних конкретної компанії забезпечує кращу масштабованість, а також значно полегшує адаптацію до змін у неструктурованих даних, коли ви додаєте більше товарів або джерел.
Відносність у відповідності продуктів
Як ви могли помітити, ідея відповідності продукту може бути дещо відносною залежно від того, який варіант використання ви намагаєтеся охопити. Якщо ви бажаєте диференціювати продукти на основі SKU, вам потрібні будуть інші результати, ніж якщо ви намагаєтесь зрозуміти розмір ринку та продукти конкурентів.
Наприклад, якщо у вас є ці дві назви продуктів:
Chios Mastiha Pack 60 гр (2.11 унції) Small Tears Gum 100% натуральна гумка для мастики від Mastic Growers Fresh
Пакет Chios Mastiha 25 г (0.88 унції) Medium Tears Gum 100% натуральна гумка для мастики від Mastic Growers Fresh
Ви можете вважати їх не збігаючимися на основі ідеї, що вони мають два різні артикули в одному магазині, але також можете вважати їх збігаючими на основі ідеї, що вони обидва Mastic Gum. Якби ми зараз включили цю назву продукту в мікс:
Horbaach Mastic Gum 1500 мг 120 капсул | Без ГМО та глютену
Нам потрібно заздалегідь вирішити, для чого ми зіставляємо дані. Це явно продукт конкурента з іншим UPC-кодом, але це все одно Mastic Gum, і якщо ми просто шукаємо продукти під однією «парасолькою», то це збіг. Є багато про що подумати, розробляючи системи зіставлення даних про ваші продукти.
Коли ви використовуєте інструмент зіставлення назв продуктів на основі NLP, цей рівень гнучкості стає легким. Ми просто налаштовуємо нашу архітектуру для вашого випадку використання, незалежно від того, що ви вважаєте «відповідністю», і оптимізуємося відповідно до цього. Цей рівень гнучкості кардинально змінює правила, коли потрібно використовувати ту саму архітектуру для багатьох різних варіантів використання всередині організації. і при цьому досягають високої точності.

Наш конвеєр на основі SKU правильно вважає, що це не відповідає.
Витяг даних про продукт
Коли ми вже зіставили назви продуктів і з’ясували відхилення наших внутрішніх даних про продажі або дані про продукти конкурентів, ми можемо використовувати моделі категоризації продуктів або інструменти вилучення атрибутів на основі NLP, щоб заповнити будь-які прогалини в даних, як-от розмір продукту, назва виробника та атрибути продукту автоматично. Ці конвеєри використовують ту саму архітектуру, що й наш продукт, тому їх можна легко інтегрувати.
Покращте таксономію свого продукту

Приклад генерації категорій продуктів і тегів з нашої моделі GPT-3.
За допомогою інструмента зіставлення назв продуктів ви можете покращити ясність таксономії, об’єднавши кілька відповідних атрибутів продуктів разом в одну категорію. Це значно очищає та стандартизує атрибути, які складають вашу таксономічну систему.
GIGABYTE – Ігровий ноутбук 15.6″ FHD IPS 144 Гц – i5-11400H – 16 ГБ – NVIDIA GeForce RTX 3050 512 ГБ SSD
і
Ноутбук 15.6″ – i5-11400H – 16 ГБ – GeForce RTX 3050 512 ГБ Чорний 6494784
Розуміння того, що це один і той самий продукт, дає змогу заповнити будь-які прогалини, як-от віднести «Ноутбук» і «Ноутбук» до однієї категорії, «NVIDIA» як виробника для обох продуктів тощо. Це дозволить вам знаходити неправильно класифіковані продукти та заповнювати будь-які прогалини.
Ключовим є розуміння даних про продукт
Вважаєте, що зіставлення назв продукту може допомогти вам зрозуміти дані про продукт і очистити інформацію про продажі? Давайте заплануємо демонстрацію сьогодні о Ширина.ai.