Kết nối với chúng tôi

Phù hợp tiêu đề sản phẩm để quản lý SKU với NLP

Lãnh đạo tư tưởng

Phù hợp tiêu đề sản phẩm để quản lý SKU với NLP

mm

Tìm hiểu nhanh về cách bạn có thể tự động hóa việc khớp dữ liệu sản phẩm và quản lý SKU chỉ bằng cách sử dụng tiêu đề sản phẩm với NLP.

Đối sánh tiêu đề sản phẩm là quá trình đối sánh các sản phẩm tương tự hoặc chính xác từ các nguồn khác nhau hoàn toàn dựa trên tiêu đề và các thuộc tính tiêu đề khác của sản phẩm. Khi sự khác biệt về dữ liệu và nguồn dữ liệu phát triển trong một tổ chức, việc giữ cho dữ liệu sản phẩm chính xác và quản lý SKU mới có thể trở nên khó khăn hơn. Các vấn đề nảy sinh khi sử dụng các nhà cung cấp và nhà cung cấp khác nhau và việc giữ dữ liệu sản phẩm chất lượng cao trở nên khó khăn hơn. Điều này có thể gây ra các vấn đề khi đánh giá dữ liệu bán hàng và hiểu các nỗ lực tiếp thị của bạn cũng như tỷ lệ thành công. 

Mặc dù việc này thường được thực hiện thủ công nhưng nó có thể trở nên cực kỳ tốn thời gian và quy mô kém. Các hệ thống trường học cũ chỉ tập trung vào việc sử dụng các thuộc tính sản phẩm cơ bản như mã SKU và mã UPC không hoạt động tốt với dữ liệu phi cấu trúc hiện đại. Các hệ thống cũ hơn này yêu cầu các quy trình phụ trợ để trích xuất các thuộc tính, loại bỏ các từ trùng lặp và xóa các từ dừng khỏi dữ liệu sản phẩm phi cấu trúc. Ngay cả với tất cả việc làm sạch dữ liệu và trích xuất từ ​​khóa, các hệ thống này vẫn gặp khó khăn với những vấn đề như thế này:

GIGABYTE – Máy tính xách tay chơi game 15.6″ FHD IPS 144Hz – i5-11400H – 16GB – SSD NVIDIA GeForce RTX 3050 512 GB

15.6″ Notebook – i5-11400H – 16GB – GeForce RTX 3050 512 GB Màu đen 6494784

Để hiểu các mối quan hệ từ như “máy tính xách tay” và “máy tính xách tay” cũng như một phần của phím giọng nói để khớp với GeForce, chúng ta cần sử dụng quy trình xử lý ngôn ngữ tự nhiên. 

Kết hợp tiêu đề sản phẩm có thể cung cấp gì cho bạn

Đối sánh dữ liệu sản phẩm dựa trên tiêu đề cung cấp cho các nhà bán lẻ và thương hiệu thương mại điện tử rất nhiều lợi ích trong thế giới dữ liệu bán hàng và thông tin tiếp thị. 

  • Tổ chức các sản phẩm và SKU trên nhiều nhà cung cấp và nhà cung cấp
  • Sử dụng dữ liệu đối thủ cạnh tranh để hiểu xu hướng thị trường và giá cả cạnh tranh
  • Hiểu vòng đời sản phẩm 
  • Đảm bảo không có phần nào bị thiếu trong dữ liệu bán hàng và chiến dịch tiếp thị của bạn

Sử dụng hệ thống đối sánh dựa trên tiêu đề sản phẩm cho phép bạn đảm bảo rằng bạn luôn có thông tin chính xác mà bạn cần để thực hiện đối sánh dữ liệu. Các hệ thống khác yêu cầu rất nhiều điểm dữ liệu hoặc mô tả sản phẩm chuyên sâu có thể gặp khó khăn khi bạn mở rộng quy mô sang nhiều sản phẩm hơn. Chúng tôi nhận thấy rằng việc sử dụng hệ thống NLP dựa trên học sâu tập trung vào tiêu đề sản phẩm cho phép bạn nhận được kết quả tương tự mà không gặp rủi ro mở rộng quy mô trong dài hạn. Chúng tôi đã có thể sử dụng đối sánh tiêu đề sản phẩm làm cơ sở và xây dựng các mô hình khác xung quanh nó, chẳng hạn như đối sánh UPC và đối sánh mô tả sản phẩm để đơn giản nâng cao kết quả chứ không phải dựa vào. 

Phù hợp tiêu đề sản phẩm với xử lý ngôn ngữ tự nhiên

Chúng tôi đã xây dựng phần mềm so khớp tiêu đề sản phẩm của mình bằng cách sử dụng các mô hình NLP phổ biến như GPT-3, BERT và SBERT để tìm hiểu mối quan hệ giữa các tính năng ngôn ngữ tiêu đề khác nhau, thuộc tính tiêu đề như tên thương hiệu, tên sản phẩm, loại, v.v. các mô hình vượt trội hơn nhiều so với đối sánh mờ và các phương pháp tiếp cận dựa trên quy tắc khác và được chứng minh là có thể mở rộng quy mô dễ dàng với phương sai và nhiễu dữ liệu mới. 

Phù hợp giữa: Garmin nuvi 2699LMTHD – định vị GPS – ô tô 6.1 in nuvi 2699LMTHD Thiết Bị Định Vị GPS Di Động Cho Ô Tô

Kết quả này từ phần mềm NLP cho thấy một vài điều quan trọng:

  • Từ dừng và ký tự không ảnh hưởng đến khả năng khớp hai tiêu đề sản phẩm của chúng tôi
  • Mô hình có thể xác định các từ trong tiêu đề bất kể thứ tự hoặc bất kỳ từ nhiễu nào là chúng. 
  • Chúng tôi không bắt buộc phải có tên thương hiệu để tìm kết quả phù hợp hoặc từ chối kết quả phù hợp. 
  • Thuộc tính sản phẩm không bắt buộc (kích thước, chiều dài) trong mỗi sản phẩm chúng tôi đang so sánh và không nhất thiết phải cùng loại. 

Mô hình tiêu đề sản phẩm chọn ra những khác biệt nhỏ nhưng quan trọng giữa các kích thước vùng chứa được coi là các SKU khác nhau trong cơ sở dữ liệu sản phẩm. Trong ví dụ thứ hai, chúng ta thấy có rất nhiều bộ phận chuyển động – số lượng chai khác nhau và nhiễu dữ liệu phi cấu trúc nhưng vẫn là một kết hợp dễ dàng. 

Tinh chỉnh cho trường hợp sử dụng sản xuất

Phần mềm so khớp tiêu đề sản phẩm này có thể được tinh chỉnh trên dữ liệu sản phẩm thực tế của một cửa hàng bán lẻ hoặc thương hiệu thương mại điện tử để nâng cao độ chính xác so với các sản phẩm khác, phù hợp với trường hợp sử dụng cụ thể của bạn. Mức độ tùy chỉnh này khả dụng nhờ kiến ​​trúc mô hình ngôn ngữ được sử dụng để xây dựng trình so khớp tiêu đề sản phẩm, thay vì sử dụng các trình so khớp mờ ảo hoặc mô hình trích xuất thực thể. Khả năng tinh chỉnh kiến ​​trúc cho dữ liệu của một công ty cụ thể cho phép mở rộng quy mô tốt hơn cũng như dễ dàng điều chỉnh theo những thay đổi trong dữ liệu phi cấu trúc khi bạn thêm nhiều sản phẩm hoặc nguồn hơn. 

Tính tương đối trong So sánh sản phẩm

Như bạn có thể đã nhận thấy, ý tưởng so khớp sản phẩm có thể hơi tương đối dựa trên trường hợp sử dụng mà bạn đang cố gắng đề cập. Nếu bạn đang tìm cách phân biệt sản phẩm dựa trên SKU, bạn sẽ muốn có kết quả khác nếu bạn đang cố gắng hiểu quy mô thị trường và sản phẩm của đối thủ cạnh tranh. 

Chẳng hạn, nếu bạn có hai tiêu đề sản phẩm sau:

Chios Mastiha Pack 60gr (2.11 oz) Kẹo cao su nước mắt nhỏ 100% kẹo cao su mastic tự nhiên từ những người trồng mastic tươi

Chios Mastiha Pack 25gr (0.88oz) Kẹo cao su nước mắt trung bình 100% kẹo cao su mastic tự nhiên từ người trồng mastic tươi

Bạn có thể coi chúng không giống nhau dựa trên ý tưởng rằng chúng có hai SKU khác nhau trong cùng một cửa hàng, nhưng cũng có thể coi chúng giống nhau dựa trên ý tưởng cả hai đều là Mastic Gum. Nếu bây giờ chúng tôi đưa tiêu đề sản phẩm này vào hỗn hợp:

Horbaach Mastic Gum 1500mg 120 Viên | Không biến đổi gen & không chứa gluten

Chúng ta phải quyết định trước xem mình đang khớp với sản phẩm nào. Đây rõ ràng là sản phẩm của đối thủ cạnh tranh và có mã UPC khác, nhưng nó vẫn là Mastic Gum, và nếu chúng ta chỉ đang tìm kiếm các sản phẩm cùng loại thì đây là một sự khớp. Có rất nhiều điều cần cân nhắc khi thiết kế hệ thống khớp dữ liệu sản phẩm.

Khi bạn đang sử dụng công cụ khớp tiêu đề sản phẩm dựa trên NLP, mức độ linh hoạt này sẽ trở nên dễ dàng. Chúng tôi chỉ đơn giản là tinh chỉnh kiến ​​trúc của mình cho trường hợp sử dụng của bạn bất kể điều gì bạn cho là “phù hợp” và tối ưu hóa theo hướng đó. Mức độ linh hoạt này là yếu tố thay đổi cuộc chơi khi tìm cách sử dụng cùng một kiến ​​trúc cho nhiều trường hợp sử dụng khác nhau trong một tổ chức mà vẫn đạt độ chính xác cao.

Đường ống dựa trên SKU của chúng tôi coi điều này là không phù hợp.

Khai thác dữ liệu sản phẩm

Sau khi chúng tôi đã khớp tiêu đề sản phẩm và hiểu rõ về phương sai dữ liệu bán hàng nội bộ của chúng tôi hoặc dữ liệu sản phẩm của đối thủ cạnh tranh, chúng tôi có thể sử dụng mô hình phân loại sản phẩm hoặc các công cụ trích xuất thuộc tính dựa trên NLP để điền vào bất kỳ khoảng trống dữ liệu nào chúng tôi có, chẳng hạn như kích thước sản phẩm, tên nhà sản xuất và thuộc tính sản phẩm tự động. Các đường ống này sử dụng cùng một kiến ​​trúc như sản phẩm phù hợp của chúng tôi để có thể dễ dàng tích hợp chúng. 

Cải thiện phân loại sản phẩm của bạn

Ví dụ về tạo danh mục và thẻ sản phẩm từ mô hình GPT-3 của chúng tôi.

Với công cụ đối sánh tiêu đề sản phẩm, bạn có thể cải thiện sự rõ ràng của phân loại của mình bằng cách kết hợp nhiều thuộc tính sản phẩm phù hợp với nhau thành một danh mục duy nhất. Điều này làm sạch rất nhiều và chuẩn hóa các thuộc tính tạo nên hệ thống phân loại của bạn.  

GIGABYTE – Máy tính xách tay chơi game 15.6″ FHD IPS 144Hz – i5-11400H – 16GB – SSD NVIDIA GeForce RTX 3050 512 GB

15.6″ Notebook – i5-11400H – 16GB – GeForce RTX 3050 512 GB Màu đen 6494784

Hiểu rằng cả hai đều là cùng một sản phẩm cho phép bạn điền vào bất kỳ khoảng trống nào, chẳng hạn như đặt “Máy tính xách tay” và “Máy tính xách tay” trong cùng một danh mục, “NVIDIA” là nhà sản xuất cho cả hai sản phẩm, v.v. Điều này cho phép bạn tìm các sản phẩm bị phân loại sai và điền vào bất kỳ khoảng trống nào. 

Hiểu dữ liệu sản phẩm là chìa khóa

Bạn nghĩ rằng việc khớp tiêu đề sản phẩm có thể giúp bạn hiểu dữ liệu sản phẩm và làm sạch thông tin bán hàng của mình? Hãy lên lịch demo ngay hôm nay tại Chiều rộng.ai

Matt Payne là người sáng lập và giám đốc điều hành của Chiều rộng.ai. Width.ai là một công ty tư vấn máy học tập trung vào việc xây dựng các ứng dụng dựa trên học sâu với khách hàng trên SaaS, quản lý tài sản, nguồn nhân lực và tự động hóa tiếp thị. Width.ai hiện là công ty hàng đầu trong việc xây dựng và tư vấn về các sản phẩm GPT-3 cấp sản xuất và đã viết một số báo cáo nghiên cứu chuyên sâu cũng như đánh giá kỹ thuật về việc sử dụng tài nguyên hiện đại này.