الذكاء الاصطناعي

استخدام التعليقات لإنشاء نظام توصية يعمل

Published February 1, 2022

Updated April 28, 2026

Martin Anderson

إذا كنت قد اشتريت منتجًا عبر الإنترنت وتبهرت بلا مبالاة وعدم صلاحية عناصر “المتعلقة” التي تطاردها عملية الشراء و بعد البيع، فكرت بالفعل أن أنظمة التوصية الشهيرة والمعروفة تميل إلى أن تفشل في فهم العلاقات بين المشتريات المحتملة.

إذا اشتريت منتجًا غير محتمل وغير متكرر، مثل الفرن، فإن التوصيات لفرن آخر قد تكون زائدة عن الحاجة، على الرغم من أن أسوأ أنظمة التوصية تفشل في الاعتراف بذلك. في عام 2000، على سبيل المثال، أنشأت نظام التوصية من TiVO جدلاً مبكرًا في هذا القطاع من خلال إعادة تعيين الجنس المتصور للمستخدم، الذي سعى بعد ذلك إلى “إعادة تدوين” ملفه الشخصي من خلال اختيار أفلام الحرب – نهج قاسي لتعديل الخوارزمية.

وليس عليك حتى أن تشتري أي شيء في (على سبيل المثال) أمازون، أو تشاهد فيلمًا على منصة بث شائعة، حتى تبدأ خوارزميات التوصية الجائعة بالمعلومات في السير في الطريق الخطأ؛ البحث والبقاء والنقر على صفحات “التفاصيل” كافٍ، ومن المحتمل أن يتم نشر هذه المعلومات الشحيحة (والتي قد تكون خاطئة) عبر جلسات التصفح المستقبلية على المنصة.

محاولة جعل نظام التوصية ينسى

أحيانًا من الممكن التدخل: يوفر نتفليكس نظام “إبهام لأعلى / لأسفل” الذي من المفترض أن يساعد خوارزميات التعلم الآلي على إزالة مفاهيم و كلمات معينة من ملفك الشخصي للتوصية (على الرغم من أن فعاليتها تم تساؤلها، وتبقى أكثر سهولة لتطوير خوارزمية توصية مخصصة من الصفر من إزالة Ontologies غير مرغوب فيها)، في حين يسمح لك أمازون بإزالة العناوين من سجل العميل، مما يجب أن يقلل من أي مجالات غير مرغوب فيها التي اخترقت توصياتك.

يحتوي Hulu على ميزة مماثلة، في حين انسحبت HBO Max جزئيًا من أنظمة التوصية بالخوارزمية فقط، في مواجهة عيوبها الحالية.

لا تلمس أي من هذه الخبرات على مستوى المستهلك حتى الانتقادات الواسعة والمتزايدة لأنظمة التوصية على منصات الإعلان السلبية (حيث يحدث تغيير ملحوظ بسبب الغضب العام)، أو موضوع التوصيات الإعلامية الاجتماعية المحترقة، حيث تواجه مواقع مثل يوتيوب و تويتر و فيسبوك انتقادات لعدم صلاحية التوصيات أو حتى التوصيات التالفة.

لا يبدو أن الآلة تعرف ما نريده، إلا إذا كنا نريد العنصر المجاور الذي ظهر في بحثنا – حتى لو كان هذا العنصر في الأساس نسخة مكررة أو بديلة للعنصر الرئيسي الذي قد اشتريته للتو، بدلاً من شراء مكمل أو مساعد محتمل.

توصيات دقيقة مع بيانات المراجعة

يقدم تعاون بحثي جديد من الصين وأستراليا طريقةً جديدةً لمواجهة هذه التوصيات غير المناسبة، من خلال استخدام مراجعات المستخدمين الخارجية للحصول على فهم أفضل للعلاقات الحقيقية بين العناصر في جلسة تسوق. في الاختبارات، تفوقت الهيكلة على جميع الطرق الحالية المتقدمة، ووفرت أملًا لأنظمة التوصية التي لديها خريطة داخلية أفضل للعلاقات بين العناصر:

RI-GNN outperforms major competitors in terms of accuracy of relationships between items, performing best on sessions with more than five items. The system was tested against the Pet Supplies and Movies and TV datasets from Amazon Review Data (2018). Source: https://arxiv.org/pdf/2201.12532.pdf

إلى جانب ذلك، يعالج المشروع التحدي البارز لإنشاء توصيات حتى في الجلسات المجهولة، حيث لا يتوفر نظام التوصية على تفاصيل مساهمة من المستخدم، مثل سجل الشراء أو مراجعات المستخدم الخاصة لشراء سابقة.

الورقة الجديدة تسمى إعادة التفكير في الاعتماد المجاور في التوصيات القائمة على الجلسة، وهي تأتي من باحثين في جامعة Qilu للتكنولوجيا و معهد بكين للتكنولوجيا في الصين، و جامعة RMIT في ملبورن، و معهد الذكاء الاصطناعي الأسترالي في جامعة التكنولوجيا في سيدني.

ماذا بعد؟

المهمة الأساسية للتوصيات القائمة على الجلسة (SBR) هي تحديد “العنصر التالي” من العنصر الحالي، بناءً على علاقته المحسوبة مع العنصر الحالي. في المصطلحات العملية، يمكن أن يظهر هذا على شكل قائمة “العناصر المتعلقة” في صفحة عنصر لقفص طيور على موقع تجارة إلكترونية.

إذا كنت تشتري قفص طيور، ماذا قد تحتاج إليه؟ حسنًا، على الأقل، ستحتاج إلى طائر لوضع فيه – هذا اعتماد حقيقي. ومع ذلك، يتم عرض قفص الطيور في علم الوجود بضائع الحيوانات الأليفة، حيث لا تُباع الطيور. وعلى العكس، يقع طعام القط في نفس علم الوجود، على الرغم من أن إضافة وعاء طعام قط كتوصية مرتبطة بمنتج قفص طيور هو اعتماد خاطئ – ارتباط خاطئ ومضلل.

From the paper: true and false relationships between several items, visualized on the right as an inter-item graph.

كما هو الحال في كثير من casos في هياكل التعلم الآلي، فمن تحدي أن تقنع نظام التوصية بأن “كيانًا بعيدًا” (الطائر لا يظهر على الإطلاق في منتجات الحيوانات الأليفة) قد يكون له علاقة جوهرية و महतوة مع عنصر، في حين أن العناصر التي تكون في نفس الفئة، وقريبة في الوظيفة والمفهوم المركزي (مثل وعاء طعام القط) قد تكون متعامدة أو معاكسة مباشرة لشراء قيد النظر.

الطريقة الوحيدة لإنشاء هذه الخرائط بين “الكيانات غير المجاورة” هي من خلال إضفاء الطابع الجماعي على المشكلة، لأن العلاقات المذكورة هي جانب من تجربة الإنسان، ولا يمكن تخمينها برمجيًا، وربما تكون خارج النطاق المالي والمحدود لنهج التسمية التقليدية للبيانات، مثل آلة تورك الميكانيكية.

لذلك، استخدم الباحثون آليات معالجة اللغة الطبيعية (NLP) لاستخراج كلمات بارزة من مراجعات المنتج، واستخدموا التواتر من هذه التحليلات لإنشاء تركيبات قادرة على “مطابقة” عناصر ظاهرة غير مجاورة.

The architecture for Review-refined Inter-item Graph Neural Network (RI-GNN).

الهيكلة والبيانات

كما يشير_paper_ الجديد، استغلّت الأعمال السابقة من نفس النوع تاريخ المراجعة الخاص بالمستخدم لتوفير مخططات أولية. DeepCONN و RNS استخدما هذا النهج. ومع ذلك، هذا يهمل حقيقة أن المستخدم قد لا يكتب أي مراجعات، أو أي مراجعات ذات صلة بمنتج معين يقع “خارج نطاق” عادات شراءه المعتادة. بالإضافة إلى ذلك، هذا هو نهج “ال砂وق الأبيض”، لأنه يفترض أن المستخدم قد تعامل بالفعل مع النشاط بما يكفي لإنشاء حساب وتسجيل الدخول.

الشبكة العصبية الجرافية الموسعة (GNN) المقترحة من قبل الباحثين تأخذ نهجًا أكثر تحكمًا، تستمد الاعتماد الحقيقي a priori، بحيث، على ما يبدو، يمكن للمستخدم المجهول والمستخدم غير المسجل الدخول أن يختبر توصيات أكثر صلة مع الحد الأدنى من الإدخال المطلوب.

النظام المُحسّن بالمراجعة يُسمى شبكة عصبية جرافية بين العناصر المُحسّنة بالمراجعة (RI-GNN). اختبر الباحثونها ضد قاعدتي بيانات من أمازون، إمدادات الحيوانات الأليفة و الأفلام والتلفزيون. على الرغم من أن هذا يحل مشكلة توافر المراجعة بسهولة، فإن التنفيذ في البرية سيتطلب العثور على قاعدة بيانات مناسبة للمراجعات. يمكن أن تكون مصدر قاعدة بيانات مثل هذا أي شيء من المنشورات على شبكة اجتماعية إلى إجابات على Quora.

سوف تكون خرائط العلاقات عالية المستوى من هذا النوع قيمة لعدد من تطبيقات التعلم الآلي بخلاف أنظمة التوصية. العديد من المشاريع الحالية معوقة بسبب نقص الخرائط بين المجالات وداخلها بسبب التمويل والنطاق المحدودين، في حين أن الدافع التجاري لنظام توصية تجارة إلكترونية حقيقي ومستند إلى الحشد يمكن أن يملأ هذا الفجوة بشكل محتمل.

المقاييس والاختبار

اختبر المؤلفون RI-GNN ضد نسختين من كل قاعدة بيانات، كل منها يتكون من تاريخ شراء المستخدم ومراجعات عامة للمنتج. تم إزالة العناصر التي تظهر أقل من خمس مرات، وتم تقسيم تاريخ المستخدم إلى وحدات أسبوعية. تمت特色 النسخة الأولى من كل قاعدة بيانات جميع الجلسات التي تحتوي على أكثر من عنصر واحد، والثانية جميع الجلسات التي تحتوي على أكثر من خمسة عناصر.

استخدم المشروع P@K (الدقة) و MRR@K (معدل الرتبة العكسية المتوسط) لمقاييس التقييم. كانت الهياكل المتنافسة التي تم اختبارها: S-KNN؛ GRU4Rec؛ S-POP؛ STAMP؛ BERT4Rec؛ DHCN؛ GCE-GNN؛ SR-GNN؛ و NARM.

تم تدريب الإطار في دفعات من 100 على Adam بمعدل تعلم 0.001، مع ضبط عدد الموضوعات إلى 24 و 20، على التوالي، لـ إمدادات الحيوانات الأليفة و الأفلام والتلفزيون.

نشر لأول مرة في 1 فبراير 2022.