Connect with us

ألبابا تطوير محرك بحث محاكاة الذكاء الاصطناعي الذي يستخدم بيانات حية

الذكاء الاصطناعي

ألبابا تطوير محرك بحث محاكاة الذكاء الاصطناعي الذي يستخدم بيانات حية

mm

في сотрудاسة مع الباحثين الأكاديميين في الصين، قامت ألبابا بتطوير محرك بحث محاكاة الذكاء الاصطناعي الذي يستخدم بيانات العالم الحقيقي من البنية التحتية الحية للشركة العملاقة للتجارة الإلكترونية من أجل تطوير نماذج ترتيب جديدة لا تعوقها المعلومات “التاريخية” أو غير المتوافقة.

المحرك، الذي يسمى AESim، يمثل الإعلان الثاني الكبير في أسبوع للاعتراف بالحاجة إلى أنظمة الذكاء الاصطناعي لتكون قادرة على تقييم ودمج البيانات الحية والحالية، بدلاً من مجرد تجريد البيانات المتاحة في وقت تدريب النموذج. كان الإعلان السابق من Facebook، الذي كشف عن BlenderBot 2.0، نموذج لغة مفتوح المصدر يحتوي على استطلاع مباشر للنتائج البحثية على الإنترنت استجابة للاستفسارات.

الهدف من مشروع AESim هو توفير بيئة تجريبية لتطوير حلول وخيوط ونمذجة جديدة للتعلم-الترتيب (LTR) في أنظمة استرجاع المعلومات التجارية. عند اختبار الإطار، وجد الباحثون أنه يعكس أداءًا trực tuyến داخل معايير ومقاييس مفيدة وفعّالة.

يؤكد مؤلفو الورقة، بمن فيهم أربعة ممثلين من جامعة نانجينغ وأربعة من قسم البحث في ألبابا، أن نهجًا جديدًا للتحاكي LTR كان ضروريًا لسببين: فشل المبادرات المماثلة الحديثة في التعلم العميق في إنشاء تقنيات قابلة للتكرار، مع وجود خيوط متعددة تفتقر إلى القدرة على الترجمة إلى أنظمة حقيقية؛ وعدم وجود قابلية النقل، من حيث أداء بيانات التدريب مقابل بيانات جديدة في الحالات التي كانت فيها الأنظمة أكثر فاعلية في البداية.

الانتقال إلى الوضع الحقيقي

تطالب الورقة بأن AESim هو منصة محاكاة تجارية إلكترونية أولى تستند إلى بيانات المستخدمين الحية والفعّالة، ويمكنها أن تعكس الأداء trực tuyến بدقة من خلال استخدام بيانات حية، وتوفر ساحة تدريب مفتوحة للمحققين لاحقًا لتقييم منهجيات وابتكارات LTR.

يتضمن النموذج نهجًا جديدًا لschema نموذجي لمحركات البحث الصناعية: المرحلة الأولى هي استرجاع العناصر المرتبطة بالاستفسار الذي قدمه المستخدم، والتي لا يتم تقديمها في البداية إلى المستخدم، ولكن يتم فرزها أولًا بواسطة نموذج LTR موزون. ثم يتم تمرير النتائج المفرزة عبر مرشح يأخذ في الاعتبار أهداف الشركة في توفير النتائج – أهداف قد تشمل عوامل الإعلان والتنوع.

هيكل AESim

في AESim، يتم استبدال الاستفسارات بمؤشرات الفئة، مما يسمح للنظام باسترجاع عناصر من فهرس الفئة قبل تمريرها إلى إعادة ترتيب مخصصة تنتج القائمة النهائية. على الرغم من أن الإطار يسمح للمحققين بدراسة تأثير الترتيب المشترك عبر عدة نماذج، يتم ترك هذا الجانب للعمل المستقبلي، والتنفيذ الحالي يبحث تلقائيًا عن التقييم المثالي بناءً على نموذج واحد.

<img class="size-full wp-image-176705" src="https://www.unite.ai/wp-content/uploads/2021/07/architecture-aesim.jpg" alt="هيكل AESim

.” width=”1200″ height=”452″ /> هيكل AESim. مصدر: https://arxiv.org/pdf/2107.07693.pdf

يخلق AESim تضمينًا (تمثيلات افتراضية في هيكل التعلم الآلي) التي تضمّن “المستخدم الافتراضي” وطلبه، ويتضمن نهجًا لشبكة الواسطين المعادية مع جزاء التدرج (WGAN-GP).

يتكون الهيكل من قاعدة بيانات تحتوي على ملايين العناصر المتاحة المفرزة حسب الفئة، ونظام ترتيب مخصص، ووحدة ملاحظات، ومجموعات بيانات مُحكمة تم إنشاؤها بواسطة مكونات الشبكة المعادية. وحدة الملاحظات هي المرحلة النهائية في سير العمل، قادرة على تقييم أداء أحدث نسخة من نموذج الترتيب.

التعلم التقليدي المعادي

为了 نمذجة منطق اتخاذ القرار لوحدة “المستخدم الافتراضي”، يتم تدريب وحدة الملاحظات (التي توفر النتائج النهائية) من خلال التعلم التقليدي المعادي (GAIL)، وهو نظرية提出了 لأول مرة من قبل باحثين في جامعة ستانفورد في عام 2016. GAIL هو نموذج خالي من السياسة يسمح للنظام بتطوير سياسة مباشرة من البيانات من خلال التعلم التقليدي.

المجموعات التدريبية التي طوّرها AESim هي أساسًا نفس مجموعات البيانات الثابتة التاريخية المستخدمة في نماذج التعلم الإشرافي المماثلة لنظم مماثلة. الفرق مع AESim هو أنه لا يعتمد على مجموعة بيانات ثابتة للاستجابة، ولا يعوقه ترتيب العناصر الذي تم إنشاؤه في وقت تجميع بيانات التدريب القديمة.

الجانب التوليدي في AESim يركز على إنشاء مستخدم افتراضي من خلال WGAN-GP، الذي يخرج سمات مستخدم وطلب وهمية، ثم يحاول التمييز بين هذه البيانات الوهمية والبيانات الحقيقية للمستخدم المقدمة من الشبكات الحية التي يصل إليها AESim.

تمثيل سحابي للمستخدمين الوهميين والحقيقيين في محاكاة محرك بحث صناعي نموذجي.

تمثيل سحابي للمستخدمين الوهميين والحقيقيين في محاكاة محرك بحث صناعي نموذجي.

الاختبار

قامت الباحثون باختبار AESim من خلال نشر نموذج زوجي ونموذج نقطي ونموذج ListMLE في النظام، كل منها كان يجب أن يخدم شريحة عشوائية غير متداخلة من استفسارات البحث في سياق خوارزمية إعادة الترتيب.

في هذه المرحلة، يُختبر AESim بالبيانات الحية المتغيرة بسرعة والمتنوعة بنفس الطريقة التي قد يُختبر بها نموذج اللغة الجديد من Facebook. لذلك، تم النظر في النتائج في ضوء الأداء العام.

تم اختبار AESim لمدة عشرة أيام، وأظهرت نتائج متماسكة بشكل ملحوظ عبر ثلاثة نماذج، على الرغم من أن الباحثين لاحظوا أن اختبارًا إضافيًا لنموذج سياق وثيقة اللغة (DLCM) أدى أداءً سيئًا في البيئة غير المتصلة، ولكن أداءً جيدًا في البيئة الحية، ويقرّون بأن النظام سوف يظهر فجوات مع نظيره الحقيقي، اعتمادًا على التكوين والنماذج التي يتم اختبارها.

كاتب في تعلم الآلة، متخصص في مجال 합성 الصور البشرية. السابق رئيس محتوى البحث في Metaphysic.ai.
الsite الشخصي: martinanderson.ai
التواصل: [email protected]
تويتر: @manders_ai