رطم الجاهزة مقابل نماذج التعلم الآلي المخصصة؟ - اتحدوا
اتصل بنا للحصول على مزيد من المعلومات
دروس متقدمة في الذكاء الاصطناعي:

منظمة العفو الدولية 101

الجاهزة مقابل نماذج التعلم الآلي المخصصة؟

mm

تم النشر

 on

على الرف مقابل النماذج المخصصة

متى يكون البناء أفضل من شراء حل جاهز؟

يمكن للشركات الانخراط في أساليب مختلفة لتطوير النماذج. بدءًا من خدمات ML المُدارة بالكامل ، وصولاً إلى النماذج المخصصة. اعتمادًا على متطلبات العمل والخبرة المتاحة وقيود التخطيط ، يجب عليهم الاختيار: هل يجب عليهم تطوير حلول مخصصة من البداية؟ أم يجب عليهم اختيار خدمة جاهزة؟

بالنسبة لجميع مراحل أعباء عمل تعلم الآلة، يجب اتخاذ قرار بشأن كيفية تناسب قطع اللغز المختلفة معًا. بدءًا من جمع البيانات وإعدادها وتصورها، وصولاً إلى هندسة الميزات والتدريب النموذجي والتقييم، يسأل مهندسو التعلم الآلي أنفسهم مرارًا وتكرارًا نفس السؤال: هل سيكون حلاً مخصصًا يتم تنفيذه ومكتوبًا ومطورًا من الصفر؟ أم أنها ستكون خدمة جاهزة؟

ولكن متى يكون البناء أفضل من شراء حل جاهز؟ العوامل الرئيسية التي تميز النهجين: جهود المعالجة المسبقة ، وسرعة التطوير ، والخبرة المطلوبة.

الأشياء التي يجب مراعاتها عند تحديد استخدام نماذج التعلم الآلي الجاهزة أو المخصصة؟

جهود المعالجة المسبقة

تواجه مشاريع ML جميع أنواع التحديات ، ولكن ربما يكون التحدي الأكبر هو توافر بيانات التدريب. يمكن أن يؤدي نقص بيانات التدريب إلى إيقاف المشروع قبل أن يبدأ. قبل أن يبدأ المشروع ، يمكن أن يواجه تكاليف معالجة مسبقة كبيرة من جمع البيانات ، ووضع العلامات على البيانات ، والتنظيف ، وجهود المعالجة المسبقة. هذا هو الفخ المعروف الذي يفشل فيه العديد من مشاريع غسل الأموال: تنتهي المعالجة المسبقة بأخذ 80٪ من الموارد المخصصة ، في حين لا يتبقى سوى القليل من الموارد للتدريب والتقييم الفعلي للنموذج.

تخفف الحلول الجاهزة من إجهاد وآلام جهود المعالجة المسبقة. لقد تم تصميمها لأداء العمليات الأكثر شيوعًا مع القليل من التكوين المطلوب. أفضل شيء عنها هو: وجود حلول جاهزة لجميع مراحل أعباء عمل ML.

من ناحية أخرى ، عادة ما تتطلب عمليات التنفيذ المخصصة المزيد من جهود المعالجة المسبقة. هذا لا يعني أنه يجب استبعادهم تمامًا: لا يزال يتعين عليهم ضبط مرحلة معينة من ML وفقًا لتفاصيل المشكلة التي يتم حلها. قد تتطلب مجموعة البيانات المتسخة بشكل خاص نوعًا خاصًا من قواعد التنظيف. في الوقت نفسه ، قد تتطلب مجموعة ميزات محددة هندسة ميزات مخصصة ، تمامًا كما قد تتطلب البنى العصبية تعديلات طفيفة. في هذه الحالة ، من المرجح أن تغطي الحلول المخصصة المبنية من البداية جميع الاحتياجات.

سرعة التطوير 

تركز الحلول الجاهزة على التكوين بدلاً من التنفيذ. بدلا من تخصيص الموارد لمعرفة ماذا يجب أن يتم ذلك ، ستركز فرق ML كيف قطع اللغز المختلفة سوف تتناسب مع بعضها البعض. يسمح هذا النهج للشركات والباحثين والمهندسين بتنفيذ النماذج الأولية وبراهين المفهوم بسرعة. بدلاً من إعادة اختراع العجلة ، تتيح الحلول الجاهزة الاستفادة من المعرفة الحالية ، وبالتالي توفير وقت التطوير.

من المعروف أن الحلول المخصصة التي يتم تنفيذها من البداية تكون أبطأ بكثير في سرعة تطوير wrt. هذا بسبب احتياجات الصيانة المتزايدة: يجب على المهندسين اكتشاف كلا النوعين ماذا و كيف من الحل. وبالمثل ، كلما كان الحل أكثر تعقيدًا ، زادت الحاجة إلى موارد الوقت لضمان قابلية التوسع وتوافره أثناء الإنتاج. من هذا المنظور ، تكون الحلول المصممة حسب الطلب والجهود الزمنية متناسبة بشكل مباشر: فكلما كان الحل أكثر تعقيدًا ، زاد الوقت الذي يتطلبه.

ومع ذلك، عادةً ما تكون الحقيقة في مكان ما في المنتصف: ستتم إعادة هيكلة قاعدة التعليمات البرمجية الموجودة وتكييفها مع احتياجات المشروع الحالي. هذا هو الحال مع نهج التعلم النقلي المعروف للتدريب النموذجي.

الاختصاص

مثلما توجد طبقات متعددة يتم فيها التعلم الآلي ، هناك مستويات متعددة من الخبرة يمكن من خلالها تطوير نماذج ML ، بدءًا من الواجهات الخالية من التعليمات البرمجية وصولاً إلى بناء النماذج من البداية.

توجد حلول جاهزة تتطلب خبرة قليلة جدًا في التعلم الآلي. من خلال استخدام واجهات بديهية وحتى مناهج السحب والإفلات ، أصبح الأمر بسيطًا للغاية لأي شخص (من محللي الأعمال إلى مهندسي البرمجيات) لبناء ونشر نوع من نماذج التعلم الآلي. في حين أن هذا النهج البسيط لتطوير النموذج قد يعمل لأغراض النماذج الأولية ، فمن غير المرجح أن يلبي متطلبات أنظمة الإنتاج.

لا تزال الخبرة مطلوبة لتكوين الحلول الجاهزة في الإنتاج وإعدادها وصيانتها. تعد الحلول البديلة ، وتصحيحات التعليمات البرمجية ، والاتصال بواجهات API المختلفة ، والتعامل مع مشكلات النشر من المهام الشائعة المطلوبة لضمان أداء النماذج في بيئات الإنتاج.

عادة ما يتم تنفيذ الحلول المصممة حسب الطلب على مستوى البنية التحتية ولا توجد طريقة للتغلب عليها: الخبرة مطلوبة بالتأكيد. اعتمادًا على حجم الشركة وأهداف المشروع ، قد تكون هناك حاجة إلى فرق متعددة التخصصات للحفاظ على أنظمة الإنتاج. يجتمع علماء البيانات ومهندسو ML ومحللو الأعمال معًا لفهم نتائج الاستدلال والحفاظ على نماذج الإنتاج.

ماذا يجب أن تستخدم: جاهز أم نموذج تعلم آلي مخصص؟

سيتم بناء حل ML من العديد من المكونات والخدمات الفردية التي يجب أن تتضافر معًا كحل متماسك. لا يتعلق الأمر أبدًا بالذهاب إلى مخصص بنسبة 100٪ أو الخروج من الرف بنسبة 100٪ نظرًا لأن مشاكل العمل المختلفة تتطلب حلولًا مختلفة. في كثير من الأحيان ، يتم إنشاء الحلول القائمة على ML من خلال مزيج من الاثنين: الخدمات الجاهزة لاستخراج رؤى عامة ، جنبًا إلى جنب مع النماذج المخصصة لزيادة الدقة ونمذجة المعرفة الخاصة بالمجال.

تتمثل الحيلة في معرفة وقت تنفيذ الحلول المخصصة من البداية وأي أجزاء من المشروع يمكنها الاستفادة من مزايا الخدمات الجاهزة. يعتمد هذا بشكل كبير على نوع المشكلة التي يتم معالجتها ، ومتطلبات العمل ، والبيانات المتاحة ، والقيود العامة لبيئة التطوير.

لمعرفة المزيد عن اتجاهات الذكاء الاصطناعي والتكنولوجيا ، انظر جوش ميرامانت، الرئيس التنفيذي لشركة بلو أورانج ديجيتال للحلول القائمة على البيانات لشركة سلسلة التوريدأتمتة وثائق الرعاية الصحية، و اكثر.

قد يعجبك ايضا:

استخدم البرمجة اللغوية العصبية لتصنيف التعليقات على وسائل التواصل الاجتماعي

كيف يتم تحسين معالجة اللغة من خلال نموذج BERT مفتوح المصدر من Google  

جوش ميرامانت هو الرئيس التنفيذي ومؤسس بلو أورانج ديجيتال، وكالة علوم البيانات والتعلم الآلي الأعلى مرتبة ولها مكاتب في مدينة نيويورك وواشنطن العاصمة. Miramant هو متحدث شهير ومستقبلي ومستشار استراتيجي للأعمال والتكنولوجيا لشركات المؤسسات والشركات الناشئة. إنه يساعد المؤسسات على تحسين وأتمتة أعمالهم ، وتنفيذ تقنيات تحليلية قائمة على البيانات ، وفهم الآثار المترتبة على التقنيات الجديدة مثل الذكاء الاصطناعي ، والبيانات الضخمة ، وإنترنت الأشياء.