اتصل بنا للحصول على مزيد من المعلومات

تطور التدريب على نماذج الذكاء الاصطناعي: ما وراء الحجم إلى الكفاءة

قاده التفكير

تطور التدريب على نماذج الذكاء الاصطناعي: ما وراء الحجم إلى الكفاءة

mm

في مشهد الذكاء الاصطناعي سريع التطور، فإن النهج التقليدي لتعزيز نماذج اللغة من خلال مجرد زيادات في حجم النموذج يخضع لتحول محوري. ويؤكد هذا التحول على اتباع نهج أكثر استراتيجية يركز على البيانات، كما يتضح من التطورات الأخيرة في نماذج مثل لاما 3.

البيانات هي كل ما تحتاجه

تاريخياً، كان الاعتقاد السائد في تطوير قدرات الذكاء الاصطناعي هو أن الأكبر هو الأفضل.

في الماضي، شهدنا زيادة هائلة في قدرات التعلم العميق بمجرد إضافة طبقات جديدة إلى الشبكات العصبية. خوارزميات وتطبيقات مثل التعرف على الصور، والتي كانت ممكنة نظريًا فقط قبل ظهور الذكاء الاصطناعي، أصبحت الآن متاحة. التعلم العميق، وسرعان ما أصبحت مقبولة على نطاق واسع. أدى تطوير البطاقات الرسومية إلى تضخيم هذا الاتجاه بشكل أكبر، مما مكّن النماذج الأكبر حجمًا من العمل بكفاءة متزايدة. وقد انتقل هذا الاتجاه إلى الضجيج الحالي لنموذج اللغة الكبير أيضًا.

نصادف دوريًا إعلانات من شركات الذكاء الاصطناعي الكبرى التي تطلق نماذج تحتوي على عشرات أو حتى مئات المليارات من المعلمات. من السهل فهم الأساس المنطقي: كلما زادت المعلمات التي يمتلكها النموذج، زادت كفاءته. ومع ذلك، فقد وصلت طريقة القوة الغاشمة هذه للتوسع إلى نقطة تناقص العائدات، لا سيما عند النظر في فعالية تكلفة هذه النماذج في التطبيقات العملية. إعلان ميتا الأخير عن نهج Llama3، الذي يستخدم 8 مليارات معلمة ولكنه مُثري بـ 6-7 أضعاف كمية بيانات التدريب عالية الجودة، يطابق - وفي بعض السيناريوهات، يتجاوز - فعالية النماذج السابقة مثل GPT3.5، التي تضم أكثر من 100 مليار معلمة. يمثل هذا تحولًا مهمًا في قانون التوسع لنماذج اللغة، حيث تبدأ جودة وكمية البيانات في أخذ الأسبقية على الحجم الهائل.

التكلفة مقابل الأداء: توازن دقيق

مع انتقال نماذج الذكاء الاصطناعي من التطوير إلى الاستخدام العملي، فإن تأثيرها الاقتصادي، وخاصة التكاليف التشغيلية المرتفعة للنماذج واسعة النطاق، أصبح ذا أهمية متزايدة. غالبًا ما تتجاوز هذه التكاليف نفقات التدريب الأولية، مما يؤكد الحاجة إلى نهج التنمية المستدامة الذي يعطي الأولوية لاستخدام البيانات بكفاءة على حساب توسيع حجم النموذج. استراتيجيات مثل زيادة البيانات و نقل التعلم يمكن أن يعزز مجموعات البيانات ويقلل الحاجة إلى إعادة التدريب على نطاق واسع. يؤدي تبسيط النماذج من خلال اختيار الميزات وتقليل الأبعاد إلى تعزيز الكفاءة الحسابية وخفض التكاليف. تعمل تقنيات مثل التسرب والتوقف المبكر على تحسين التعميم، مما يسمح للنماذج بأداء فعال مع بيانات أقل. تعمل استراتيجيات النشر البديلة مثل حوسبة الحافة على تقليل الاعتماد على البنية التحتية السحابية المكلفة، بينما توفر الحوسبة بدون خادم استخدامًا قابلاً للتطوير وفعالاً من حيث التكلفة للموارد. من خلال التركيز على التطوير المرتكز على البيانات واستكشاف طرق النشر الاقتصادية، يمكن للمؤسسات إنشاء نظام بيئي أكثر استدامة للذكاء الاصطناعي يوازن بين الأداء وفعالية التكلفة.

تناقص عوائد النماذج الأكبر حجما

يشهد مشهد تطوير الذكاء الاصطناعي تحولًا نموذجيًا، مع التركيز المتزايد على الاستخدام الفعال للبيانات وتحسين النماذج. تعتمد شركات الذكاء الاصطناعي المركزية تقليديًا على إنشاء نماذج أكبر بشكل متزايد لتحقيق أحدث النتائج. ومع ذلك، أصبحت هذه الاستراتيجية غير مستدامة على نحو متزايد، سواء من حيث الموارد الحسابية أو قابلية التوسع.

من ناحية أخرى، يقدم الذكاء الاصطناعي اللامركزي مجموعة مختلفة من التحديات والفرص. تتمتع شبكات blockchain اللامركزية، والتي تشكل أساس الذكاء الاصطناعي اللامركزي، بتصميم مختلف جذريًا مقارنة بشركات الذكاء الاصطناعي المركزية. وهذا يجعل من الصعب على مشاريع الذكاء الاصطناعي اللامركزية التنافس مع الكيانات المركزية من حيث توسيع نطاق النماذج الأكبر مع الحفاظ على الكفاءة في العمليات اللامركزية.

هذا هو المكان الذي يمكن للمجتمعات اللامركزية أن تزيد من إمكاناتها إلى أقصى حد وتحتل مكانة متميزة في مشهد الذكاء الاصطناعي. ومن خلال الاستفادة من الذكاء الجماعي والموارد، يمكن للمجتمعات اللامركزية تطوير ونشر نماذج الذكاء الاصطناعي المتطورة التي تتسم بالكفاءة وقابلة للتطوير. وهذا سيمكنهم من التنافس بفعالية مع شركات الذكاء الاصطناعي المركزية ودفع مستقبل تطوير الذكاء الاصطناعي.

التطلع إلى المستقبل: الطريق إلى التنمية المستدامة للذكاء الاصطناعي

وينبغي أن يركز مسار تطوير الذكاء الاصطناعي في المستقبل على إنشاء نماذج ليست مبتكرة فحسب، بل تكاملية واقتصادية أيضًا. وينبغي أن يتحول التركيز نحو الأنظمة التي يمكنها تحقيق مستويات عالية من الدقة والمنفعة بتكاليف يمكن التحكم فيها واستخدام الموارد. ولن تضمن مثل هذه الإستراتيجية قابلية التوسع في تقنيات الذكاء الاصطناعي فحسب، بل ستضمن أيضًا إمكانية الوصول إليها واستدامتها على المدى الطويل.

مع نضوج مجال الذكاء الاصطناعي، يجب أن تتطور استراتيجيات تطوير الذكاء الاصطناعي وفقًا لذلك. إن التحول من تقييم الحجم إلى إعطاء الأولوية للكفاءة والفعالية من حيث التكلفة في التدريب النموذجي ليس مجرد خيار تقني ولكنه ضرورة استراتيجية ستحدد الجيل القادم من تطبيقات الذكاء الاصطناعي. ومن المرجح أن يحفز هذا النهج عصرًا جديدًا من الابتكار، حيث يكون تطوير الذكاء الاصطناعي مدفوعًا بممارسات ذكية ومستدامة تعد بتبني أوسع نطاقًا وتأثيرًا أكبر.​​​​​​​​​​​​​​

جياهاو صن، المؤسس والرئيس التنفيذي لشركة FLock.io، هو خريج جامعة أكسفورد وهو خبير في الذكاء الاصطناعي و blockchain. ومن خلال أدواره السابقة كمدير الذكاء الاصطناعي في Royal Bank of Canada وزميل أبحاث الذكاء الاصطناعي في Imperial College London، أسس FLock.io للتركيز على حلول الذكاء الاصطناعي التي تركز على الخصوصية. من خلال قيادته، يقود FLock.io التطورات في التدريب على نماذج الذكاء الاصطناعي الآمنة والتعاونية ونشرها، مما يُظهر تفانيه في استخدام التكنولوجيا من أجل التقدم المجتمعي.