الذكاء الاصطناعي
لماذا يمثل نموذج Orca-2 للذكاء الاصطناعي من Microsoft خطوة كبيرة في مجال الذكاء الاصطناعي المستدام؟
على الرغم من التقدم الملحوظ الذي حققه الذكاء الاصطناعي في العقد الماضي، والذي يتضمن هزيمة أبطال البشر في ألعاب استراتيجية مثل الشطرنج والذهاب و التنبؤ بالبنية ثلاثية الأبعاد للبروتينات، التبني على نطاق واسع نماذج اللغات الكبيرة (LLMs) يدل على تحول نموذجي. وأصبحت هذه النماذج، التي تستعد لتحويل التفاعلات بين الإنسان والحاسوب، لا غنى عنها في مختلف القطاعات، بما في ذلك التعليم، وخدمة العملاء، واسترجاع المعلومات، وتطوير البرمجيات، والإعلام، والرعاية الصحية. ورغم أن هذه الخطوات التكنولوجية تفتح الباب أمام إنجازات علمية وتعزز النمو الصناعي، إلا أن هناك جانبًا سلبيًا ملحوظًا بالنسبة لكوكب الأرض.
تستهلك عملية التدريب والاستفادة من LLMs كمية هائلة من الطاقة، مما يؤدي إلى تأثير بيئي كبير يتسم بزيادة البصمة الكربونية وانبعاثات الغازات الدفيئة. كشفت دراسة حديثة من كلية المعلومات وعلوم الكمبيوتر في جامعة ماساتشوستس أمهيرست أن التدريب على ماجستير إدارة الأعمال يمكن أن ينبعث منه أكثر من 626,000 رطل من ثاني أكسيد الكربون، أي ما يعادل تقريبًا الانبعاثات طوال عمر خمس سيارات. وجدت شركة Hugging Face، وهي شركة ناشئة تعمل في مجال الذكاء الاصطناعي، أن تدريب BLOOM، وهو نموذج لغوي كبير تم إطلاقه في وقت سابق من العام، أدى إلى 25 طن متري من انبعاثات ثاني أكسيد الكربون. وبالمثل، يُراكم نموذج الذكاء الاصطناعي "مينا" من فيسبوك بصمة كربونية تُضاهي الأثر البيئي لقيادة سيارة لأكثر من ميل 240,000 طوال عملية التدريب الخاصة بها.
على الرغم من تدريب الحاصلين على ماجستير إدارة الأعمال، فإن الطلب على الحوسبة السحابية، وهو أمر بالغ الأهمية بالنسبة لحملة ماجستير القانون، يساهم الآن المزيد من الانبعاثات من صناعة الطيران بأكملها. يمكن لمركز بيانات واحد أن يستهلك قدرًا كبيرًا من الطاقة منازل 50,000. وتسلط دراسة أخرى الضوء على أن تدريب نموذج لغة واحد كبير يمكن أن يطلق الكثير ثاني أكسيد الكربون كخمس سيارات باستخدام الطاقة طوال حياتهم بأكملها. تشير التوقعات إلى أن انبعاثات الذكاء الاصطناعي سترتفع بنسبة 300% بحلول عام 2025، مما يؤكد الحاجة الملحة إلى تحقيق التوازن بين تقدم الذكاء الاصطناعي والمسؤولية البيئية وتحفيز المبادرات لجعل الذكاء الاصطناعي أكثر صداقة للبيئة. ولمعالجة التأثير البيئي السلبي لتطورات الذكاء الاصطناعي، يظهر الذكاء الاصطناعي المستدام كمجال حاسم للدراسة.
الذكاء الاصطناعي المستدام
يمثل الذكاء الاصطناعي المستدام نقلة نوعية في تطوير ونشر أنظمة الذكاء الاصطناعي، مع التركيز على تقليل التأثير البيئي، والاعتبارات الأخلاقية، والفوائد المجتمعية طويلة المدى. ويهدف هذا النهج إلى إنشاء أنظمة ذكية تتسم بالكفاءة في استخدام الطاقة، ومسؤولة بيئيًا، وتتوافق مع القيم الإنسانية. يركز الذكاء الاصطناعي المستدام على استخدام الطاقة النظيفة لأجهزة الكمبيوتر، والخوارزميات الذكية التي تستخدم طاقة أقل، واتباع المبادئ التوجيهية الأخلاقية لضمان اتخاذ قرارات عادلة وشفافة. ومن المهم أن نلاحظ أن هناك فرقا بين الذكاء الاصطناعي من أجل الاستدامة والذكاء الاصطناعي المستدام; قد يتضمن الأول استخدام الذكاء الاصطناعي لتحسين العمليات الحالية دون النظر بالضرورة إلى عواقبه البيئية أو المجتمعية، في حين يدمج الأخير بشكل فعال مبادئ الاستدامة في كل مرحلة من مراحل تطوير الذكاء الاصطناعي، بدءًا من التصميم وحتى النشر، لخلق تأثير إيجابي ودائم على الكوكب. مجتمع.
من LLMs إلى نماذج اللغات الصغيرة (SLMs)
سعيًا لتحقيق الذكاء الاصطناعي المستدام، تعمل Microsoft على تطوير نماذج اللغات الصغيرة (SLMs) لتتماشى مع قدرات نماذج اللغات الكبيرة (LLMs). في هذا الجهد، قدموا مؤخرا أوركا-2، مصممة لسبب مثل GPT-4. على عكس سابقتها، Orca-1، التي تضم 13 مليار معلمة، تحتوي Orca-2 على 7 مليارات معلمة باستخدام تقنيتين رئيسيتين.
- ضبط التعليمات: يتحسن Orca-2 من خلال التعلم من الأمثلة، وتعزيز جودة محتواه، وإمكانيات الإطلاق الصفري، ومهارات التفكير المنطقي عبر المهام المختلفة.
- ضبط الشرح: إدراكًا للقيود في ضبط التعليمات، يقدم Orca-2 ضبط الشرح. يتضمن ذلك إنشاء تفسيرات تفصيلية لنماذج المعلم، وإثراء إشارات الاستدلال، وتحسين الفهم العام.
يستخدم أوركا-2 هذه التقنيات لتحقيق استدلال عالي الكفاءة، يُضاهي ما يحققه طلاب ماجستير القانون (LLM) بمعايير أكثر بكثير. الفكرة الرئيسية هي تمكين النموذج من تحديد أفضل طريقة لحل مشكلة ما، سواءً بتقديم إجابة سريعة أو التفكير فيها خطوة بخطوة. تُطلق مايكروسوفت على هذه العملية اسم "الاستدلال الحذر".
لتدريب Orca-2، تقوم Microsoft بإنشاء مجموعة جديدة من بيانات التدريب باستخدام التعليقات التوضيحية لـ FLAN وOrca-1 ومجموعة بيانات Orca-2. يبدأون بأسئلة سهلة، ثم يضيفون بعض الأسئلة الصعبة، ثم يستخدمون البيانات من النماذج الناطقة لجعلها أكثر ذكاءً.
يخضع Orca-2 لتقييم شامل يغطي الاستدلال وإكمال النص والتأريض والصدق والسلامة. تظهر النتائج إمكانية تعزيز المنطق SLM من خلال التدريب المتخصص على البيانات الاصطناعية. على الرغم من بعض القيود، تظهر نماذج Orca-2 واعدة بإدخال تحسينات مستقبلية في الاستدلال والتحكم والسلامة، مما يثبت فعالية تطبيق البيانات الاصطناعية بشكل استراتيجي في تحسين النموذج بعد التدريب.
أهمية Orca-2 نحو الذكاء الاصطناعي المستدام
يُمثل أوركا-2 قفزة نوعية نحو الذكاء الاصطناعي المستدام، مُخالفًا الاعتقاد السائد بأن النماذج الأكبر حجمًا، باستهلاكها الكبير للطاقة، هي وحدها القادرة على تطوير قدرات الذكاء الاصطناعي. يُقدم هذا النموذج اللغوي الصغير منظورًا بديلًا، مُشيرًا إلى أن تحقيق التميز في نماذج اللغة لا يتطلب بالضرورة مجموعات بيانات ضخمة وقدرة حاسوبية هائلة. بل يُؤكد على أهمية التصميم الذكي والتكامل الفعال.
يفتح هذا الإنجاز إمكانيات جديدة من خلال الدعوة إلى التحول في التركيز، من مجرد توسيع الذكاء الاصطناعي إلى التركيز على كيفية تصميمه. يمثل هذا خطوة حاسمة في جعل الذكاء الاصطناعي المتقدم في متناول جمهور أوسع، مما يضمن أن يكون الابتكار شاملاً ويصل إلى نطاق أوسع من الأشخاص والمنظمات.
لدى Orca-2 القدرة على إحداث تأثير كبير في تطوير نماذج اللغات المستقبلية. سواءً من خلال تحسين المهام المتعلقة بمعالجة اللغات الطبيعية أو تمكين تطبيقات ذكاء اصطناعي أكثر تطورًا في مختلف القطاعات، فإن هذه النماذج الأصغر حجمًا مهيأة لإحداث تغييرات إيجابية جوهرية. علاوة على ذلك، فهي رائدة في تعزيز ممارسات الذكاء الاصطناعي الأكثر استدامة، ومواءمة التقدم التكنولوجي مع الالتزام بالمسؤولية البيئية.
وخلاصة القول:
يُمثل Orca-2 من مايكروسوفت نقلة نوعية نحو الذكاء الاصطناعي المستدام، مُخالفًا بذلك الاعتقاد السائد بأن النماذج الكبيرة وحدها هي القادرة على تطوير الذكاء الاصطناعي. بإعطاء الأولوية للتصميم الذكي على الحجم، يفتح Orca-2 آفاقًا جديدة، مُقدمًا نهجًا أكثر شمولًا ومسؤولية بيئيًا لتطوير الذكاء الاصطناعي المُتقدم. يُمثل هذا التحول خطوةً مهمةً نحو نموذج جديد في تصميم الأنظمة الذكية.












