رطم استكشاف الجوزاء الجديد لـ Google DeepMind: ما هو كل هذا الضجيج؟ - اتحدوا.AI
اتصل بنا للحصول على مزيد من المعلومات

الذكاء الاصطناعي

استكشاف الجوزاء الجديد لـ Google DeepMind: ما هو كل هذا الضجيج؟

mm
تحديث on

في عالم الذكاء الاصطناعي (AI)، ابتكار Google DeepMind الأخير، الجوزاء، يولد ضجة. ويهدف هذا التطور المبتكر إلى مواجهة التحدي المعقد المتمثل في تكرار الإدراك البشري، وخاصة قدرته على دمج المدخلات الحسية المختلفة. يستخدم الإدراك البشري، وهو متعدد الوسائط بطبيعته، قنوات متعددة في وقت واحد لفهم البيئة. الذكاء الاصطناعي متعدد الوسائط, مستوحاة من هذا التعقيد، تسعى جاهدة لدمج المعلومات من مصادر متنوعة وفهمها واستدلالها، مما يعكس قدرات الإدراك الشبيهة بالإنسان.

تعقيد الذكاء الاصطناعي متعدد الوسائط

في حين أن الذكاء الاصطناعي قد قطع خطوات كبيرة في التعامل مع الأوضاع الحسية الفردية، إلا أن تحقيق الذكاء الاصطناعي متعدد الوسائط الحقيقي يظل تحديًا هائلاً. تتضمن الأساليب الحالية تدريب مكونات منفصلة لطرائق مختلفة وربطها معًا، لكنها غالبًا ما تفشل في المهام التي تتطلب تفكيرًا معقدًا ومفاهيميًا.

ظهور برج الجوزاء

في إطار السعي لتكرار الإدراك البشري متعدد الوسائط، برز Google Gemini باعتباره تطورًا واعدًا. يقدم هذا الإبداع منظورًا فريدًا لقدرة الذكاء الاصطناعي على فك تشفير تعقيدات الإدراك البشري. يتخذ برج الجوزاء نهجًا مميزًا، فهو متعدد الوسائط بطبيعته ويخضع لتدريب مسبق على طرائق مختلفة. ومن خلال المزيد من الضبط باستخدام البيانات الإضافية متعددة الوسائط، يعمل برنامج Gemini على تحسين فعاليته، مما يظهر وعدًا في الفهم والتفكير بشأن المدخلات المتنوعة.

ما هو الجوزاء؟

جوجل الجوزاء، تم تقديمها في 6 ديسمبر 2023، وهي عبارة عن عائلة من نماذج الذكاء الاصطناعي متعددة الوسائط التي طورتها وحدة Google DeepMind التابعة لشركة Alphabet بالتعاون مع Google Research. تم تصميم Gemini 1.0 لاستيعاب وإنشاء المحتوى عبر مجموعة من أنواع البيانات، بما في ذلك النص والصوت والصور والفيديو.

الميزة البارزة في Gemini هي تعدد الوسائط الأصلي، مما يميزها عن نماذج الذكاء الاصطناعي التقليدية متعددة الوسائط. تتيح هذه القدرة الفريدة لـ Gemini المعالجة والتفكير بسلاسة عبر أنواع البيانات المتنوعة مثل الصوت والصور والنص. ومن الجدير بالذكر أن برج الجوزاء يمتلك تفكيرًا متعدد الوسائط، مما يسمح له بتفسير الملاحظات المكتوبة بخط اليد والرسوم البيانية والرسوم البيانية لمعالجة المشكلات المعقدة. تدعم بنيته الاستيعاب المباشر للنص والصور والأشكال الموجية الصوتية وإطارات الفيديو كتسلسلات متداخلة.

عائلة الجوزاء

تفتخر Gemini بمجموعة من النماذج المصممة لحالات استخدام وسيناريوهات نشر محددة. ومن المتوقع أن يكون النموذج Ultra، المصمم للمهام المعقدة للغاية، متاحًا في أوائل عام 2024. ويعطي النموذج Pro الأولوية للأداء وقابلية التوسع، وهو مناسب للأنظمة الأساسية القوية مثل Google Bard. في المقابل، تم تحسين نموذج Nano للاستخدام على الجهاز ويأتي في نسختين — Nano-1 مع 1.8 مليار معلمة وNano-2 مع 3.25 مليار معلمة. تندمج طرازات Nano هذه بسلاسة في الأجهزة، بما في ذلك الهاتف الذكي Google Pixel 8 Pro.

الجوزاء مقابل ChatGPT

وفقًا لمصادر الشركة، قام الباحثون بمقارنة برنامج Gemini على نطاق واسع مع متغيرات ChatGPT حيث تفوق على ChatGPT 3.5 في الاختبارات واسعة النطاق. تتفوق Gemini Ultra في 30 من 32 معيارًا مستخدمًا على نطاق واسع في أبحاث نماذج اللغات الكبيرة. حصل Gemini Ultra على 90.0% في MMLU (فهم اللغة متعدد المهام الهائل)، وهو يتفوق على الخبراء البشريين، ويعرض براعته في فهم اللغة متعدد المهام الهائل. يتكون MMLU من مجموعة من 57 موضوعًا مثل الرياضيات والفيزياء والتاريخ والقانون والطب والأخلاق لاختبار المعرفة العالمية وقدرات حل المشكلات. تم تدريب Gemini ليكون متعدد الوسائط، ويمكنه معالجة أنواع مختلفة من الوسائط، مما يجعله متميزًا في المشهد التنافسي للذكاء الاصطناعي.

استخدم حالات

أدى ظهور برج الجوزاء إلى ظهور مجموعة من حالات الاستخدام، بعضها على النحو التالي:

  • الاستدلال المتقدم متعدد الوسائط: يتفوق برج الجوزاء في الاستدلال المتقدم متعدد الوسائط، حيث يتعرف ويستوعب في نفس الوقت النصوص والصور والصوت والمزيد. يعزز هذا النهج الشامل قدرته على فهم المعلومات الدقيقة والتفوق في التفسير والاستدلال، خاصة في المواضيع المعقدة مثل الرياضيات والفيزياء.
  • برمجة الكمبيوتر: يتفوق الجوزاء في فهم وإنشاء برامج كمبيوتر عالية الجودة عبر اللغات المستخدمة على نطاق واسع. ويمكن استخدامه أيضًا كمحرك لأنظمة ترميز أكثر تقدمًا، كما هو موضح في حل مشكلات البرمجة التنافسية.
  • تحويل التشخيص الطبي: يمكن أن تمثل قدرات معالجة البيانات متعددة الوسائط الخاصة بـ Gemini تحولًا في التشخيص الطبي، مما قد يؤدي إلى تعزيز عمليات صنع القرار من خلال توفير الوصول إلى مصادر البيانات المتنوعة.
  • تحويل التنبؤ المالي: يعيد Gemini تشكيل التنبؤ المالي من خلال تفسير البيانات المتنوعة في التقارير المالية واتجاهات السوق، مما يوفر رؤى سريعة لاتخاذ قرارات مستنيرة.

التحديات

على الرغم من أن Google Gemini حقق خطوات مثيرة للإعجاب في تطوير الذكاء الاصطناعي متعدد الوسائط، إلا أنه يواجه بعض التحديات التي تتطلب دراسة متأنية. نظرًا للتدريب المكثف على البيانات، فمن الضروري التعامل معها بحذر لضمان الاستخدام المسؤول لبيانات المستخدم، ومعالجة المخاوف المتعلقة بالخصوصية وحقوق الطبع والنشر. تشكل التحيزات المحتملة في بيانات التدريب أيضًا مشكلات تتعلق بالعدالة، مما يستلزم إجراء اختبار أخلاقي قبل أي إصدار عام لتقليل هذه التحيزات. توجد أيضًا مخاوف بشأن احتمال إساءة استخدام نماذج الذكاء الاصطناعي القوية مثل Gemini لشن هجمات إلكترونية، مما يسلط الضوء على أهمية النشر المسؤول والرقابة المستمرة في المشهد الديناميكي للذكاء الاصطناعي.

التطور المستقبلي لبرج الجوزاء

أكدت شركة Google التزامها بتعزيز برنامج Gemini وتمكينه للإصدارات المستقبلية مع التقدم في التخطيط والذاكرة. بالإضافة إلى ذلك، تهدف الشركة إلى توسيع نافذة السياق، مما يمكّن جيميني من معالجة المزيد من المعلومات وتقديم استجابات أكثر دقة. وبينما نتطلع إلى تحقيق اختراقات محتملة، فإن القدرات المميزة التي يتمتع بها برج الجوزاء توفر آفاقًا واعدة لمستقبل الذكاء الاصطناعي.

الخط السفلي

يمثل Gemini من Google DeepMind نقلة نوعية في تكامل الذكاء الاصطناعي، متجاوزًا النماذج التقليدية. بفضل تعدد الوسائط والتفكير متعدد الوسائط، يتفوق برج الجوزاء في المهام المعقدة. وعلى الرغم من التحديات، فإن تطبيقاتها في الاستدلال المتقدم والبرمجة والتشخيص وتحويل التوقعات المالية تسلط الضوء على إمكاناتها. وبينما تلتزم Google بتطويرها المستقبلي، فإن تأثير Gemini العميق يعيد تشكيل مشهد الذكاء الاصطناعي بمهارة، مما يمثل بداية حقبة جديدة في القدرات متعددة الوسائط.

الدكتور تحسين ضياء هو أستاذ مشارك دائم في جامعة كومساتس إسلام أباد، ويحمل درجة الدكتوراه في الذكاء الاصطناعي من جامعة فيينا للتكنولوجيا، النمسا. متخصص في الذكاء الاصطناعي، والتعلم الآلي، وعلوم البيانات، ورؤية الكمبيوتر، وقد قدم مساهمات كبيرة من خلال منشورات في المجلات العلمية ذات السمعة الطيبة. كما قاد الدكتور تحسين العديد من المشاريع الصناعية كمحقق رئيسي وعمل كمستشار في الذكاء الاصطناعي.