اتصل بنا للحصول على مزيد من المعلومات

Gemini 2.5 Pro هنا - ويغير لعبة الذكاء الاصطناعي (مرة أخرى)

الإعلانات

Gemini 2.5 Pro هنا - ويغير لعبة الذكاء الاصطناعي (مرة أخرى)

mm
(المصدر: جوجل ديب مايند)

كشفت جوجل النقاب الجوزاء 2.5 برو، واصفا إياه بأنه "نموذج الذكاء الاصطناعي الأكثر ذكاءً" حتى الآن. يُوصف أحدث نموذج لغوي كبير، الذي طوره فريق جوجل ديب مايند، بأنه "نموذج تفكير" مصمم لمعالجة المشكلات المعقدة من خلال التفكير في الخطوات داخليًا قبل الاستجابة. تُعزز المعايير الأولية ثقة جوجل: جيميني 2.5 برو (إصدار تجريبي أول من سلسلة 2.5) يتصدر قائمة قائمة المتصدرين في LMArena يتفوق تطبيق Google Assistant على مساعدي الذكاء الاصطناعي بهامش كبير، كما أنه يتصدر العديد من الاختبارات القياسية لمهام البرمجة والرياضيات والعلوم.

تتضمن القدرات والميزات الجديدة الرئيسية في Gemini 2.5 Pro ما يلي:

  • الاستدلال بسلسلة الأفكار: بخلاف روبوتات الدردشة المباشرة، يُفكّر جيميني 2.5 برو في المشكلة داخليًا بشكل صريح. هذا يُتيح إجابات أكثر منطقية ودقةً للاستفسارات الصعبة، من الألغاز المنطقية المعقدة إلى مهام التخطيط المُعقّدة.
  • أداء متطور: أفادت جوجل أن 2.5 Pro يتفوق على أحدث طرازات OpenAI وAnthropic في العديد من المعايير. على سبيل المثال، حقق ارتفاعات جديدة في اختبارات التفكير الصعبة مثل آخر امتحان للإنسانية (بنسبة 18.8% مقابل 14% لنموذج OpenAI و8.9% لنموذج Anthropic)، ويتقدم في العديد من تحديات الرياضيات والعلوم دون الحاجة إلى حيل مكلفة مثل التصويت الجماعي.
  • مهارات البرمجة المتقدمة: يُظهر النموذج قفزة هائلة في قدرة البرمجة مقارنةً بسابقه. فهو يتفوق في توليد وتحرير الأكواد البرمجية لتطبيقات الويب، وحتى نصوص "الوكيل" المستقلة. في معيار البرمجة SWE-Bench، حقق Gemini 2.5 Pro نسبة نجاح بلغت 63.8%، متفوقًا بفارق كبير على نتائج OpenAI، ولكنه لا يزال متأخرًا قليلاً عن نموذج Claude 3.7 "Sonnet" المتخصص من Anthropic (70.3%).
  • فهم متعدد الوسائط: مثل طرازات Gemini السابقة، 2.5 Pro هو متعدد الوسائط الأصلي يمكنه قبول النصوص والصور والصوت، وحتى الفيديو، وإدخال الشيفرة البرمجية، وتحليلها في محادثة واحدة. هذا التنوع يعني أنه يستطيع وصف صورة، وتصحيح أخطاء برنامج، وتحليل جدول بيانات، كل ذلك في جلسة واحدة.
  • نافذة السياق الضخمة: ولعلّ الأمر الأكثر إثارة للإعجاب هو قدرة Gemini 2.5 Pro على التعامل مع ما يصل إلى مليون رمز سياق (مع تحديث مليوني رمز قريبًا). عمليًا، يعني هذا أنه قادر على استيعاب مئات الصفحات من النصوص أو مستودعات أكواد كاملة دفعةً واحدة دون فقدان التفاصيل. تتفوق هذه الذاكرة الطويلة بشكل كبير على ما تقدمه معظم نماذج الذكاء الاصطناعي الأخرى، مما يسمح لـ Gemini بالحفاظ على فهم مُفصّل للمستندات أو المناقشات الضخمة.

وفقًا لجوجل، تأتي هذه التطورات من نموذج أساسي مُحسّن بشكل كبير، إلى جانب تقنيات مُحسّنة لما بعد التدريب. والجدير بالذكر أن جوجل ستُوقف أيضًا استخدام علامة "التفكير السريع" التي كانت تستخدمها في إصدار جيميني 2.0؛ فمع الإصدار 2.5، أصبحت قدرات التفكير مُدمجة افتراضيًا في جميع النماذج المستقبلية. وهذا يعني بالنسبة للمستخدمين أن حتى التفاعلات العامة مع جيميني ستستفيد من هذا المستوى المُتعمق من "التفكير" في نظامها.

التأثيرات على الأتمتة والتصميم

بعيدًا عن ضجيج معايير الأداء والمنافسة، قد تكمن الأهمية الحقيقية لـ Gemini 2.5 Pro فيما يُمكّنه للمستخدمين النهائيين والقطاعات المختلفة. لا يقتصر أداء النموذج القوي في مهام البرمجة والاستدلال على حل الألغاز لمجرد التباهي، بل يُشير إلى إمكانيات جديدة لأتمتة أماكن العمل، وتطوير البرمجيات، وحتى التصميم الإبداعي.

لنأخذ البرمجة كمثال. بفضل قدرته على توليد شيفرة برمجية فعالة من خلال موجه بسيط، يُمكن لـ Gemini 2.5 Pro أن يُعزز مشاريع المطورين. يُمكن لمهندس واحد إنشاء نموذج أولي لتطبيق ويب أو تحليل قاعدة شيفرة كاملة بمساعدة الذكاء الاصطناعي الذي يُدير معظم العمل الروتيني. في أحد عروض جوجل التوضيحية، بنى النموذج لعبة فيديو بسيطة من الصفر باستخدام وصف من جملة واحدة فقط. يُشير هذا إلى مستقبل يصف فيه غير المبرمجين فكرةً ما، ويحصلون على تطبيق قيد التشغيل استجابةً لذلك ("ترميز الاهتزاز"، مما أدى إلى خفض العوائق أمام إنشاء البرامج بشكل كبير.

حتى بالنسبة للمطورين ذوي الخبرة، فإن امتلاك ذكاء اصطناعي قادر على فهم وتعديل مستودعات الأكواد الكبيرة (بفضل سياق المليون رمز) يعني سرعة أكبر في تصحيح الأخطاء ومراجعة الأكواد وإعادة هيكلتها. نحن نتجه نحو عصر مبرمجي الذكاء الاصطناعي الثنائيين القادرين على الحفاظ على... "الصورة الكبيرة" مشروع معقد في رؤوسهم، لذلك لا يتعين عليك تذكيرهم بالسياق مع كل مطالبة.

تساهم قدرات التفكير المتقدمة في جيميني 2.5 أيضًا في أتمتة العمل المعرفي. حاول المستخدمون الأوائل إدخال عقود طويلة وطلبوا من النموذج استخراج بنود رئيسية أو تلخيص نقاط، وكانت النتائج واعدة. تخيل أتمتة أجزاء من المراجعة القانونية، أو أبحاث العناية الواجبة، أو التحليل المالي من خلال السماح للذكاء الاصطناعي بتحليل مئات الصفحات من المستندات واستخراج ما هو مهم - وهي مهام تستغرق حاليًا ساعات عمل بشرية لا تُحصى.

بفضل براعة جيميني في تعدد الوسائط، يمكنه تحليل مزيج من النصوص وجداول البيانات والرسوم البيانية معًا، مُقدمًا ملخصًا متماسكًا. يمكن أن يُصبح هذا النوع من الذكاء الاصطناعي مساعدًا لا يُقدر بثمن للمهنيين في القانون والطب والهندسة، أو أي مجال يغرق في البيانات والوثائق.

في المجالات الإبداعية وتصميم المنتجات، تفتح نماذج مثل Gemini 2.5 Pro آفاقًا واعدة. يمكن استخدامها كشركاء في العصف الذهني - على سبيل المثال، توليد مفاهيم التصميم أو نصوص التسويق مع مراعاة المتطلبات - أو كنماذج أولية سريعة تُحوّل فكرةً تقريبيةً إلى مسودة ملموسة. يُشير تركيز جوجل على السلوك الوكيل (قدرة النموذج على استخدام الأدوات وتنفيذ خطط متعددة الخطوات بشكل مستقل) إلى أن الإصدارات المستقبلية قد تتكامل مباشرةً مع البرامج.

يمكن للمرء أن يتخيل ذكاءً اصطناعيًا تصميميًا لا يقتصر على اقتراح الأفكار فحسب، بل يتنقل أيضًا بين برامج التصميم أو يكتب الشيفرة البرمجية لتنفيذها، مسترشدًا بتعليمات بشرية عالية المستوى. هذه القدرات تطمس الفرق بين "المفكر" و"الفاعل" في عالم الذكاء الاصطناعي، ويُعد جيميني 2.5 خطوة في هذا الاتجاه - ذكاء اصطناعي قادر على تصور الحلول وتنفيذها في مجالات مختلفة.

مع ذلك، تثير هذه التطورات أيضًا تساؤلات مهمة. مع تولي الذكاء الاصطناعي مهامًا أكثر تعقيدًا، كيف نضمن فهمه للفروق الدقيقة والحدود الأخلاقية (على سبيل المثال، عند تحديد بنود العقد الحساسة، أو كيفية الموازنة بين الجوانب الإبداعية والعملية في التصميم)؟ ستحتاج جوجل وغيرها إلى بناء حواجز أمان قوية، وسيحتاج المستخدمون إلى تعلم مهارات جديدة - تحفيز الذكاء الاصطناعي والإشراف عليه - مع تحول هذه الأدوات إلى أدوات زملاء عمل.

مع ذلك، المسار واضح: نماذج مثل جيميني 2.5 برو تدفع الذكاء الاصطناعي إلى أدوار كانت تتطلب في السابق ذكاءً وإبداعًا بشريين. وتداعيات ذلك على الإنتاجية والابتكار هائلة، ومن المرجح أن نشهد تأثيرات متلاحقة في كيفية بناء المنتجات وإنجاز العمل في العديد من القطاعات.

جيميني 2.5 ومجال الذكاء الاصطناعي الجديد

مع إصدار Gemini 2.5 Pro، تُرسّخ جوجل مكانتها في صدارة سباق الذكاء الاصطناعي، مُوجّهةً رسالةً لمنافسيها. قبل عامين فقط، كان الاعتقاد السائد أن ذكاء جوجل الاصطناعي (مثل إصدارات Bard الأولى) يتخلف عن ChatGPT من OpenAI وخطوات مايكروسوفت الجريئة. الآن، ومن خلال حشد مواهب جوجل للأبحاث وDeepMind، قدّمت الشركة نموذجًا قادرًا على المنافسة بجدارة على لقب أفضل مساعد ذكاء اصطناعي في العالم.

هذا يُبشر بالخير لمكانة جوجل على المدى الطويل. تُعتبر نماذج الذكاء الاصطناعي بشكل متزايد منصات أساسية (مثل أنظمة التشغيل أو الخدمات السحابية)، وامتلاك نموذج من الطراز الأول يمنح جوجل نفوذًا قويًا في كل شيء، بدءًا من عروض السحابة المؤسسية (Google Cloud/Vertex AI) ووصولًا إلى خدمات المستهلكين مثل البحث وتطبيقات الإنتاجية ونظام أندرويد. على المدى الطويل، يمكننا توقع... عائلة الجوزاء سيتم دمجها في العديد من منتجات Google - مما قد يؤدي إلى تعزيز مساعد Google وتحسين تطبيقات Google Workspace بميزات أكثر ذكاءً وتعزيز البحث بقدرات محادثة ووعي بالسياق.

يُسلّط إطلاق Gemini 2.5 Pro الضوء أيضًا على مدى التنافسية التي يشهدها مجال الذكاء الاصطناعي. تُجري OpenAI وAnthropic، بالإضافة إلى جهات فاعلة أخرى مثل Meta والشركات الناشئة الناشئة، تجارب متسارعة على نماذجها. كل خطوة تُخطوها شركة - سواءً كانت نافذة سياق أوسع، أو طريقة جديدة لدمج الأدوات، أو تقنية أمان مُبتكرة - تُلبّيها الشركات الأخرى بسرعة. تُعد خطوة جوجل لتضمين التفكير المنطقي في جميع نماذجها خطوة استراتيجية، تضمن عدم تخلفها عن الركب في مجال "ذكاء" الذكاء الاصطناعي. في الوقت نفسه، تُواصل استراتيجية Anthropic، المتمثلة في منح المستخدمين مزيدًا من التحكم (كما يتضح من عمق التفكير المنطقي القابل للتعديل في Claude 3.7) والتحسينات المُستمرة التي تُجريها OpenAI على GPT-4.x، الضغط.

بالنسبة للمستخدمين النهائيين والمطورين، تُعدّ هذه المنافسة إيجابية إلى حد كبير: فهي تعني وصول أنظمة ذكاء اصطناعي أفضل بشكل أسرع وخيارات أوسع في السوق. نشهد نظامًا بيئيًا للذكاء الاصطناعي لا تحتكر فيه أي شركة الابتكار، وهذه الديناميكية تدفع كل شركة إلى التفوق - تمامًا كما كان الحال في بدايات حروب الحواسيب الشخصية أو الهواتف الذكية.

في هذا السياق، يُعد إصدار جيميني 2.5 برو أكثر من مجرد تحديث للمنتج من جوجل، بل هو إعلان نوايا. فهو يُشير إلى أن جوجل تنوي ألا تكون مجرد مُتابع سريع، بل رائدة في عصر الذكاء الاصطناعي الجديد. تُسخّر الشركة بنيتها التحتية الحاسوبية الضخمة (اللازمة لتدريب النماذج باستخدام أكثر من مليون سياق رمزي) ومواردها الهائلة من البيانات لتجاوز حدودٍ لا يستطيعها سوى القليلون. في الوقت نفسه، يُظهر نهج جوجل (طرح نماذج تجريبية لمستخدمين موثوق بهم، ودمج الذكاء الاصطناعي في نظامها البيئي بعناية) رغبةً في تحقيق التوازن بين الطموح والمسؤولية والتطبيق العملي.

وكما ذكر كوراي كافوكوغلو، كبير مسؤولي التكنولوجيا في Google DeepMind، في الإعلان، فإن الهدف هو جعل الذكاء الاصطناعي أكثر فائدة وقدرة مع تحسينه بوتيرة سريعة.

بالنسبة لمراقبي هذه الصناعة، يُعدّ Gemini 2.5 Pro علامة فارقة تُشير إلى مدى تطور الذكاء الاصطناعي بحلول أوائل عام 2025، ومؤشرًا على مستقبله. يرتفع مستوى "أحدث التقنيات" باستمرار: فاليوم يتعلق الأمر بالقدرة على التفكير المنطقي والبراعة متعددة الوسائط، وغدًا قد يتعلق الأمر بحل المشكلات أو الاستقلالية بشكل عام. يُظهر أحدث نموذج من جوجل أن الشركة ليست في السباق فحسب، بل تنوي أيضًا صياغة نتائجه. وإذا كان Gemini 2.5 معيارًا، فسيكون الجيل القادم من نماذج الذكاء الاصطناعي أكثر تكاملًا في عملنا وحياتنا، مما يدفعنا إلى إعادة النظر في كيفية استخدامنا للذكاء الآلي.

أليكس ماكفارلاند صحفي وكاتب في مجال الذكاء الاصطناعي يستكشف أحدث التطورات في مجال الذكاء الاصطناعي. لقد تعاون مع العديد من الشركات الناشئة والمنشورات في مجال الذكاء الاصطناعي في جميع أنحاء العالم.