قاده التفكير
الكأس المقدسة لقوة الحوسبة في الذكاء الاصطناعي

على الرغم من التقدم الهائل، لا تزال قدرات الذكاء الاصطناعي محدودة مقارنةً بالتوقعات الواقعية. فنحن نبني نماذج معقدة، ونشغل شبكات عصبية، ونختبر خوارزميات، ومع ذلك، يتوقف التقدم أحيانًا في أماكن لا نتوقعها.
لا تكمن المشكلة غالبًا في الخوارزميات أو البيانات، بل في القدرة الحاسوبية، أي الموارد التي تُمكّن النماذج من التعلّم والعمل على النطاق المطلوب. فما الذي يقف وراء هذا العائق؟ دعونا نتفحص المورد الأساسي الذي بدونه لا تستطيع حتى أكثر مشاريع الذكاء الاصطناعي الواعدة تجاوز حدود المختبر.
العجز في الحوسبة وعواقبه
لفهم هذا الموضوع، دعونا نبدأ بتاريخ الاتصالات المتنقلة. عندما ظهرت شبكات الجيل الثالث (3G) ثم شبكات الجيل الرابع (4G)، كان الإنترنت قد أصبح عالميًا تقريبًا. وعندما تم تقديم شبكات الجيل الخامس (5G)، طرح الكثيرون سؤالًا منطقيًا تمامًا: "سيكون الإنترنت أسرع - ولكن ما الفائدة من ذلك؟"
في الواقع، لا يقتصر تحسين سرعة الإنترنت على راحة المستخدم فحسب، بل يُحدث تحولاً جذرياً في المشهد التكنولوجي برمته. وتظهر استخدامات لم تكن ممكنة من قبل. فقد أثبتت تقنية الجيل الخامس (5G) أنها أسرع بكثير من تقنية الجيل الرابع (4G)، ولم تكن هذه القفزة تدريجية، كما هو الحال مع الانتقال من الجيل الأول (1G) إلى الجيل الثاني (2G)، بل كانت هائلة. ونتيجة لذلك، بات من الممكن ظهور تطبيقات وأجهزة وفئات تكنولوجية جديدة كلياً.
كاميرات مراقبة إشارات المرور، وأنظمة تحليل حركة المرور الآنية، وآليات تنظيم المرور الآلية - كل هذا أصبح ممكناً بفضل تقنيات الاتصالات الحديثة. وتكتسب الشرطة وسائل جديدة لتبادل البيانات، وفي الفضاء، تستطيع التلسكوبات والأقمار الصناعية نقل كميات هائلة من المعلومات إلى الأرض. ويُسهم التطور النوعي في التقنيات الأساسية في دفع عجلة تطوير النظام البيئي بأكمله.
ينطبق المبدأ نفسه على القدرة الحاسوبية. تخيّل إجمالي القدرة الحاسوبية للبشرية بوحدات افتراضية. اليوم، قد نمتلك، على سبيل المثال، عشر وحدات من هذا النوع. بها، نستطيع توليد الصور والفيديوهات، وكتابة النصوص، وإنشاء مواد تسويقية... هذا بحد ذاته قدر كبير، لكن نطاق التطبيقات محدود في الغالب.
تخيل الآن أن لدينا ليس عشرة وحدات، بل ألف وحدة من هذا القبيل. فجأة، تصبح التقنيات التي كانت باهظة الثمن في السابق قابلة للتطبيق، وتبدأ الشركات الناشئة التي تم التخلي عنها بسبب ارتفاع تكاليف الحوسبة في أن تصبح مجدية اقتصادياً.
لنأخذ سيارات الأجرة ذاتية القيادة كمثال. تعتمد هذه السيارات اليوم في الغالب على حواسيب محلية ضعيفة نسبياً مثبتة داخلها. ولكن، إذا تم نقل بث الفيديو إلى خدمة سحابية ذات موارد حاسوبية هائلة، لأمكن معالجة البيانات وإعادتها في الوقت الفعلي. وهذا أمر بالغ الأهمية: فالسيارة التي تسير بسرعة 100 كم/ساعة يجب أن تتخذ قرارات في أجزاء من الثانية - الاستمرار في السير، أو الانعطاف، أو الكبح، أو عدم الكبح.
حينها يصبح إنشاء قطاع سيارات أجرة ذاتية القيادة متكاملاً أمراً ممكناً، وليس مجرد حلول معزولة كتلك التي نراها اليوم. أي حاسوب محلي مُثبّت في السيارة محدود بطبيعته، على عكس النظام المتصل. وكلما أسرعنا في توسيع نطاقه، تسارعت وتيرة التغيير في العالم من حولنا.
الوصول إلى الرقائق الإلكترونية و"التذكرة الذهبية" في مجال الذكاء الاصطناعي
في سياق القدرة الحاسوبية، يبرز السؤال التالي: هل أصبح الوصول إلى الرقائق الحديثة بمثابة "التذكرة الذهبية" لدخول سوق الذكاء الاصطناعي؟ هل يؤدي توقيع الشركات الكبرى عقودًا مع مصنعي الرقائق، أو إنتاجها بنفسها، إلى خلق فجوة بين الشركات الكبرى وبقية الشركات؟
لا يظهر هذا التباين إلا في حالة واحدة: عندما يركز نموذج العمل حصراً على بيع الرقائق الإلكترونية لكبار العملاء. عملياً، تسعى شركات تصنيع مثل NVIDIA إلى توفير حلول سحابية للجميع. رقائقها المُحسّنة متاحة في السحابة لكل من OpenAI والمطورين المستقلين.
حتى التحالفات الاستراتيجية بين شركات مثل جوجل، وأنثروبيك، ومايكروسوفت، وأوبن إيه آي، وأمازون، وإنفيديا، هي في الأساس شراكات لتقاسم الموارد، وليست محاولات لاحتكار السوق. يُمكّن هذا النموذج من التوزيع الأمثل للقدرات الحاسوبية، مما يُسرّع التطور التكنولوجي.
إذا تتبعنا سلسلة استخدام موارد الحوسبة، فسنجد أنها تبدأ من المستخدم النهائي. على سبيل المثال، عندما تستخدم تطبيق واتساب لإجراء مكالمات الفيديو والرسائل، يجب على الشركة ضمان عمل الخدمة: تخزين البيانات ومعالجتها، وتشغيل نماذج تنظيف الفيديو، وإضافة المؤثرات، وتحسين جودة الصورة.
يُعدّ الحفاظ على الخوادم الاحتكارية مكلفًا، كما أنها تصبح قديمة وتتطلب صيانة مستمرة. لهذا السبب ظهرت حلول الحوسبة السحابية. يهيمن على السوق ثلاثة لاعبين رئيسيين: جوجل كلاود، وأمازون ويب سيرفيسز، ومايكروسوفت أزور. لا تستطيع الشركات الأخرى المنافسة على هذا المستوى نظرًا لضخامة حجم البنية التحتية.
تُعدّ خدمات الحوسبة السحابية مراكز بيانات ضخمة مزودة بأنظمة تبريد وإمدادات طاقة وصيانة على مدار الساعة. وهي تضم خوادم ورقائق متخصصة من شركات مثل NVIDIA وAMD وغيرها من الشركات المصنعة، مما يتيح إجراء عمليات حسابية واسعة النطاق.
وهنا نصل إلى السؤال الرئيسي الذي ناقشته في المقال السابق حول مراكز البياناتوأودّ أن أتابع هنا: ما هي العقبة الرئيسية في هذا النظام؟ هل هي نقص الكهرباء، أم صعوبة تبريد مراكز البيانات في المناطق التي يجعل مناخها الأمر بالغ الصعوبة؟ في الواقع، يكمن السر في الرقائق نفسها...
الكأس المقدسة
لماذا تُقدّر قيمة شركة NVIDIA اليوم بحوالي 5 تريليونات دولار وتُعتبر من بين أنجح الشركات المتداولة علنًا في العالم؟ السبب بسيط: تُنتج NVIDIA الرقائق التي يتم تدريب نماذج الذكاء الاصطناعي عليها وتشغيل الاستدلال.
تستهلك كل شريحة من هذه الشرائح كميات هائلة من الكهرباء عند تدريب النماذج الكبيرة أو معالجة كميات متزايدة باستمرار من البيانات. ولكن ما مدى كفاءة استخدام هذه الطاقة؟ هنا تبرز أهمية الشرائح المتخصصة؛ فهي تتعامل مع مهام محددة بكفاءة أعلى بكثير من وحدات معالجة الرسومات العامة.
تختلف نماذج الذكاء الاصطناعي. فمثلاً، لدى OpenAI مجموعة من النماذج، ولدى Anthropic مجموعة أخرى. قد تتشابه المفاهيم، لكن البنى الرياضية والعمليات الحسابية مختلفة. عند تدريب نماذج OpenAI (مثل ChatGPT) مقابل نماذج Anthropic (مثل Claude)، تعمل شريحة واحدة متعددة الأغراض كأداة "مقاس واحد يناسب الجميع"، حيث تستهلك، على سبيل المثال، 100,000 ساعة من الحساب لنموذج و150,000 ساعة لنموذج آخر. وتختلف الكفاءة بشكل كبير، ونادراً ما تكون مثالية.
تحل الشركات هذه المشكلة بإنتاج رقائق متخصصة. على سبيل المثال، يمكن تحسين رقاقة واحدة لبنية ChatGPT وتدريبها في غضون 20 دقيقة، بينما تُصمم رقاقة أخرى خصيصًا لبنية Anthropic وتُكمل التدريب أيضًا في غضون 20 دقيقة. وبذلك، ينخفض استهلاك الطاقة ووقت التدريب عدة مرات مقارنةً بالرقاقة العامة.
عند بيع هذه الرقاقات لشركات كبرى، مثل جوجل وأمازون ومايكروسوفت وأزور، تُعرض كمنتجات مستقلة. يمكن للمستخدمين، على سبيل المثال، اختيار رقاقة مُحسّنة لنموذج YOLO أو رقاقة أبسط وأقل تكلفة لبنية Xen. بهذه الطريقة، تحصل الشركات على موارد حاسوبية مُصممة خصيصًا لمهامها، بدلًا من شراء وحدات معالجة رسومية عامة الأغراض. فإذا كان لدى المستخدم عشر وظائف مختلفة، يمكنه استخدام عشر رقاقات متخصصة مختلفة.
الاتجاه واضح: تحلّ الرقائق المتخصصة تدريجيًا محلّ الرقائق العامة. تعمل العديد من الشركات الناشئة الآن مع الدوائر المتكاملة الخاصة بالتطبيقات (ASICs)، وهي رقائق مصممة لمهام حسابية محددة. ظهرت أولى هذه الدوائر لتعدين البيتكوين: في البداية، كان يتم تعدين العملات المشفرة على وحدات معالجة الرسومات من إنفيديا، ثم صُممت رقائق خصيصًا للبيتكوين ولم تعد قادرة على أداء مهام أخرى.
أرى هذا عمليًا: يمكن لنفس تكوين الأجهزة أن ينتج نتائج مختلفة تمامًا اعتمادًا على المهمة. في شركتي الناشئة متأملندرس هذه العمليات في مشاريع حقيقية، وبصفتنا مستشارًا استراتيجيًا لـ كيماكرألاحظ كيف يحقق العملاء كفاءةً أكبر بفضل الرقائق المتخصصة، مما يسمح بتشغيل النماذج بشكل أسرع. المشاريع التي كانت تتعثر سابقاً أثناء التدريب أو الاستدلال تصل إلى نتائج مستقرة مع هذا النهج.
مع ذلك، ينطوي التخصص الدقيق على مخاطر. فالشريحة المُحسّنة لبنية أنثروبيك لن تُجدي نفعًا في تدريب نماذج أوبن إيه آي، والعكس صحيح. تتطلب كل بنية جديدة جيلًا جديدًا من الأجهزة، مما يُنذر بخطر "التقادم" على نطاق واسع. فإذا أصدرت أنثروبيك بنية جديدة غدًا، ستصبح جميع شرائح الجيل السابق غير فعّالة أو عديمة الفائدة. ويُكلّف إنتاج الشرائح الجديدة مليارات الدولارات وقد يستغرق سنوات.
وهذا يخلق معضلة: هل ينبغي لنا صنع رقائق متخصصة تعمل بشكل مثالي في سيناريو ضيق، أم الاستمرار في إنتاج رقائق للأغراض العامة تحل جميع المهام بشكل جيد إلى حد ما ولكنها لا تتطلب استبدالًا كاملاً عند تغيير البنى؟
تُقاس الكفاءة في هذا السياق بثلاثة معايير أساسية: مدة التشغيل، واستهلاك الكهرباء، وتوليد الحرارة. ترتبط هذه المعايير ارتباطًا مباشرًا: فكلما طالت مدة تشغيل النظام، زاد استهلاكه للطاقة وزادت كمية الحرارة التي ينتجها. ويؤدي تقليل أحد هذه المعايير تلقائيًا إلى تحسين المعيارين الآخرين.
هنا يكمن "الكأس المقدسة" لأداء الذكاء الاصطناعي: إذا أمكن تحسين واحد على الأقل من مقاييس الكفاءة الأساسية، فإن المقاييس الأخرى تتحسن تلقائيًا تقريبًا.
عملية مستدامة
مع تزايد استخدام الرقائق المتخصصة، أصبحت مشكلة مخاطر الإنتاج الزائد ملحة. حالياً، يُعد فائض المعدات كبيراً بالفعل، وتعمل الشركات على معالجة هذه المشكلة بطرق مستدامة متنوعة، بما في ذلك إعادة استخدام الموارد المتاحة.
أصبحت إعادة تدوير المعدات عنصراً أساسياً في التنمية المستدامة للصناعات التقنية المتقدمة. تحتوي الرقائق الإلكترونية على كميات كبيرة من المعادن النفيسة والأساسية، كالذهب والنحاس والألومنيوم والبلاديوم والمعادن الأرضية النادرة، بالإضافة إلى المواد المستخدمة في الرقائق الدقيقة والترانزستورات. وبمجرد تقادم المعدات، يمكن إعادة هذه الموارد القيّمة إلى خط الإنتاج، مما يقلل تكلفة المكونات الجديدة ويخفض في الوقت نفسه الأثر البيئي للصناعة.
تركز بعض المصانع والشركات المتخصصة على إعادة تدوير واستخلاص المعادن الثمينة من المكونات القديمة. فعلى سبيل المثال، تستخدم بعض المنشآت عمليات المعالجة المائية وأساليب كيميائية متطورة لاستخلاص الذهب والنحاس بدرجة نقاء عالية، مما يسمح بإعادة استخدام هذه المواد في رقائق جديدة.
إضافةً إلى ذلك، تُطبّق الشركات نماذج الحلقة المغلقة، حيث يتم تحديث المعدات القديمة أو دمجها في حلول جديدة، مما يقلل الحاجة إلى استخراج الموارد الأولية. ولا تُسهم هذه الأساليب في تقليل النفايات فحسب، بل تُخفّض أيضاً البصمة الكربونية للإنتاج، إذ تتطلب عمليات التعدين التقليدية ومعالجة المعادن كميات كبيرة من الطاقة.
يمكن أن تصبح الإدارة المستدامة لدورة حياة الرقائق والمعدات معيارًا صناعيًا، حيث يتماشى التقدم التكنولوجي مع المسؤولية البيئية.








