Connect with us

الفجوة الرقمية الجديدة في الذكاء الاصطناعي: لماذا سيفوز النماذج الجاهزة للطرف، والأولوية للوحدات المركزية للمعالجة بالفوز في حرب التكلفة

قادة الفكر

الفجوة الرقمية الجديدة في الذكاء الاصطناعي: لماذا سيفوز النماذج الجاهزة للطرف، والأولوية للوحدات المركزية للمعالجة بالفوز في حرب التكلفة

mm

يتوسع سوق الذكاء الاصطناعي العالمي بسرعة مذهلة. في عام 2024، تم تقديره عند 257.68 مليار دولار، مع توقعات تضع قيمته عند 371.71 مليار دولار بحلول نهاية عام 2025 وتصعد إلى 2.4 تريليون دولار بحلول عام 2032. هذا يعني زيادة تقارب العشر倍 في أقل من عقد، وهو مسار يُقارن ببعض الانفجارات التكنولوجية الأكثر تحولاً في التاريخ الحديث.

على مدار العقد الماضي، تم تأسيس حوالي 1500 شركة ذكاء اصطناعي جديدة، كل واحدة منها حصلت على استثمارات تتجاوز 1.5 مليون دولار، مما يشير ليس فقط إلى موجة من الابتكار ولكن أيضًا إلى وجود منافسة شرسة. الشركات القائمة لا تجلس على الأرصفة أيضًا. وفقًا لتقرير صناعي صادر عن شركة ماكينزي في يناير، يخطط 92٪ من المنظمات إلى زيادة إنفاقها على الذكاء الاصطناعي خلال السنوات الثلاث القادمة.

لكن مع تسارع تبني الذكاء الاصطناعي، يظهر البنية التحتية التي تدعمه تشققات. خلال السنوات القليلة الماضية، انتقل الذكاء الاصطناعي من العروض المثيرة إلى حمولات عمل حقيقية ومستمرة.

العقبة الحقيقية ليست فقط حول جودة النموذج، بل حول مكان وطريقة تشغيل تلك النماذج. تتكون فجوة رقمية جديدة، ليس حول الوصول إلى البيانات أو المواهب، ولكن حول استراتيجية الحوسبة. تواجه المنظمات مفترق طريق حاسم: الاستمرار في الاعتماد على أنظمة مركزية في السحابة، أو تبني أنظمة أقل تكلفة وأسهل في النشر في بيئات متنوعة، وأفضل انسجام مع احتياجات الخصوصية والاتساق.

تعتبر هذه الخيارات المعمارية مهمة لأن العبء الحقيقي ليس في بناء النماذج، بل في تشغيلها يومًا بعد يوم. هذا هو المكان الذي تتجاوز فيه تكاليف الاستدلال بسرعة تكاليف التدريب وتحدد اقتصاديات الذكاء الاصطناعي في النطاق الواسع.

الاستدلال يأكل ميزانيات الذكاء الاصطناعي

في حين أن العناوين غالبًا ما تسلط الضوء على التكلفة الكبيرة لتدريب نماذج الطليعة، فإن الاستدلال هو الفاتورة التي لا تتوقف. يشير مؤشر الذكاء الاصطناعي لستانفورد لعام 2025 إلى أن التقدم السريع في النماذج الصغيرة قد خفض تكلفة تحقيق أداء “GPT-3.5” بنسبة تزيد عن 280 مرة بين نهاية عام 2022 ونهاية عام 2024. ومع ذلك، يشدد التقرير نفسه على هوس الصناعة بتحسين كفاءة الاستدلال.

لقد زادت أسعار وحدة معالجة الرسومات في السحابة الضغط. يمكن أن تكلف استئجار مثيلات وحدة معالجة الرسومات عالية الجودة، خلال أفق زمني من ثلاث إلى خمس سنوات، ما يقارب ضعف سعر شراء نفس الأجهزة بشكل مباشر. إن المرونة مفيدة لتحميل العمل المتقطع، لكن استئجارات الاستدلال الطويلة تنزف الميزانيات بهدوء. حتى إنفيديا، التي تعتمد أعمالها على معززات، قد قامت بتحسين الاستدلال بشكل متعطش عبر كافة منصاتها خلال العام الماضي. هذا دليل على أن المعركة الحقيقية تتحرك من أداء التدريب إلى اقتصاد الخدمة.

يعني هذا الضغط الناشئ عن التكلفة أن المنظمات التي لا تستطيع أو لا ترغب في إعادة التفكير في استراتيجيات الحوسبة الخاصة بها ت рисك أن تتراجع.

لماذا يغير الطرف (والوحدات المركزية للمعالجة) منحنى التكلفة

الحقيقة القاسية هي أن الاستدلال المعتمد على وحدة معالجة الرسومات يخلق اقتصاديات غير مستدامة. تشغيل حمولات عمل ذكاء اصطناعي كبيرة وواقعية على وحدات معالجة الرسومات المكلفة لا يزيد فقط من التكاليف بل يسرع أيضًا من التدهور المادي. دورات الابتكار تتحرك بسرعة كبيرة، غالبًا أقل من 18 شهرًا بين أجيال الشريحة الجديدة، بحيث تفقد استثمارات البنية التحتية قيمتها بسرعة. وقد أدى هذا إلى تحذير Analysts من تكاليف التدهور المرتبطة بشراء شريحة الذكاء الاصطناعي لأنهم يخفضون بالفعل تقديرات الأرباح. على سبيل المثال، من المتوقع أن تتحمل ألفابيت 28 مليار دولار في تكاليف تدهور بحلول عام 2026.

المصانع والعيادات ومتاجر التجزئة والأجهزة المحمولة هي الأماكن التي سيتطلب فيها الذكاء الاصطناعي العمل بشكل متزايد. غالبًا ما يكون إرسال كل طلب إلى مجموعة مركزية من وحدات معالجة الرسومات أداة خاطئة للعمل لأنها مكلفة ومتطلبة للطاقة ومستعدة للاتساق والخصوصية.

بيئات الطرف ليست مزارع متجانسة من وحدات معالجة الرسومات. إنها أساطيل متنوعة من الوحدات المركزية للمعالجة: الخواديم، والأجهزة الشخصية المقاومة، وأجهزة الكمبيوتر المحمولة والأجهزة المحمولة. هذا التنوع يجعل الوحدات المركزية للمعالجة أساسًا طبيعيًا لتنفيذ الذكاء الاصطناعي بكفاءة في التكلفة.

في هذا المنظر الجديد، لا تعد الوحدات المركزية للمعالجة مجرد بديل، بل هي المسار الذكي التكلفة لتنفيذ الذكاء الاصطناعي القابل للتطوير والمتاح.

وحدات معالجة الرسومات كـ “طائرة خاصة” للذكاء الاصطناعي

كلما كانت النماذج أكبر وأكثر تعقيدًا، زادت demande لطاقة وحدة معالجة الرسومات، مما يزيد ليس فقط من تكاليف البنية التحتية والطاقة ولكن أيضًا يركز القدرات المتقدمة للذكاء الاصطناعي في أيدي الذين يمكنهم تحملها.

تُظهر الدراسات أن النماذج العامة الكبيرة للأجيال Often تستخدم كميات هائلة من الطاقة وتولد انبعاثات كربونية أعلى بكثير لكل 1000 استدلال مقارنة بنظم أصغر وأكثر تخصصًا. حتى عند التحكم في عدد المعاملات، تعزز هياكل وحدات معالجة الرسومات الحساسة الحواجز المالية والتشغيلية. بمرور الوقت، يخلق هذا عرقلة، مما يجعل من الصعب بشكل غير متناسب على الشركات الناشئة والباحثين والمجتمعات التي تفتقر إلى الموارد للوصول إلى أدوات الذكاء الاصطناعي المتقدمة.

إنها مشكلة حصرية: وحدات معالجة الرسومات مثل الطائرات الخاصة للذكاء الاصطناعي، فهي سريعة وقوية، ولكنها متاحة فقط لدائرة صغيرة من المنظمات الممولة جيدًا.

لكن الاعتراف بهذه الحدود لا يعني رفض وحدات معالجة الرسومات بشكل كامل. لا يزالون استثنائيين لبعض فئات النماذج وأنماط الإنتاج. استراتيجية الوحدات المركزية للمعالجة الأولى ليست معادية لوحدات معالجة الرسومات. إنها حل ذكي التكلفة.

هذا النهج يوسع الوصول ويكفل أن تنفيذ الذكاء الاصطناعي يتم بواسطة الكفاءة، لا بالسمعة. بدلاً من مستقبل محدد بالحصرية لوحدات معالجة الرسومات، تفتح الوحدات المركزية للمعالجة بابًا لتنفيذ الذكاء الاصطناعي القابل للتطوير والمتاح والشامل.

التبديل الضروري إلى نماذج مدفوعة بالوحدات المركزية للمعالجة

إذا كان اقتصاد الذكاء الاصطناعي سيتوسع بشكل مستدام، فإن الحل هو إعادة تخيل كيفية تدريب النماذج وتنفيذها. أحد النهج هو الأولوية للبيانات عالية الإントروبي وcases الحافة أثناء التدريب. هذه المدخلات تدفع التقدم المهم وتقلل من الحاجة إلى مجموعات بيانات ضخمة، مما يسمح للنماذج بالتشغيل مع معاملات أقل مع الحفاظ على الفعالية العالية.

من خلال كونها مدمجة بدرجة كافية للعمل على وحدات معالجة مركزية عادية، سواء في الحواسيب المحمولة أو الهواتف الذكية أو الخواديم أو أجهزة إنترنت الأشياء، تقلل هذه النماذج بشكل كبير من تكاليف الاستدلال واستهلاك الطاقة. كما تمكن المعالجة في الوقت الفعلي مباشرة على الجهاز، مما يقلل من التأخير ويعزز الخصوصية من خلال الحفاظ على البيانات الحساسة محليًا.

هذا التحول ليس فقط حول التكلفة؛ إنه أيضًا حول العدالة. في قطاعات مثل الرعاية الصحية، حيث توجد “صحاري” للوصول، يمكن لتنفيذ الوحدات المركزية للمعالجة على الطرف أن يغلق الفجوات من خلال تقديم أدوات الذكاء الاصطناعي المتقدمة مباشرة إلى العيادات أو مراكز الاتصال أو الأجهزة الميدانية دون الاعتماد على مجموعات الحوسبة المركزية النادرة.

من القوة إلى الوصول: الوحدات المركزية للمعالجة كمساوم كبير في الذكاء الاصطناعي

ستختبر السنوات القادمة ليس فقط من يمكنه بناء نماذج الذكاء الاصطناعي الأكثر قوة، ولكن من يمكنه تقديمها بكفاءة وустойчивة ومتوفرة على نطاق واسع. تقدم نماذج الوحدات المركزية للمعالجة، الجاهزة للطرف، طريقًا للأمام. من خلال تمكين الذكاء الاصطناعي من العمل بشكل فعال على الأجهزة العادية، تقلل هذه النماذج من الحواجز للشركات الناشئة والباحثين، وتقلل من الاعتماد على سلاسل التوريد الهشة، وتجلب التطبيقات المتقدمة إلى البيئات التي تكون فيها مجموعات وحدات معالجة الرسومات المركزية غير عملية.

تقييم بنية الذكاء الاصطناعي من خلال مقاييس مثل التكلفة الإجمالية لكل ساعة تم تحويلها، ودرجات النشر، وجاهزية الطرف، يضمن أن الحلول يتم تقييمها ليس فقط من حيث دقة البenchmark ولكن أيضًا من خلال قابليتها للتوسع بأسعار معقولة وشاملة في العالم الحقيقي.

المخاطر عالية. إذا استمرت الصناعة في معاملة وحدات معالجة الرسومات كافتراضية، ستبقى الوصول حصرية، وستتركز الابتكارات، وستتأخر الانتشار إلى الخدمات العامة والرعاية الصحية والقطاعات الناشئة. لكن إذا تم تبني استراتيجيات الوحدات المركزية للمعالجة الأولى والجاهزة للطرف، يمكن للذكاء الاصطناعي أن يصبح أكثر متانة وخصوصية ومتاحًا. هذا لا يُعد فقط مستوى اللعب، بل يحددَه.

ريتو مهروترا، المؤسس والمدير التنفيذي لشركة Shunya Labs هو قائد متمرس في تكنولوجيا المستهلك والذكاء الاصطناعي، وقد وسع الشركات عبر أمريكا الشمالية وآسيا وأوروبا. وهو ناجي من السرطان، وهو الآن ملتزم بتحسين الصحة النفسية على مستوى العالم من خلال كسر الحواجز أمام الوصول والجودة والتكلفة.