Connect with us

صعود وحدات المعالجة العصبية: تعزيز الذكاء الاصطناعي التوليدي على الجهاز من أجل السرعة والاستدامة

الذكاء الاصطناعي

صعود وحدات المعالجة العصبية: تعزيز الذكاء الاصطناعي التوليدي على الجهاز من أجل السرعة والاستدامة

mm

تطور الذكاء الاصطناعي التوليدي ليس فقط يغير طريقة تفاعلنا وتجاربنا مع أجهزة الحاسوب، بل ي重新 يحدد أيضًا الحوسبة الأساسية. واحد من المحركات الرئيسية لهذا التحول هو الحاجة إلى تشغيل الذكاء الاصطناعي التوليدي على أجهزة ذات موارد حوسبية محدودة. يناقش هذا المقال التحديات التي تطرحها هذه الحاجة وكيف وحدات المعالجة العصبية (NPUs) تظهر لتحل هذه المشاكل. بالإضافة إلى ذلك، يقدم المقال بعضًا من أحدث معالجات وحدات المعالجة العصبية التي تتقدم في هذا المجال.

تحديات البنية التحتية للذكاء الاصطناعي التوليدي على الجهاز

الذكاء الاصطناعي التوليدي، الذي يقوم خلف توليد الصور وكتابة النصوص وتأليف الموسيقى، ي đòiي موارد حوسبية كبيرة. بشكل تقليدي، تم تلبية هذه المطالب من خلال الاستفادة من قدرات منصات السحابة الواسعة. ومع ذلك، فإن هذا النهج يأتي مع مجموعة من التحديات الخاصة بالذكاء الاصطناعي التوليدي على الجهاز، بما في ذلك الاعتماد على الاتصال الدائم بالإنترنت والبنية التحتية المركزية. هذا الاعتماد ي導ي إلى التأخير وثغرات الأمان وزيادة استهلاك الطاقة.
الأساس الرئيسي للبنية التحتية للذكاء الاصطناعي في السحابة يعتمد إلى حد كبير على وحدات المعالجة المركزية (CPUs) ووحدات معالجة الرسومات (GPUs) لمعالجة مطالب الذكاء الاصطناعي التوليدي. ومع ذلك، عندما يتم تطبيق هذه المعالجات على الذكاء الاصطناعي التوليدي على الجهاز، تواجه هذه المعالجات عقبات كبيرة. وحدات المعالجة المركزية مصممة للمهام العامة وتفتقر إلى الهيكل المتخصص اللازم لتنفيذ كفء وذو طاقة منخفضة لتحميلات العمل التوليدي. قوة معالجتها المتوازية المحدودة تؤدي إلى انخفاض الإنتاجية وزيادة التأخير وزيادة استهلاك الطاقة، مما يجعلها أقل ملاءمة للذكاء الاصطناعي على الجهاز. من ناحية أخرى، بينما يمكن لوحدات معالجة الرسومات التمييز في المعالجة المتوازية، فهي مصممة في الأساس لمهام معالجة الرسومات. لتنفيذ مهام الذكاء الاصطناعي التوليدي بفعالية، تحتاج وحدات معالجة الرسومات إلى دوائر متكاملة متخصصة، والتي تستهلك طاقة عالية وتنتج حرارة كبيرة. بالإضافة إلى ذلك، حجمها الكبير يخلق عقبات لاستخدامها في التطبيقات المدمجة على الجهاز.

ظهور وحدات المعالجة العصبية (NPUs)

استجابةً للتحديات المذكورة أعلاه، تظهر وحدات المعالجة العصبية (NPUs) كتكنولوجيا تحويلية لتنفيذ الذكاء الاصطناعي التوليدي على الأجهزة. الهيكل المعماري لوحدات المعالجة العصبية مستوحى في الأساس من هيكل ووظيفة الدماغ البشري، ولا سيما كيف تعمل الخلايا العصبية والسينابس معًا لمعالجة المعلومات. في وحدات المعالجة العصبية، تعمل الخلايا العصبية الاصطناعية كوحدات أساسية، تقليد الخلايا العصبية البيولوجية بتلقي الإدخالات ومعالجتها وإنتاج الإخراج. هذه الخلايا العصبية متصلة ببعضها البعض عبر سينابس اصطناعية، والتي تنقل الإشارات بين الخلايا العصبية بقوة متغيرة خلال عملية التعلم. هذا يقلد عملية تغيير وزن السينابس في الدماغ. وحدات المعالجة العصبية منظمة في طبقات؛ طبقات الإدخال التي تتلقى البيانات الخام، وطبقات خفية تقوم بمعالجة متوسطة، وطبقات الإخراج التي تنتج النتائج. هذا الهيكل المتدرج يعكس قدرة الدماغ على معالجة المعلومات المتعددة المراحل والمتوازية. نظرًا لأن الذكاء الاصطناعي التوليدي يُبنى أيضًا باستخدام هيكل مشابه من الشبكات العصبية الاصطناعية، فإن وحدات المعالجة العصبية مناسبة جيدًا لإدارة تحملات العمل التوليدي. هذا التأثير الهيكلي يقلل من الحاجة إلى دوائر متكاملة متخصصة، مما يؤدي إلى حلول أكثر ضيقًا وذات كفاءة في استهلاك الطاقة وسريعة ومستدامة.

معالجة الاحتياجات الحسابية المتنوعة للذكاء الاصطناعي التوليدي

الذكاء الاصطناعي التوليدي يครอบ مجموعة واسعة من المهام، بما في ذلك توليد الصور وكتابة النصوص وتأليف الموسيقى، كل منها له احتياجات حسابية فريدة. على سبيل المثال، يعتمد توليد الصور بشكل كبير على عمليات المصفوفات، بينما تتضمن كتابة النصوص معالجة متسلسلة. لمعالجة هذه الاحتياجات الحسابية المتنوعة بفعالية، غالبًا ما يتم دمج وحدات المعالجة العصبية (NPUs) في تكنولوجيا النظام على الشريحة (SoC) جنبًا إلى جنب مع وحدات المعالجة المركزية ووحدات معالجة الرسومات.
كل من هذه المعالجات تقدم قوة حسابية متميزة. وحدات المعالجة المركزية ملائمة بشكل خاص للسيطرة المتسلسلة والفورية، ووحدات معالجة الرسومات تتميز في بث البيانات المتوازية، ووحدات المعالجة العصبية محسنة لعمليات الذكاء الاصطناعي الأساسية، وتتعامل مع الرياضيات السكالي والเวكторي والتنسوري. من خلال استخدام هيكل الحوسبة الهجين، يمكن تعيين المهام إلى معالجات بناءً على قوتهم ومتطلبات المهمة المحددة.
وحدات المعالجة العصبية، كونها محسنة لتحميلات العمل للذكاء الاصطناعي، يمكنها تفريغ مهام الذكاء الاصطناعي التوليدي بفعالية من وحدة المعالجة المركزية الرئيسية. هذا التفريغ لا يضمن فقط عمليات سريعة وذات كفاءة في استهلاك الطاقة ولكن أيضًا يعجل بمهام الاستدلال للذكاء الاصطناعي، مما يسمح للنماذج التوليدي للذكاء الاصطناعي بالتشغيل بشكل أسهل على الجهاز. مع معالجة وحدات المعالجة العصبية للمهام المتعلقة بالذكاء الاصطناعي، تكون وحدات المعالجة المركزية ووحدات معالجة الرسومات حرة في تخصيص الموارد لمهام أخرى، مما يُحسن أداء التطبيق بشكل عام مع الحفاظ على الكفاءة الحرارية.

أمثلة حقيقية من وحدات المعالجة العصبية

تتقدم تكنولوجيا وحدات المعالجة العصبية بسرعة. هنا بعض الأمثلة الحقيقية لوحدات المعالجة العصبية:

  • وحدات المعالجة العصبية Hexagon من Qualcomm مصممة خصيصًا لتسريع مهام الاستدلال للذكاء الاصطناعي عند طاقة و موارد منخفضة. وهي مبنية لمعالجة مهام الذكاء الاصطناعي التوليدي مثل توليد النصوص وتوليد الصور ومعالجة الصوت. يتم دمج وحدة المعالجة العصبية Hexagon في منصات Qualcomm Snapdragon، مما يوفر تنفيذًا فعالًا لنمذجة الشبكات العصبية على الأجهزة التي تحتوي على منتجات Qualcomm للذكاء الاصطناعي.
  • محرك Neural من Apple هو مكون رئيسي في شرائح سلسلة A وسلسلة M، مما يزوّد العديد من الميزات التي تعتمد على الذكاء الاصطناعي مثل Face ID وSiri والواقع المعزز (AR). يسرع محرك Neural المهام مثل التعرف على الوجه لأمان Face ID ومعالجة اللغة الطبيعية (NLP) لSiri وتعقب الكائنات وتفهم المشاهد المعزز للتطبيقات AR. إنه يحسن بشكل كبير أداء المهام المتعلقة بالذكاء الاصطناعي على أجهزة Apple، مما يوفر تجربة مستخدم سلسة وفعالة.
  • وحدة المعالجة العصبية من Samsung هي معالج متخصص لعمليات الذكاء الاصطناعي، قادر على معالجة آلاف الحسابات في نفس الوقت. يتم دمجها في أحدث منصات Samsung Exynos SoCs، التي تعمل بالعديد من هواتف Samsung، هذه التكنولوجيا تعمل على تمكين حسابات الذكاء الاصطناعي التوليدي بسرعة وطاقة منخفضة. تكنولوجيا وحدة المعالجة العصبية من Samsung أيضًا متكاملة في تلفزيونات الفлагمان، مما يسمح بالابتكارات الصوتية التي تعتمد على الذكاء الاصطناعي وتحسين تجارب المستخدم.
  • هيكل Da Vinci من Huawei يخدم كالنواة لمنصة معالج Ascend AI من Huawei، مصممة لتعزيز قوة الحوسبة للذكاء الاصطناعي. يعتمد الهيكل على محرك حسابي ثلاثي الأبعاد عالي الأداء، مما يجعله قويًا لتحميلات العمل للذكاء الاصطناعي.

الخلاصة

الذكاء الاصطناعي التوليدي يغير طريقة تفاعلنا مع الأجهزة ويعيد تعريف الحوسبة. تحدي تشغيل الذكاء الاصطناعي التوليدي على أجهزة ذات موارد حوسبية محدودة كبير، وغالبًا ما تفشل وحدات المعالجة المركزية التقليدية ووحدات معالجة الرسومات في تلبية هذه الاحتياجات. توفر وحدات المعالجة العصبية (NPUs) حلًا واعدًا بفضل هيكلها المتخصص المصمم لتلبية مطالب الذكاء الاصطناعي التوليدي. من خلال دمج وحدات المعالجة العصبية في تكنولوجيا النظام على الشريحة (SoC) جنبًا إلى جنب مع وحدات المعالجة المركزية ووحدات معالجة الرسومات، يمكننا استخدام قوة كل معالج، مما يؤدي إلى أداء الذكاء الاصطناعي أسرع وأكثر كفاءة وذات استدامة على الأجهزة. مع استمرار تطور وحدات المعالجة العصبية، فهي على وشك تعزيز قدرات الذكاء الاصطناعي على الأجهزة، مما يجعل التطبيقات أكثر استجابة وذات كفاءة في استهلاك الطاقة.

الدكتور تيهسين زيا هو أستاذ مساعد دائم في جامعة كومساتس إسلام آباد، وحاصل على دكتوراه في الذكاء الاصطناعي من جامعة التكنولوجيا في فيينا، النمسا. يتخصص في الذكاء الاصطناعي وتعلم الآلة وعلوم البيانات ورؤية الكمبيوتر، وقدم مساهمات كبيرة من خلال منشورات في مجلات علمية مشهورة. كما قاد الدكتور تيهسين مشاريع صناعية مختلفة كمستслед رئيسي وقدم خدماته كمستشار في الذكاء الاصطناعي.