الذكاء الاصطناعي 101
وحدات المعالجة العصبية (NPUs): القوة الدافعة وراء الجيل التالي من الذكاء الاصطناعي والحوسبة
تماماً مثل كيف غطست وحدات معالجة الرسومات (GPUs) على وحدات المعالجة المركزية (CPUs) لمحملات الذكاء الاصطناعي، وحدات المعالجة العصبية (NPUs) على وشك تحدي وحدات معالجة الرسومات من خلال تقديم أداء أسرع وأكثر كفاءة – خاصة لذكاء اصطناعي التوليد، حيث يجب أن تحدث المعالجة في الوقت الفعلي بسرعة البرق وبكلفة أقل.
السؤال هو كيف تعمل وحدات المعالجة العصبية، ولماذا هي تتقدم على سابقاتها من وحدات معالجة الرسومات لل任务ات الذكاء الاصطناعي الحديثة، وما الذي يجعلها لا غنى عنها لكل شيء من بنية تحتية مركز بيانات قوية إلى أجهزة المستهلكين اليومية؟ سواء كنت تخطط لتنفيذ الذكاء الاصطناعي التالي أو مجرد فضول حول آخر ما توصل إليه التكنولوجيا، من المهم فهم لماذا يمكن أن تكون وحدات المعالجة العصبية هي الإنجاز الذي يعيد تعريف الذكاء الاصطناعي – والجيل التالي من الحوسبة.
ما هي وحدة المعالجة العصبية (NPU)؟
وحدة المعالجة العصبية (NPU) هي معالج دقيق متخصص مبني من الأرض إلى الأعلى لمعالجة متطلبات الذكاء الاصطناعي والتعلم الآلي الحديث. في حين أن وحدات المعالجة المركزية (CPUs) ووحدات معالجة الرسومات (GPUs) قامت تاريخياً بتشغيل المهام الحاسوبية التقليدية وتصيير الرسومات، لم تكن مصممة في الأصل لمواجهة الكثافة الحسابية للشبكات العصبية العميقة. تملأ وحدات المعالجة العصبية هذا الفجوة من خلال التركيز بشكل خاص على العمليات المتوازية والعالية الإنتاجية مثل ضرب الماتريكس ورياضيات التنسور – التي هي أساس نماذج الذكاء الاصطناعي.
الجوانب الرئيسية التي تميز وحدات المعالجة العصبية عن وحدات المعالجة المركزية ووحدات معالجة الرسومات العامة تشمل:
- الحسابات الحسابية المُختزلة: غالباً ما تستخدم وحدات المعالجة العصبية أنواع بيانات منخفضة الدقة (مثل حساب الأعداد الصحيحة 8 بت، أو حتى أقل) للتوازن بين قوة المعالجة والكفاءة في استهلاك الطاقة، في حين تعتمد وحدات المعالجة المركزية ووحدات معالجة الرسومات على حسابات النقطة العائمة بدقة أعلى.
- الهيكل المتوازي: يمكن لوحدات المعالجة العصبية تقسيم مهام الذكاء الاصطناعي إلى آلاف (أو حتى ملايين) من الحسابات الصغيرة التي تتم بشكل متوازي، مما يزيد بشكل كبير من الإنتاجية.
- الكفاءة في استهلاك الطاقة: من خلال إlimination التعليمات غير الضرورية وتحسينها بشكل خاص لمهام الشبكات العصبية، يمكن لوحدات المعالجة العصبية تحقيق أداء أعلى عند استهلاك طاقة أقل مقارنة بوحدات معالجة الرسومات أو وحدات المعالجة المركزية التي ت执行 نفس حمولة الذكاء الاصطناعي.
تُعرف أيضاً باسم مسرعات الذكاء الاصطناعي، تظهر وحدات المعالجة العصبية غالباً كأجهزة عتاد منفصلة متصلة بلوحات الأم أو كجزء من نظام على شريحة (SoC) في الهواتف الذكية أو أجهزة الحواف أو أجهزة الحوسبة الحافة.
لماذا تهم وحدات المعالجة العصبية للذكاء الاصطناعي التوليدي
الارتفاع المتفجر للذكاء الاصطناعي التوليدي – الذي يشمل نماذج اللغة الكبيرة (LLMs) مثل ChatGPT وأدوات توليد الصور مثل DALL·E ونماذج التوليد الفيديوي – ي đòiند منصات حسابية يمكنها التعامل مع كميات هائلة من البيانات، ومعالجتها في الوقت الفعلي، والتعلم منها بفعالية. يمكن لمعالجات التقليدية أن ت투اجه صعوبات مع هذه المتطلبات، مما يؤدي إلى استهلاك طاقة مرتفع، وزيادة في التأخير، وحدوث انسداد في الإنتاجية.
مميزات وحدات المعالجة العصبية الرئيسية للذكاء الاصطناعي التوليدي
- المعالجة في الوقت الفعلي: تتضمن نماذج الذكاء الاصطناعي التوليدي مثل المُحولات ونمذجة الانتشار والشبكات التوليدية المعارضة عمليات متعددة للماتريكس والتنسور. تتفوق وحدات المعالجة العصبية في ضرب الماتريكس وإضافة المتجهات بشكل متوازي، مما يساعد نماذج التوليد على تحقيق أداء منخفض التأخير.
- التوسع: تم تصميم وحدات المعالجة العصبية خصيصاً للتمديد المتوازي، مما يجعلها مناسبة للархيتكتур الكبيرة المستخدمة في الذكاء الاصطناعي التوليدي. يمكن إضافة المزيد من نواة وحدات المعالجة العصبية أو وحدات المعالجة العصبية إلى кластер مركز البيانات لزيادة الأداء بشكل خطي دون زيادة التكاليف الطاقوية بشكل كبير.
- الكفاءة في استهلاك الطاقة:随ما يزيد تعقيد نماذج التوليد، يزيد أيضاً استهلاكها للطاقة. تساعد وحدات المعالجة العصبية في الحفاظ على بصمة الطاقة تحت السيطرة من خلال التركيز على نوع الرياضيات الذي يحتاجه الذكاء الاصطناعي التوليدي، وإlimination الحسابات الزائدة.
الخصائص الرئيسية لوحدات المعالجة العصبية
- المعالجة المتوازية: من خلال تقسيم المهام الحسابية إلى مهام صغيرة عديدة، يمكن لوحدات المعالجة العصبية التعامل مع عمليات الماتريكس الشاسعة بسرعة أكبر بكثير من وحدات المعالجة المركزية، التي تنفذ تعليماتها بشكل خطي أو متسلسل. هذا التوازي أمر بالغ الأهمية لمهام التعلم العميق، حيث يتضمن التدريب والاستدلال كميات كبيرة من البيانات.
- الحسابات الرياضية منخفضة الدقة: لا تتطلب معظم الحسابات في الشبكات العصبية دقة العمليات النقطة العائمة (32 بت أو 64 بت). تقلل أنواع البيانات منخفضة الدقة، مثل الأعداد الصحيحة 8 بت، بشكل كبير من عدد البتات المعالجة لكل عملية، مما يسمح بتنفيذ أسرع وأكثر كفاءة في استهلاك الطاقة مع الحفاظ على دقة النموذج.
- ذاكرة على الشريحة عالية السرعة: القدرة على الاحتفاظ بكميات كبيرة من بيانات التدريب أو الاستدلال بالقرب من المعالج هي أمر بالغ الأهمية لمهام الذكاء الاصطناعي. تتميز العديد من وحدات المعالجة العصبية بذاكرة على الشريحة عالية السرعة (HBM) أو أنظمة ذاكرة متقدمة مصممة خصيصاً للشبكات العصبية، مما يقلل من الحاجة إلى التواصل المستمر مع الذاكرة الخارجية.
- تقنيات التعجيل بالعتاد: غالباً ما تتضمن معمارية وحدات المعالجة العصبية الحديثة وحدات عتاد متخصصة مثل مصفوفات السستولية أو نواة التنسور، مما يسمح لها بتنفيذ ضرب الماتريكس وعمليات أخرى محددة للذكاء الاصطناعي بسرعات خيالية مع الحد الأدنى من العوائق.
كيف تعمل وحدات المعالجة العصبية: محاكاة الدماغ
تستمد وحدات المعالجة العصبية الإلهام من الشبكات العصبية في دماغ الإنسان. تماماً مثل مليارات الخلايا العصبية والسنابس التي تعالج المعلومات بشكل متوازي، تتكون وحدة المعالجة العصبية من عناصر معالجة متعددة قادرة على التعامل مع مجموعات بيانات كبيرة بشكل متوازي. هذا التصميم هو فعال بشكل خاص لمهام مثل:
- التعرف على الصور ومعالجتها
- معالجة اللغة الطبيعية (NLP) والتعرف على الكلام
- كشف الكائنات والتنقل المستقل
- الذكاء الاصطناعي التوليدي (مثل توليد الصور والنص)
الأوزان الشبكية والتعلم
ركن أساسي من حسابات الشبكة العصبية هو مفهوم الأوزان، التي تمثل “القوة” أو “الأهمية” لكل اتصال عصبوني في الشبكة. تدمج وحدات المعالجة العصبية هذه الأوزان مباشرة في العتاد، مما يسمح بتحديثات أسرع وأكثر كفاءة في استهلاك الطاقة عندما يتعلم النموذج.
نواة عالية السعة مبسطة
في حين تعاملت وحدات المعالجة المركزية تقليدياً مع عمليات متعددة ومتنوعة (من تصفح الويب إلى حسابات جداول البيانات)، تُبسط وحدات المعالجة العصبية التصميم لتركيزه على عدد قليل من العمليات الأساسية – مثل ضرب الماتريكس ودالات التنشيط والتحويل – يتم تنفيذها بشكل متكرر ومتوازي.
وحدات المعالجة العصبية مقابل وحدات معالجة الرسومات مقابل وحدات المعالجة المركزية
تؤدي كل نوع من أنواع المعالجات دوراً فريداً في الحوسبة الحديثة، على الرغم من وجود بعض الت重lapping عندما يتعلق الأمر بمعالجة مهام الذكاء الاصطناعي. هنا ملخص سريع:
| الميزة | وحدة المعالجة المركزية | وحدة معالجة الرسومات | وحدة المعالجة العصبية |
|---|---|---|---|
| الاستخدام الرئيسي | المهام العامة، المنطق، والتحكم | تصيير الرسومات، معالجة متوازية للمهام عالية الأداء | معالجة متوازية متخصصة للذكاء الاصطناعي والتعلم الآلي والتعلم العميق |
| عدد النواة | قليلاً (غالبًا 2-16 في شرائح المستهلكين) | مئات أو آلاف النواة الصغيرة | مصفوفة متوازية من النواة المتخصصة |
| الدقة | عادة دقة عالية (32 بت أو 64 بت) | مزيج من الدقة الأعلى والأقل (FP32، FP16، إلخ) | تركيز على دقة منخفضة (8 بت أو أقل) |
| الكفاءة في استهلاك الطاقة (الذكاء الاصطناعي) | متوسطة عند التوسيع لمهام الذكاء الاصطناعي الكبيرة | جيدة، ولكن يمكن أن تكون متطلبة للطاقة عند التوسيع | مُحسنة بشكل كبير، أقل طاقة لكل عملية |
| البصمة المادية | متكاملة في اللوحة الرئيسية أو نظام على شريحة | غالبًا بطاقات منفصلة (وحدات معالجة رسومات منفصلة) أو نظام على شريحة | يمكن أن تكون منفصلة أو متكاملة في نظام على شريحة (هواتف ذكية، إلخ) |
الاستنتاج: في حين تبقى وحدات المعالجة المركزية حاسمة للسيطرة على النظام والعمليات التقليدية، وتقدم وحدات معالجة الرسومات قوة معالجة متوازية قوية (特别 للمهام الرسومية الثقيلة)، وحدات المعالجة العصبية مُصممة خصيصاً لتسريع الذكاء الاصطناعي وتعمل عادة ب性能 أعلى لكل وات لمحملات التعلم الآلي.
التطبيقات العملية لوحدات المعالجة العصبية
مراكز البيانات والحوسبة السحابية للذكاء الاصطناعي
تضم مراكز البيانات الكبيرة وحدات معالجة عصبية منفصلة يمكن ربطها مباشرة بلوحات الأم للخادم. هذه الوحدات تعجل كل شيء من محركات التوصية (مثل تلك التي تعمل على Netflix وAmazon) إلى الذكاء الاصطناعي التوليدي مثل توليد النص والصورة في الوقت الفعلي.
الهواتف الذكية والأجهزة الإلكترونية الاستهلاكية
تتضمن العديد من الهواتف الذكية والأجهزة اللوحية والهواتف المحمولة اليوم وحدات معالجة عصبية أو محركات الذكاء الاصطناعي مباشرة في نظامها على الشريحة. محرك Neural من Apple ومحرك Hexagon NPU من Qualcomm ومحرك معالجة عصبية من Samsung هي أمثلة على الحلول المتكاملة. هذا النهج يسمح ب:
- معالجة الصور والفيديو في الوقت الفعلي (مثل تقليل الضوضاء في المكالمات الفيديو)
- مساعدي الصوت على الجهاز (مع التعرف على الكلام)
- ميزات الكاميرا الذكية مثل كشف المشهد والتعرف على الوجوه وتثبيت الصورة المتقدمة
أجهزة الحواف والإنترنت للأشياء
أصبحت وحدات المعالجة العصبية حاسمة في حوسبة الحواف، حيث تحتاج الأجهزة إلى معالجة البيانات محلياً بدلاً من إرسالها إلى السحابة. هذا قيم بشكل خاص للتطبيقات التي تتطلب تأخيرات منخفضة أو خصوصية البيانات أو ردود فعل في الوقت الفعلي – فكر في أجهزة المنزل الذكية ومستشعرات الصناعة 4.0 والطائرات بدون طيار والمركبات المستقلة والمزيد.
الروبوتات
من الروبوتات الآلية في المستودعات إلى مساعدي الجراحة الروبوتية، يمكن لوحدات المعالجة العصبية اتخاذ قرارات في غمضة عين بناءً على المدخلات الحسية. khảيتها لمعالجة تدفقات الفيديو (كشف الكائنات والتعرف على الأنماط) وبقية بيانات الحس هي تحويلية للجيل التالي من الروبوتات المستقلة وشبه المستقلة.
وحدات المعالجة العصبية للحوسبة الحوافية والذكاء الاصطناعي على الجهاز
لماذا تهمنا حوسبة الحواف
随ما ينتشر الذكاء الاصطناعي في الأجهزة القابلة للارتداء والمستشعرات البعيدة وأجهزة الإنترنت للأشياء، يمكن أن تكون القدرة على معالجة البيانات قرب المصدر (بدلاً من السحابة) أكثر أهمية من أي وقت مضى. تقلل حوسبة الحواف الذكاء الاصطناعي من تكاليف نقل البيانات، وتخفف من مشاكل التأخير، وتحافظ على المعلومات الحساسة على الجهاز – تحسين الأمان والخصوصية على حد سواء.
دور وحدات المعالجة العصبية في الذكاء الاصطناعي الحافي
- استهلاك طاقة منخفض: غالبًا ما تعمل أجهزة الحواف بالبطارية أو تكون مقيدة بالطاقة. تحتاج إلى معالج ذكاء اصطناعي يمكنه العمل دون استنزاف الموارد. وحدات المعالجة العصبية، المُحسنة لمعالجة الماتريكس، هي الخيار المثالي.
- الرؤى في الوقت الفعلي: سواء كان ذلك كشف الشذوذ في مصنع أو إعادة توجيه طائرة بدون طيار أثناء الطيران، يمكن أن تكون قرارات الاستدلال في غمضة عين حاسمة لفيضان تطبيق. تقدم وحدات المعالجة العصبية هذه القدرة مع الحد الأدنى من العوائق.
- تطبيقات الهاتف الذكي: مع ظهور الذكاء الاصطناعي التوليدي على الجهاز، تعمل وحدات المعالجة العصبية في الهواتف الذكية بالفعل على تشغيل ميزات الكاميرا المتقدمة، والترجمة اللغوية في الوقت الفعلي، ومساعد الصوت الم意识 بالسياق.
مستقبل وحدات المعالجة العصبية والذكاء الاصطناعي
随ما يستمر الذكاء الاصطناعي التوليدي في زيادة قدراته بشكل أسي، سيزيد الطلب على الحوسبة عالية الأداء والفعالة في استهلاك الطاقة. بالفعل، تعمل شركات تصنيع العتاد مثل Intel وAMD وNvidia وApple وQualcomm وSamsung على دمج أو تحسين هياكل وحدات المعالجة العصبية الخاصة بها. كما تتجه مراكز البيانات نحو نماذج الحوسبة غير المتجانسة – حيث تتعايش وحدات المعالجة المركزية ووحدات معالجة الرسومات ووحدات المعالجة العصبية – لمعالجة حمولات العمل المتخصصة بشكل متزايد.
وحدات المعالجة العصبية للذكاء الاصطناعي التوليدي الجيل التالي
- التأخير المنخفض: يمكن لوحدات المعالجة العصبية المستقبلية تحقيق استدلال في الوقت الفعلي تقريباً، مما يجعل المساعدين الشخصيين الافتراضيين وتوليد المحتوى في الوقت الفعلي جزءاً لا يتجزأ من الحياة اليومية.
- تعديلات النموذج أثناء التنفيذ:随ما تصبح النماذج أكثر ديناميكية – تعديل هيكلها وأوزانها أثناء التنفيذ – سوف تتطور وحدات المعالجة العصبية لمعالجة سيناريوهات التعلم المستمر على الإنترنت.
- ما وراء الرؤية واللغة: سوف يمتد الذكاء الاصطناعي التوليدي قريباً إلى مخرجات متعددة الحواس، بما في ذلك التغذية المترية الحسية في الوقت الفعلي، وتوليد الكائنات ثلاثية الأبعاد، أو حتى تجارب صوتية وبصرية غامرة.
تعاون المعالجات المتعددة
تتضمن الحوسبة غير المتجانسة استغلال المعالج المناسب للوظيفة المناسبة. تعمل وحدة المعالجة المركزية على المهام العامة وتنسيقها، وتعالج وحدة معالجة الرسومات العمليات المتوازية الكبيرة (مثل الرسومات أو حسابات الماتريكس الكبيرة)، وتقوم وحدة المعالجة العصبية بمهام الذكاء الاصطناعي المتخصصة – خاصة استدلال الشبكات العصبية الكبيرة.
في هذا السيناريو المستقبلي، تصبح التطبيقات أكثر مرونة وقوة:
- الفن التوليدي يمكن أن يعمل محلياً، مع معالجة وحدة المعالجة العصبية مهام نقل الأسلوب أو التوسيع في الوقت الفعلي.
- برامج المؤسسة التي تتطلب معالجة لغة طبيعية بالذكاء الاصطناعي يمكنها تفويض تصحيح القواعد والفهم السياقي لوحدات المعالجة العصبية، في حين تنسق وحدة المعالجة المركزية مع وحدة معالجة الرسومات لمعالجة البيانات.
- المحاكاة المعقدة في البحث العلمي يمكن تقسيمها بين وحدة المعالجة المركزية ووحدة معالجة الرسومات ووحدات المعالجة العصبية لمعالجة مليارات النقاط البيانية بفعالية.
الابتكار السريع للعتاد والبرمجيات
بسبب الحاجة إلى تسريع سريع للذكاء الاصطناعي، تتسارع الابتكارات في العتاد والبرمجيات:
- مجموعات التعليمات المخصصة: يتم تطوير العديد من وحدات المعالجة العصبية مع مجموعات تعليمات ملكية متوافقة مع الخوارزميات المتطورة للذكاء الاصطناعي.
- إطارات الذكاء الاصطناعي الموحدة: تواصل إطارات الذكاء الاصطناعي (مثل TensorFlow وPyTorch وONNX) تحسينها لخلفيات وحدات المعالجة العصبية، مما يبسط سير عمل المطورين.
- التقارب بين الحواف والسحابة: يمكن لنفس حمولات الذكاء الاصطناعي التي كانت مقيدة بالسحابة الآن أن تنتشر عبر وحدات معالجة الرسومات السحابية ووحدات المعالجة العصبية، أو مباشرة على أجهزة الحواف.
الختام
وحدات المعالجة العصبية (NPUs) تُشير إلى عصر جديد من العتاد المخصص للذكاء الاصطناعي، وتعالج مباشرة التحديات التي تطرحها الشبكات العصبية العميقة والذكاء الاصطناعي التوليدي ومعالجة البيانات الكبيرة. من خلال التركيز على حمولات العمل المتوازية ومنخفضة الدقة، تقدم وحدات المعالجة العصبية أداءً غير مسبوق، وكفاءة في استهلاك الطاقة، ومتانة – منافع لا غنى عنها لا فقط للحوسبة السحابية للذكاء الاصطناعي المتقدم ولكن أيضاً لأجهزة المستهلكين اليومية والتطبيقات الناشئة للحواف.
أهميتهم في مستقبل الذكاء الاصطناعي لا يمكن التقليل منها.随ما يزداد الطلب على الذكاء الاصطناعي التوليدي على الجهاز، وت trởає الحوسبة غير المتجانسة معياراً، من المرجح أن تصبح وحدات المعالجة العصبية جزءاً لا يتجزأ من الأنظمة التي تعتمد على الذكاء الاصطناعي، مثل وحدة المعالجة المركزية في الحوسبة التقليدية. سواء كانت تمكين الترجمة اللغوية في الوقت الفعلي على هاتفك أو تنسيق نماذج اللغة الكبيرة في مركز البيانات، وحدة المعالجة العصبية على وشك تحويل كيفية تعلم الآلات وتفاعلها مع العالم – معطية نظرة على مستقبل أكثر ذكاء وتفاعلاً وتكاملًا وفعاليّة في استهلاك الطاقة.








