Connect with us

Enfabrica تكشف عن منسق ذاكرة قائم على إيثرنت يمكن أن يعيد تعريف الاستدلال الاصطناعي على نطاق واسع

الذكاء الاصطناعي

Enfabrica تكشف عن منسق ذاكرة قائم على إيثرنت يمكن أن يعيد تعريف الاستدلال الاصطناعي على نطاق واسع

mm

Enfabrica، شركة ناشئة مقرها وادي السيليكون ومدعومة من Nvidia، كشفت عن منتج ثوري قد يغير بشكل كبير طريقة نشر وتوسيع حمولة العمل الاصطناعي على نطاق واسع. نظام منسق الذاكرة المرن (EMFASYS) الجديد للشركة هو أول منسق ذاكرة قائم على إيثرنت متاح تجارياً مصمم خصيصاً لمعالجة العائق الأساسي لاستدلال الذكاء الاصطناعي التوليدي: الوصول إلى الذاكرة.

في وقت ينمو فيه نماذج الذكاء الاصطناعي في التعقيد والوعي السياقي والاستمرارية – مما يتطلب كميات هائلة من الذاكرة لكل جلسة مستخدم – يوفر نظام EMFASYS نهجاً جديداً لفصل الذاكرة عن الحوسبة، مما يسمح لمراكز البيانات الاصطناعية بتحسين الأداء بشكل كبير وتخفيض التكاليف وزيادة استخدام الموارد الأكثر تكلفة: وحدات معالجة الرسومات.

ما هو منسق الذاكرة – ولماذا يهم؟

تقليدياً، كانت الذاكرة داخل مراكز البيانات مرتبطة بشكل紧 ب الخادم أو العقدة التي تقع فيها. لكل وحدة معالجة رسومات أو وحدة معالجة مركزية وصول فقط إلى الذاكرة عالية السرعة المرفقة بها – عادةً HBM لوحدات معالجة الرسومات أو DRAM لوحدات المعالجة المركزية. يعمل هذا الهيكل جيداً عند حمولة العمل الصغيرة والقابلة للتنبؤ. لكن الذكاء الاصطناعي التوليدي غيّر اللعبة. تتطلب نماذج اللغة الكبيرة وصولاً إلى نوافذ سياقية كبيرة وتاريخ المستخدم وذاكرة متعددة الوكلاء – كل ذلك يجب معالجته بسرعة ودون تأخير. غالباً ما تتجاوز هذه المتطلبات الذاكرة القابلة للوصول، مما يخلق عائقاً يؤدي إلى تقليل استخدام وحدات معالجة الرسومات وزيادة تكاليف البنية التحتية.

يحل منسق الذاكرة هذا بالتحول إلى مورد ذاكرة مشترك وموزع – نوع من برك الذاكرة المرفقة بالشبكة يمكن الوصول إليها بواسطة أي وحدة معالجة رسومات أو وحدة معالجة مركزية في المجموعة. فكر في إنشاء “سحابة ذاكرة” داخل رف مراكز البيانات. بدلاً من تكرار الذاكرة عبر الخوادم أو إفراط في تحميل الذاكرة عالية السرعة المكلفة، يسمح المنسق بدمج الذاكرة وتنسيقها ووصولها عند الطلب عبر شبكة عالية السرعة. هذا يسمح لحمولة العمل الاصطناعي بالتوسع بشكل أكثر كفاءة دون أن يتم تقييدها بحدود الذاكرة الفيزيائية لأي عقدة مفردة.

نهج Enfabrica: إيثرنت و CXL معاً في النهاية

يحقق نظام EMFASYS هيكل الذاكرة على نطاق الرف هذا bằng الجمع بين تقنيتين قويتين: RDMA عبر إيثرنت و روابط التعبير الحاسوبي (CXL). الأولى تمكّن من نقل بيانات منخفض التأخير وعالية الإنتاجية عبر شبكات إيثرنت القياسية. الثانية تسمح بفصل الذاكرة عن وحدات المعالجة المركزية ووحدات معالجة الرسومات وتنسيقها في موارد مشتركة يمكن الوصول إليها عبر روابط CXL عالية السرعة.

في قلب نظام EMFASYS يوجد شريحة ACF-S من Enfabrica، شريحة “SuperNIC” بسعة 3.2 تيرابيت في الثانية التي تدمج التحكم في الشبكة والذاكرة في جهاز واحد. تسمح هذه الشريحة للخوادم بالواجهة مع برك ضخمة من ذاكرة DDR5 التقليدية – تصل إلى 18 تيرابايت لكل عقدة – موزعة عبر الرف. ومن المهم أن تفعل ذلك باستخدام منافذ إيثرنت القياسية، مما يسمح للمشغلين بالاستفادة من بنية تحتية مراكز البيانات الحالية دون الاستثمار في التوصيلات المملوكة.

ما يجعل نظام EMFASYS جذاباً بشكل خاص هو قدرته على إعادة توجيه حمولة العمل المرتبطة بالذاكرة ديناميكياً من ذاكرة HBM المرفقة بالوحدات الرسومية المكلفة إلى ذاكرة DRAM الأكثر ملاءمة للتكلفة، مع الحفاظ على تأخير الوصول على مستوى المايكروثانية. يتضمن مكدس البرمجيات خلف نظام EMFASYS آليات ذكية للتحكم في الذاكرة وتوازن الحمل التي تخفي التأخير وتنسق حركة الذاكرة بطرق غير ظاهرة لأنماط اللغة الكبيرة التي تعمل على النظام.

الآثار على صناعة الذكاء الاصطناعي

هذا ليس مجرد حل أجهزة ذكية – بل يمثل تحولاً فلسفياً في كيفية بناء البنية التحتية للذكاء الاصطناعي وتوسيعها. مع تحول الذكاء الاصطناعي التوليدي من المبتدئ إلى الضروري، مع معالجة مليارات الاستفسارات المستخدم يومياً، أصبح تكلفة خدمة هذه النماذج غير مستدامة للعديد من الشركات. غالباً ما تكون وحدات معالجة الرسومات غير مستخدمة ليس بسبب نقص الحوسبة، ولكن لأنها تظل في حالة انتظار للذاكرة. نظام EMFASYS يعالج هذا الخلل مباشرة.

من خلال تمكين الذاكرة المجمعة والمرتبطة بالمنسق والمتاحة عبر إيثرنت، تقدم Enfabrica مشغلين مراكز البيانات بديلاً قابلاً للتوسيع لمواصلة شراء المزيد من وحدات معالجة الرسومات أو HBM. بدلاً من ذلك، يمكنهم زيادة سعة الذاكرة بشكل متوازي، باستخدام ذاكرة DRAM التقليدية والشبكات الذكية، مما يقلل من الحجم الإجمالي ويعزز اقتصاديات استدلال الذكاء الاصطناعي.

تتجاوز الآثار المباشرة للتكاليف المحسنة. يفتح هذا النوع من الهيكل المنفصل الطريق لنموذج الذاكرة كخدمة، حيث يمكن أن تستمر السياق والتاريخ و状態 الوكيل ما وراء جلسة أو خادم مفرد، مما يفتح الباب لنظم الذكاء الاصطناعي أكثر ذكاء وpersonalization. كما يضع المرحلة لمراكز البيانات الاصطناعية الأكثر متانة، حيث يمكن توزيع حمولة العمل بشكل مرن عبر رف أو مركز بيانات كامل دون قيود ذاكرة صارمة.

النظر إلى الأمام

يتم حالياً اختبار نظام Enfabrica’s EMFASYS مع عملاء مختارين، ويُreported من رويترز أن مقدمي السحابة الكبيرة للذكاء الاصطناعي يختبرون بالفعل النظام. هذا يضع Enfabrica ليس كموفر مكونات فحسب، بل كممكن رئيسي في الجيل التالي من بنية تحتية الذكاء الاصطناعي.

من خلال فصل الذاكرة عن الحوسبة و جعلها متاحة عبر شبكات إيثرنت عالية السرعة والتقليدية، تقوم Enfabrica بتهيئة الأرضية لera جديدة من هيكل الذكاء الاصطناعي – واحدة حيث يمكن للاستدلال أن يتوسع دون تنازلات، حيث لا يتم إضاعة الموارد، وحيث يبدأ اقتصاد نشر نماذج اللغة الكبيرة أخيراً في الحصول على معنى.

في عالم يتم تعريفه بشكل متزايد بنظم الذكاء الاصطناعي الغنية بالسياق والوكلاء المتعددين، لم تعد الذاكرة ممثلاً مساعداً – بل هي المسرح. و Enfabrica تراهن على أن من يبني أفضل مسرح سوف يحدد أداء الذكاء الاصطناعي للأعوام القادمة.

أنطوان هو قائد رؤى ومؤسس شريك في Unite.AI، مدفوعًا بشغف لا يتزعزع لتشكيل وتعزيز مستقبل الذكاء الاصطناعي والروبوتات. رجل أعمال متسلسل، يعتقد أن الذكاء الاصطناعي سيكون مدمرًا للمجتمع مثل الكهرباء، وغالبًا ما يُقبض عليه وهو يثرثر عن إمكانات التكنولوجيات المدمرة و AGI.

كما أنه مستقبلي، فهو مخصص لاستكشاف كيف سيشكل هذه الابتكارات العالم. بالإضافة إلى ذلك، فهو مؤسس Securities.io، وهي منصة تركز على الاستثمار في التكنولوجيات المتقدمة التي تعيد تعريف المستقبل وتهيئ القطاعات بأكملها.