Connect with us

نيتو باتاك، المؤسس المشارك والرئيس التنفيذي لشركة Skymel – سلسلة المقابلات

مقابلات

نيتو باتاك، المؤسس المشارك والرئيس التنفيذي لشركة Skymel – سلسلة المقابلات

mm

نيتو باتاك، المؤسس المشارك والرئيس التنفيذي لشركة Skymel، يقود الشركة في ثورة الاستدلال بالذكاء الاصطناعي بتقنية NeuroSplit™ المبتكرة. إلى جانب الرئيس التقني سوشانت تريباثي، تقود باتاك مهمة Skymel لتعزيز أداء تطبيقات الذكاء الاصطناعي مع تقليل التكاليف الحسابية.

تعتبر NeuroSplit™ تقنية استدلال متكيفة توزع ديناميكيًا حمولة العمل الذكي بين أجهزة المستخدمين وخادمات السحابة. هذا النهج يستفيد من الموارد الحسابية الخاضعة في أجهزة المستخدمين، مما يقلل من تكاليف بنية السحابة بنسبة تصل إلى 60٪، ويعجل من سرعة الاستدلال، ويعزز خصوصية البيانات، ويمكّن التوسع السلس.

من خلال تحسين القدرة الحسابية المحلية، تسمح NeuroSplit™ لتطبيقات الذكاء الاصطناعي بالتشغيل بكفاءة حتى على بطاقات الرسومات القديمة، مما يقلل بشكل كبير من التكاليف مع تحسين تجربة المستخدم.

ما هو ما ألهمك لتأسيس Skymel، وما هي التحديات الرئيسية في بنية الذكاء الاصطناعي التي كنت تهدف إلى حلها مع NeuroSplit؟

جاءت الإلهام لتأسيس Skymel من تقارب خبراتنا المتممة. خلال فترة وجوده في جوجل، اكتشف شريكي المؤسس سوشانت تريباثي أن هناك كمية هائلة من القدرة الحسابية الخاضعة على أجهزة المستخدمين، لكن معظم الشركات لم تتمكن من استخدامها بشكل فعال بسبب التحديات الهندسية المعقدة للوصول إلى هذه الموارد دون المساس بتجربة المستخدم.

في غضون ذلك، أعطتني تجربتي في العمل مع الشركات وبدء الأعمال في Redis رؤية عميقة حول مدى أهمية التأخير بالنسبة للأعمال. مع انتشار تطبيقات الذكاء الاصطناعي، أصبح واضحًا أننا بحاجة إلى نقل المعالجة إلى أقرب نقطة من حيث إنشاء البيانات، بدلاً من نقل البيانات باستمرار ذهابًا وعودة إلى مراكز البيانات.

لذلك، أدرك سوشانت وأنا أن المستقبل لا يتعلق باختيار المعالجة المحلية أو السحابية – بل إنشاء تقنية ذكية يمكنها التكيف بسهولة بين المعالجة المحلية أو السحابية أو الهجينة بناءً على كل طلب استدلال محدد. أدى هذا الإدراك إلى تأسيس Skymel وتنمية NeuroSplit، متجاوزين القيود التقليدية للبنية التحتية التي كانت تعيق الابتكار في مجال الذكاء الاصطناعي.

يمكنك أن تفسر كيف تقوم NeuroSplit بتحسين الموارد الحسابية ديناميكيًا مع الحفاظ على خصوصية المستخدم وأداءه؟

أحد العوائق الرئيسية في استدلال الذكاء الاصطناعي المحلي هو متطلباته الحسابية الثابتة – تقليديًا، تشغيل نموذج ذكاء اصطناعي يتطلب نفس الموارد الحسابية بغض النظر عن ظروف الجهاز أو سلوك المستخدم. هذا النهج من الحجم الواحد ينسي حقيقة أن الأجهزة تتمتع بقدرات أجهزة مختلفة، من شريحة متنوعة (GPU، NPU، CPU، XPU) إلى نطاقات شبكة مختلفة، والمستخدمون لديهم سلوكيات مختلفة فيما يتعلق bằng استخدام التطبيقات ونمط شحن الأجهزة.

تُراقب NeuroSplit باستمرار معايير مختلفة لجهاز التелеметري – من القدرات الأجهزة إلى استخدام الموارد الحالية، وحالة البطارية، وضروف الشبكة. كما نأخذ في الاعتبار أنماط سلوك المستخدم، مثل عدد التطبيقات الأخرى التي تعمل ونمط استخدام الجهاز النموذجي. يسمح هذا الرصد الشامل ل NeuroSplit بتحديد ديناميكي لكيفية تشغيل معالجة الاستدلال بأمان على جهاز المستخدم مع تحسين مؤشرات الأداء الرئيسية للمطورين.

عندما تكون خصوصية البيانات حاسمة، تضمن NeuroSplit ألا يغادر البيانات الخام الجهاز، معالجًا المعلومات الحساسة محليًا مع الحفاظ على الأداء الأمثل. يسمح لنا القدرة على تقسيم أو تقليم أو فك نموذج الذكاء الاصطناعي بتشغيل 50-100 نموذج ذكاء اصطناعي في مساحة الذاكرة التي يمكن أن تحتوي على نموذج كمي واحد فقط على جهاز المستخدم. بمعنى praktisch، يمكن للمستخدمين تشغيل تطبيقات قوية بالذكاء الاصطناعي بشكل متزامن، معالجين البيانات الحساسة محليًا، مقارنة بالنهج الحسابي الثابت التقليدي.

ما هي الفوائد الرئيسية لاستدلال NeuroSplit المتكيف لتطبيقات الذكاء الاصطناعي، خاصة تلك التي تعمل مع تقنية GPU القديمة؟

تُقدم NeuroSplit ثلاث فوائد تحولية لتطبيقات الذكاء الاصطناعي. أولًا، تقلل بشكل كبير من تكاليف البنية التحتية من خلال آليتين: يمكن للشركات استخدام بطاقات الرسومات الأقل تكلفة والأقدم، ويمكننا استخدام بطاقات الرسومات السحابية بطرق أكثر فعالية. على سبيل المثال، يمكن لتطبيق يحتاج عادة إلى عدة بطاقات NVIDIA A100 بسعر 2.74 دولار في الساعة أن يعمل الآن على بطاقة A100 واحدة أو عدة بطاقات V100 بسعر 0.83 دولار في الساعة فقط.

ثانيًا، نحسن الأداء بشكل كبير من خلال معالجة البيانات الخام الأولية مباشرة على أجهزة المستخدمين. هذا يعني أن البيانات التي تنتقل في النهاية إلى السحابة تكون أصغر في الحجم، مما يقلل بشكل كبير من تأخير الشبكة مع الحفاظ على الدقة. يوفر هذا النهج الهجين للشركات أفضل ما في كلا العالمين – سرعة المعالجة المحلية مع قوة الحوسبة السحابية.

ثالثًا، من خلال معالجة البيانات الأولية الحساسة على جهاز المستخدم، نساعد الشركات على الحفاظ على حماية خصوصية المستخدم القوية دون التضحية بالأداء. هذا يصبح أكثر أهمية مع تصاعد لوائح الخصوصية وزيادةawareness المستخدمين حول الخصوصية.

كيف تخفف حل Skymel التكاليف لتطبيقات استدلال الذكاء الاصطناعي دون المساس بتعقيد النموذج أو دقته؟

أولاً، من خلال تقسيم نموذج الذكاء الاصطناعي الفردي، نقوم بتوزيع الحساب بين أجهزة المستخدمين والسحابة. الجزء الأول يعمل على جهاز المستخدم، ويحandle 5٪ إلى 100٪ من الحساب الإجمالي اعتمادًا على الموارد المتاحة للجهاز. فقط الحساب المتبقي يحتاج إلى معالجته على بطاقات الرسومات السحابية.

يعني هذا التقسيم أن بطاقات الرسومات السحابية تتعامل مع حمولة حسابية مخفضة – إذا كان النموذج يحتاج في الأصل إلى بطاقة رسومات كاملة، بعد التقسيم، قد تحتاج هذه الحمولة إلى 30-40٪ فقط من سعة البطاقة. هذا يسمح للشركات باستخدام مثيلات بطاقات الرسومات الأقل تكلفة مثل V100.

ثانيًا، تُحسن NeuroSplit استخدام بطاقات الرسومات السحابية. من خلال ترتيب كفء لنموذج كامل ونموذج.stub (الأجزاء المتبقية من النماذج المقسمة) على نفس بطاقة الرسومات السحابية، نحقق معدلات استخدام أعلى بكثير مقارنة بالنهج التقليدي. هذا يعني أن أكثر النماذج يمكنها التشغيل بشكل متزامن على نفس بطاقة الرسومات السحابية، مما يقلل من تكاليف الاستدلال لكل منها.

ما يميز نهج Skymel الهجين (المحلي + السحابي) عن حلول البنية التحتية للذكاء الاصطناعي الأخرى في السوق؟

يعد مشهد الذكاء الاصطناعي في نقطة انعطاف مثيرة. في حين يظهر آبل وسامسونج وكوالكوم قوة الذكاء الاصطناعي الهجين من خلال ميزات نظامهم، تظل هذه الحدائق المحمية. لكن الذكاء الاصطناعي لا ينبغي أن يكون مقيدًا بنظام جهاز المستخدم.

تعتبر NeuroSplit أساسًا محايدة للأجهزة، والسحابة، وشبكة الذكاء الاصطناعي. هذا يعني أن المطورين يمكنهم终于 تقديم تجارب متسقة للذكاء الاصطناعي بغض النظر عن ما إذا كان مستخدموهم على هاتف آيفون أو جهاز أندرويد أو جهاز لوحي – أو ما إذا كانوا يستخدمون AWS أو Azure أو جوجل كلاود.

فكر في ما يعنيه هذا للمطورين. يمكنهم بناء تطبيق الذكاء الاصطناعي مرة واحدة ويعرفون أنه سيتكيف بشكل ذكي عبر أي جهاز، أي سحابة، و أي بنية شبكة عصبية. لا يتعين عليهم بناء إصدارات مختلفة لأنظمة منفصلة أو التضحية بالسمات بناءً على قدرات الجهاز.

نحن نخرج قدرات الذكاء الاصطناعي الهجين من الحدائق المحمية وجعلها متاحة على نطاق واسع. مع تصبح الذكاء الاصطناعي مركزيًا لكل تطبيق، هذه المرونة والاتساق ليست مجرد ميزة – بل ضرورية للابتكار.

كيف يعمل وكلاء Orchestrator مع NeuroSplit، وما هو الدور الذي يلعبونه في تحويل استراتيجيات نشر الذكاء الاصطناعي؟

يعمل وكلاء Orchestrator و NeuroSplit معًا لإنشاء نظام نشر الذكاء الاصطناعي القادر على التحسين الذاتي:

1. يحدد المطورون الحدود:

  • القيود: النماذج المسموح بها، الإصدارات، مزودي السحابة، المناطق، قواعد الامتثال
  • الأهداف: الاستجابة لاتخاذ القرار، حدود التكلفة، متطلبات الأداء، احتياجات الخصوصية

2. يعمل الوكيل داخل هذه القيود لتحقيق الأهداف:

  • يقرر أي النماذج / واجهات برمجة التطبيقات لاستخدامها لكل طلب
  • يتكيف استراتيجيات النشر بناءً على الأداء الفعلي
  • يقوم بالتضحيات لتحسين الأهداف المحددة
  • يمكن إعادة تشكيله على الفور مع تغير الاحتياجات

3. يعمل NeuroSplit على تنفيذ قرارات الوكيل:

  • يستخدم تелеметري الجهاز في الوقت الفعلي لتحسين التنفيذ
  • يقسم المعالجة بين الجهاز والسحابة عند الفائدة
  • يضمن أن كل استدلال يعمل بشكل أمثل بالنظر إلى الظروف الحالية

إنه مثل وجود نظام ذكاء اصطناعي يعمل بشكل tự động لتحسين نفسه داخل قواعدك وأهدافك المحددة، بدلاً من الحاجة إلى تحسين يدوي لكل سيناريو.

ما هو رأيك في كيفية إعادة تشكيل وكلاء Orchestrator لنشر الذكاء الاصطناعي عبر الصناعات؟

يحل ثلاث تحديات حرجة كانت تعيق تبني الذكاء الاصطناعي والابتكار.

أولاً، يسمح للشركات البقاء على اتصال مع أحدث التطورات في الذكاء الاصطناعي بلا جهد. مع وكلاء Orchestrator، يمكنك الاستفادة الفورية من أحدث النماذج والتقنيات دون إعادة بناء البنية التحتية. هذا ميزة تنافسية كبيرة في عالم يتحرك فيه الابتكار في الذكاء الاصطناعي بسرعة خاطفة.

ثانيًا، يتيح لك اختيار نموذج الذكاء الاصطناعي بشكل ديناميكي لكل طلب. يمكن للوكيل المختار دمج النماذج من النظام البيئي الكبير لتقديم أفضل النتائج الممكنة لكل互одействة مستخدم. على سبيل المثال، يمكن لبرنامج خدمة العملاء الذكي استخدام نموذج متخصص للأسئلة الفنية ونموذج آخر لمسائل الفواتير، مما يوفر نتائج أفضل لكل نوع من التفاعلات.

ثالثًا، يحدد الأداء بشكل最大 مع تقليل التكاليف. يعمل الوكيل تلقائيًا على تحقيق التوازن بين تشغيل الذكاء الاصطناعي على جهاز المستخدم أو في السحابة بناءً على ما يبدو أكثر منطقية في ذلك الوقت. عندما تكون الخصوصية مهمة، يتم معالجة البيانات محليًا. عندما يلزم المزيد من القوة الحسابية، يستفيد من السحابة. كل هذا يحدث خلف الكواليس، مما يخلق تجربة سلسة للمستخدمين مع تحسين الموارد للأعمال.

لكن ما يميز وكلاء Orchestrator حقًا هو كيف يمكنهم تمكين الأعمال من إنشاء تجارب超اهجينة ومخصصة للمستخدمين. خذ منصة التعلم الإلكتروني – مع تقنيتنا، يمكنهم بناء نظام يمكنه التكيف تلقائيًا مع نهج التدريس بناءً على مستوى فهم كل طالب. عندما يبحث المستخدم عن “الذكاء الاصطناعي”، لا يعرض النظام نتائج عامة – بل يمكنه تقييم فهم المستخدم الحالي وتخصيص الشروحات باستخدام المفاهيم التي يعرفها بالفعل.

في النهاية، يمثل وكلاء Orchestrator مستقبل نشر الذكاء الاصطناعي – تحولًا من البنية التحتية الثابتة للمونوليث إلى أوركسترا الذكاء الاصطناعي المتكيفة الذاتية. إنه ليس فقط عن جعل نشر الذكاء الاصطناعي أسهل – بل عن جعل فئات جديدة تمامًا من تطبيقات الذكاء الاصطناعي ممكنة.

ما هو نوع الملاحظات التي تلقيتها حتى الآن من الشركات المشاركة في الإصدار التجريبي الخاص لوكلاء Orchestrator؟

كانت ردود الأفعال من المشاركين في الإصدار التجريبي الخاص رائعة! الشركات مسرورة باكتشاف أنها يمكن أن تتحرر أخيرًا من قفل البنية التحتية، سواء كانت نماذج مملوكة أو خدمات استضافة. القدرة على حماية أي قرار نشر مستقبليًا كانت مغيرًا للعبة، مما يزيل أشهر من إعادة العمل عند تغيير النهج.

كانت نتائج أداء NeuroSplit لا تقل عن الرائعة – لا نستطيع الانتظار لمشاركة البيانات علنًا قريبًا. ما يثير الإثارة بشكل خاص هو كيف أسرت فكرة نشر الذكاء الاصطناعي التكيفي مخيلة الناس. حقيقة أن الذكاء الاصطناعي ينشر نفسه يبدو مستقبليًا وليس شيئًا يتوقعونه الآن، لذلك من مجرد تقدم تقني، الناس يتحمسون للفرص والأسواق الجديدة التي قد تُخلق في المستقبل.

مع التقدم السريع في الذكاء الاصطناعي التوليدي، ما هي الحواجز الرئيسية التالية لبنية الذكاء الاصطناعي، وكيف تخطط Skymel لمواجهتها؟

نحن ننتقل نحو مستقبل لم يدركه معظم الناس بعد: لن يكون هناك نموذج ذكاء اصطناعي واحد مهيمن، بل مليارات منهم. حتى لو خلقنا نموذج الذكاء الاصطناعي الأكثر قوة يمكن تخيله، سنظل بحاجة إلى نسخ مخصصة لكل شخص على الأرض، لكل سياق وفرد واهتمامات فريدة. هذا يعني على الأقل 8 مليارات نموذج، بناءً على عدد سكان العالم.

ي象ز هذا تحولًا ثوريًا من نهج واحد الحجم الذي نتبعه اليوم. المستقبل يطلب بنية تحتية ذكية يمكنها التعامل مع مليارات النماذج. في Skymel، نحن لا نحل فقط تحديات نشر اليوم – بل إن خارطة طريقنا التكنولوجية تبني بالفعل الأساس لما سيأتي بعد ذلك.

كيف تتخيل تطور بنية الذكاء الاصطناعي خلال الخمس سنوات القادمة، وما هو الدور الذي ترى Skymel تلعبه في هذا التطور؟

على وشك أن يخضع مشهد بنية الذكاء الاصطناعي لتغيير جوهري. في حين يركز اليوم على توسيع نماذج اللغة الكبيرة في السحابة، ستشهد السنوات الخمس القادمة الذكاء الاصطناعي يصبح متعمقًا ومتكيفًا مع السياق. هذا ليس فقط عن ضبط دقيق – بل عن الذكاء الاصطناعي الذي يتكيف مع مستخدمين محددين، أجهزة، وحالات في الوقت الفعلي.

يخلق هذا التحول تحديين بنيوين رئيسيين. أولًا، يصبح النهج التقليدي لتشغيل كل شيء في مراكز البيانات المركزية غير مستدام تقنيًا واقتصاديًا. ثانيًا، يزيد تعقيد تطبيقات الذكاء الاصطناعي من الحاجة إلى بنية تحتية يمكنها التكيف بشكل ديناميكي عبر عدة نماذج، أجهزة، ومواقع حسابية.

في Skymel، نبني بنية تحتية تُحلل هذه التحديات بشكل خاص. تتيح لنا تقنيتنا تشغيل الذكاء الاصطناعي في المكان الذي يكون أكثر منطقية – سواء كان على جهاز المستخدم حيث يتم إنشاء البيانات، أو في السحابة حيث تتوفر المزيد من القدرة الحسابية، أو بطرق هجينة بينهما. أكثر من ذلك، تتكيف هذه القرارات في الوقت الفعلي بناءً على الظروف والتغيرات المتغيرة.

في المستقبل، لن يتم تعريف تطبيقات الذكاء الاصطناعي الناجحة بحجم نماذجها أو كمية الحوسبة التي يمكن الوصول إليها. سوف يتم تعريفها بقدرتها على تقديم تجارب مخصصة ومتجاوبة مع إدارة الموارد بفعالية. هدفنا هو جعل هذا المستوى من التحسين الذكي متاحًا لكل تطبيق ذكاء اصطناعي، بغض النظر عن الحجم أو التعقيد.

شكرًا على المقابلة الرائعة، القراء الذين يرغبون في معرفة المزيد يجب أن يزوروا Skymel.

أنطوان هو قائد رؤى ومؤسس شريك في Unite.AI، مدفوعًا بشغف لا يتزعزع لتشكيل وتعزيز مستقبل الذكاء الاصطناعي والروبوتات. رجل أعمال متسلسل، يعتقد أن الذكاء الاصطناعي سيكون مدمرًا للمجتمع مثل الكهرباء، وغالبًا ما يُقبض عليه وهو يثرثر عن إمكانات التكنولوجيات المدمرة و AGI.

كما أنه مستقبلي، فهو مخصص لاستكشاف كيف سيشكل هذه الابتكارات العالم. بالإضافة إلى ذلك، فهو مؤسس Securities.io، وهي منصة تركز على الاستثمار في التكنولوجيات المتقدمة التي تعيد تعريف المستقبل وتهيئ القطاعات بأكملها.