مقابلات
جاي دواني هو المؤسس المشارك والرئيس التنفيذي لشركة Lemurian Labs – سلسلة المقابلات

جاي دواني هو المؤسس المشارك والرئيس التنفيذي لشركة Lemurian Labs. Lemurian Labs هي شركة تعمل على تقديم حواسيب ذكاء اصطناعي معقولة التكلفة وسهلة الوصول وفعالة، مدفوعة بالاعتقاد بأن الذكاء الاصطناعي لا ينبغي أن يكون رفاهية بل أداة متاحة للجميع. يجمع فريق التأسيس في Lemurian Labs بين الخبرة في الذكاء الاصطناعي ومجمعات البرامج و الخوارزميات العددية وعمارة الحاسوب، متحدون حول هدف واحد: إعادة تصور الحوسبة المتسارعة.
يمكنك أن تأخذنا في جولة حول خلفيتك وما الذي دفعك إلى الذكاء الاصطناعي في البداية؟
بالتأكيد. لقد كنت برمجيًا منذ كنت في الثانية عشرة و بنيت ألعابي الخاصة، ولكنني في الواقع دخلت إلى مجال الذكاء الاصطناعي عندما كنت في الخامسة عشرة بسبب صديق لأبي كان مهتمًا بالحواسيب. لقد أثر في فضولي و給اني كتبًا لقراءتها مثل كتاب فون نيومان “الحاسوب والدماغ”، و كتاب مينسكي “الخوارزميات”، و كتاب راسل ونورفيج “الذكاء الاصطناعي مقاربة حديثة”. هذه الكتب أثرت في تفكيري كثيرًا، وبدا لي واضحًا في ذلك الوقت أن الذكاء الاصطناعي سيكون تحولًا كبيرًا وأردت أن أكون جزءًا من هذا المجال.
عندما حان وقت الجامعة، كنت أريد حقًا دراسة الذكاء الاصطناعي، ولكنني لم أجد أي جامعة تقدم ذلك، لذلك قررت أن أ chuyên في الرياضيات التطبيقية بدلاً من ذلك، وبعد فترة وجيزة من دخولي إلى الجامعة، سمعت عن نتائج AlexNet على ImageNet، والتي كانت مُثيرةً جدًا. في ذلك الوقت، كان لدي لحظة الآن أو أبدًا في رأسي وذهبت إلى قراءة كل ورقة وكتاب يمكنني الحصول عليهما المتعلقين بالشبكات العصبية وطلبت من قادة المجال أن أتعلم منهم، لأنك لا تريد أن تفوتك فرصة أن تكون هناك في ولادة صناعة جديدة وتتعلم من روادها.
سريعًا ما أدركت أنني لا أستمتع بالبحث، ولكنني أستمتع بحل المشكلات و بناء المنتجات التي تعمل بالذكاء الاصطناعي. هذا أدى بي إلى العمل على السيارات والrobots الذكية، والذكاء الاصطناعي لاكتشاف المواد، ونماذج توليدية لمحاكاة فيزيائية متعددة، ومحاكاة قائم على الذكاء الاصطناعي لتدريب سائقين سيارات سباق محترفين ومساعدتهم في إعداد السيارات، وrobots الفضاء، والتداول الخوارزمي، وغيرها الكثير.
الآن، بعد أن فعلت كل ذلك، أحاول أن أسيطر على تكلفة تدريب الذكاء الاصطناعي وتنفيذه لأن ذلك سيكون أكبر عقبة تواجهنا في طريقنا لتمكين عالم حيث يمكن لكل شخص وشركة الحصول على الذكاء الاصطناعي بطريقة اقتصادية.
كثير من الشركات التي تعمل في مجال الحوسبة المتسارعة لديها مؤسسون بنوا مسيرتهم المهنية في مجال نیمكونDUCTORS والبنية التحتية. كيف تعتقد أن خبرتك السابقة في الذكاء الاصطناعي والرياضيات تؤثر على فهمك للسوق والتنافس بشكل فعال؟
أعتقد أن عدم كوني من هذا القطاع يعطيني ميزة الخارج. لقد وجدت أن عدم وجود معرفة بالمعايير الصناعية أو الحكمة التقليدية يعطيني حرية الاستكشاف أكثر وذهابًا أعمق من معظم الآخرين لأنني لا أتحمل أي تحيزات.
لدي حرية أن أسأل أسئلة “أغبى” وأختبر افتراضات بطريقة لا يفعلها معظم الآخرين لأن الكثير من الأشياء مقبولة كحقيقة. في السنوات القليلة الماضية، كان لدي العديد من المحادثات مع أشخاص في الصناعة وهم متعصبون جدًا لشيء ما ولكنهم لا يستطيعون أن ي告诉وني عن أصل الفكرة، وهو ما أجد أنه غامض جدًا. أحب أن أفهم لماذا تم اتخاذ بعض الخيارات، وما هي الافتراضات أو الشروط التي كانت سارية في ذلك الوقت وما إذا كانت لا تزال سارية.
قادمًا من خلفية في الذكاء الاصطناعي، أتميل إلى النظر إلى الأمور من منظور البرمجيات، أنظر إلى哪里 توجد الحمولة اليوم، وهنا جميع الطرق الممكنة التي قد تتغير مع مرور الوقت، ونمذجة خط أنابيب التعلم الآلي بالكامل للتدريب والاستدلال لفهم المعوقات، وهو ما يخبرني بأين توجد الفرص لتوفير القيمة. ولأني أتي من خلفية رياضية، أحب أن أنمذج الأشياء للحصول على أقرب صورة ممكنة إلى الحقيقة، و让我 ذلك يوجهني. على سبيل المثال، قمنا ببناء نماذج لحساب أداء النظام لتكلفة الملكية الكلية ونستطيع قياس المنافع التي يمكننا تقديمها للعملاء بالبرمجيات و/أو الأجهزة، وفهم قيودنا والمفاتيح المختلفة المتاحة لنا، والعديد من النماذج الأخرى للأشياء المختلفة. نحن نعتمد على البيانات بشكل كبير، ونستخدم الأفكار المستفادة من هذه النماذج لتوجيه جهودنا والتنازلات.
يبدو أن التقدم في الذكاء الاصطناعي جاء بشكل رئيسي من التوسع، والذي يتطلب كميات أكبر من الحوسبة والطاقة. يبدو أننا في سباق تسلحي مع كل شركة تحاول بناء أكبر نموذج، ولا يبدو أن هناك نهاية له. هل تعتقد أن هناك طريقة للخروج من هذا؟
هناك دائمًا طرق. التوسع أثبت فائدته بشكل كبير، وأنا لا أعتقد أننا رأينا نهاية ذلك بعد. سنرى قريباً نماذج يتم تدريبها بتكلفة لا تقل عن مليار دولار. إذا كنت تريد أن تكون قائدًا في الذكاء الاصطناعي التوليدي وإنشاء نماذج أساسية متقدمة، ستحتاج إلى إنفاق مليارات الدولارات على الحوسبة كل عام. الآن، هناك حدود طبيعية للتوسع، مثل القدرة على بناء مجموعة بيانات كافية لنموذج من هذا الحجم، والحصول على أشخاص لديهم المعرفة المناسبة، والحصول على كمية كافية من الحوسبة.
متابعة توسع حجم النموذج أمر لا مفر منه، ولكننا لا نستطيع تحويل سطح الأرض بأكمله إلى حاسوب فائق الحجم لتدريب ونشر نماذج اللغة الكبيرة للغاية لأسباب واضحة. للسيطرة على هذا، لدينا العديد من الأزرار التي يمكن لعبها: مجموعات بيانات أفضل، وهياكل نموذجية جديدة، أساليب تدريب جديدة، مجمعات أفضل، تحسينات خوارزمية واستغلالات، وهيكليات حاسوبية أفضل، وغيرها. إذا فعلنا كل ذلك، هناك ثلاثة أوامر منmagnitude من التحسين التي يمكن العثور عليها. هذا هو أفضل طريقة للخروج.
أنت مؤمن بفكرة التفكير بالأساس، كيف يؤثر هذا على تفكيرك في كيفية تشغيل Lemurian Labs؟
نحن بالفعل نستخدم الكثير من التفكير بالأساس في Lemurian. لقد وجدت دائمًا أن الحكمة التقليدية خادعة لأن هذه المعرفة تم تشكيلها في وقت معين عندما كانت بعض الافتراضات سارية، ولكن الأشياء تتغير دائمًا ويجب عليك إعادة اختبار الافتراضات بشكل متكرر، خاصة في عالم سريع التغيير مثل هذا.
أجد نفسي كثيرًا أسأل أسئلة مثل “هذا يبدو مثل فكرة جيدة جدًا، ولكن لماذا قد لا يعمل هذا”، أو “ما الذي يجب أن يكون صحيحًا من أجل عمل هذا”، أو “ماذا نعرف بأنه حقائق مطلقة وما هي الافتراضات التي نجريها ولماذا؟”، أو “لماذا نعتقد أن هذا النهج هو الأفضل لحل هذه المشكلة”. الهدف هو إبطال الأفكار وقتلها بأسرع و أرخص طريقة ممكنة. نحن نريد محاولة زيادة عدد الأشياء التي نحاولها في أي وقت معين.
ولكن التفكير بالأساس ليس مفيدًا بذاته. نميل إلى زوجته مع التخطيط العكسي، الذي يعني تخيل نتيجة مثالية أو مرغوبة ومحاولة العمل إلى الوراء لتحديد الخطوات أو الإجراءات المختلفة المطلوبة لتحقيقها. هذا يضمن لنا أن نتقارب على حل معنوي وليس فقط مبتكرًا ولكن أيضًا متجذرة في الواقع.
في بعض الأحيان، نجد أنفسنا في وضع نحتاج إلى اتخاذ قرار ولكننا لا نملك أي بيانات، وفي هذه الحالة نستخدم الفرضيات القابلة للاختبار بأقل طاقة ممكنة، والتي تعطينا إشارة حول ما إذا كان شيء ما يعتبر متابعة أو لا.
كل هذا مجتمعًا يعطينا مرونة، ودورات تكرار سريعة لتحديد المخاطر بسرعة، وقد ساعدنا على تعديل الاستراتيجيات بثقة عالية، وجعل تقدم كبير على مشاكل صعبة جدًا في وقت قصير.
في البداية، كنت تركز على Edge AI، ما الذي دفعك إلى إعادة التوجيه والتحول إلى الحوسبة السحابية؟
كنا قد بدأنا مع Edge AI لأنني كنت مهتمًا جدًا بحل مشكلة معينة واجهتها في محاولة جلب عالم من الروبوتات الذكية العامة. الروبوتات الذكية تعتبر أكبر تحول منصة في تاريخنا الجماعي، وبدا لي أننا لدينا كل ما نحتاجه لإنشاء نموذج أساسي للروبوتات ولكننا نفتقد شريحة الاستدلال المثالية مع التوازن الصحيح من الإنتاجية والكفاءة في الطاقة وبرمجة تشغيل نموذج أساسي عليه.
لم أكن أفكر في مركز البيانات في ذلك الوقت لأن هناك أكثر من đủ شركات تركز هناك وتوقع أنهم سوف يجدون حلاً. قمنا بتصميم هيكلية قوية جدًا لهذا الفضاء التطبيقي وكنا على وشك إصدارها، ثم أصبح واضحًا جدًا أن العالم قد تغير والمشكلة الحقيقية كانت في مركز البيانات. معدل نمو النماذج الكبيرة وت消耗 الحوسبة يفوق بكثير وتقدم الحوسبة، وعندما تأخذ في الاعتبار التبني، يبدأ في رسم صورة قلقة.
شعرت أن هذا هو المكان الذي يجب أن نركز فيه جهودنا، لخفض تكلفة الطاقة للذكاء الاصطناعي في مراكز البيانات قدر الإمكان دون فرض قيود على مكان وكيفية تطور الذكاء الاصطناعي. وبالتالي، بدأنا العمل على حل هذه المشكلة.
يمكنك أن تشاركنا قصة تأسيس Lemurian Labs؟
تبدأ القصة في أوائل عام 2018. كنت أعمل على تدريب نموذج أساسي للروبوتات الذكية العامة، بالإضافة إلى نموذج لمحاكاة فيزيائية متعددة لتدريب الوكيل عليها وضبطه الدقيق ل不同的 تطبيقات، وأشياء أخرى لمساعدتي على التوسع في بيئات متعددة الوكلاء. ولكن سريعًا ما استنفدت كمية الحوسبة التي لدي، وتم تقدير الحاجة إلى أكثر من 20,000 وحدة معالجة رسومات V100. حاولت أن أجمع đủ المال للحصول على وصول إلى الحوسبة ولكن السوق لم يكن مستعدًا لمثل هذا الحجم بعد. ومع ذلك، فقد جعلني هذا أفكر في جانب التنفيذ وَجلس لتحديد أداء النظام الذي سأحتاجه لتشغيل هذا النموذج في البيئات المستهدفة ودركت أنه لا توجد شريحة موجودة يمكنها أن تأتي بهذا الأداء.
بعد عامين، في عام 2020، التقيت مع فاسيل -شريكي المؤسس- للتواصل وشاركت معه التحديات التي واجهتها في بناء نموذج أساسي للروبوتات الذكية، وقترح بناء شريحة استدلال يمكنها تشغيل نموذج أساسي، وشارك أنه كان يفكر كثيرًا في صيغ الأرقام وتمثيلات أفضل سوف تساعد في جعل الشبكات العصبية تحتفظ بالدقة عند عرض بت أقل، وأيضًا في إنشاء هياكل أكثر قوة.
كانت فكرة مثيرة للاهتمام ولكنها كانت بعيدة جدًا عن مجالي. ولكنها لم تتركني، مما دفعني إلى قضاء أشهر عديدة في تعلم دقائق هيكلة الحاسوب، ومجموعات البرامج، ووقت التشغيل، ونمذجة البرامج، و في النهاية، بدأت فكرة بناء شركة نیمكونDUCTORS تبرز و形成ت لدي فرضي حول ما هو المشكلة وكيفية التعامل معها. وبعد ذلك، في نهاية العام، بدأنا Lemurian.
لقد تحدثت في السابق عن الحاجة إلى معالجة البرمجيات أولاً عند بناء الأجهزة، يمكنك أن تُشرح وجهة نظرك حول لماذا مشكلة الأجهزة هي في الأساس مشكلة برمجية؟
ما لا يدركه الكثير من الناس هو أن جانب البرمجيات في النیمكونDUCTORS أصعب من الأجهزة نفسها. بناء هيكلة حاسوب مفيدة للعملاء لاستخدامها والحصول على الفائدة منها هو مشكلة شاملة، وإذا لم تكن لديك هذه الفهم والاستعداد في البداية، سوف تنتهي بنتيجة هيكلة معمارية جميلة وذات أداء عالي وفعالية، ولكنها غير قابلة للاستخدام من قبل المطورين، وهو ما يهم حقًا.
هناك فوائد أخرى لاتخاذ نهج البرمجيات أولاً، مثل سرعة وقت الوصول إلى السوق. هذا أمر بالغ الأهمية في عالم سريع التغيير مثل هذا، حيث يمكن أن يكون كونك متفائلاً جدًا بشأن هيكلة معمارية أو ميزة يعني أنك تفوت السوق تمامًا.
عدم اتخاذ نهج البرمجيات أولاً يؤدي عادة إلى عدم إزالة المخاطر المهمة المطلوبة لاعتماد المنتج في السوق، وعدم القدرة على الاستجابة للتغيرات في السوق، على سبيل المثال عندما تتطور الحملات بطرق غير متوقعة، ووجود أجهزة غير مستغلة. كل هذه أشياء سيئة. هذا هو السبب في أننا نعتني كثيرًا بكوننا مركزين على البرمجيات، وسبب كوننا نرى أنك لا تستطيع أن تكون شركة نیمكونDUCTORS بدون أن تكون حقًا شركة برمجيات.
يمكنك مناقشة أهدافك الفورية لمكدس البرمجيات؟
عندما كنا ن設計 هيكلتنا ونتفكر في خارطة الطريق المستقبلية وأين الفرص لتوفير أداء وفعالية طاقة أكبر، بدا واضحًا أننا سوف نرى المزيد من التباين، وهو ما سوف يخلق مشاكل كثيرة على البرمجيات. ونحن لا نحتاج فقط إلى أن نكون قادرين على برمجة هياكل متباينة بفعالية، بل يجب أن نتعامل معها على مستوى مركز البيانات، وهو تحدي لم نواجهه من قبل.
هذا جعلنا قلقين لأن آخر مرة اضطرنا إلى المرور بتحول كبير كانت عندما انتقلت الصناعة من هيكليات أحادية النواة إلى هيكليات متعددة النواة، وفي ذلك الوقت استغرق الأمر 10 سنوات لجعل البرمجيات تعمل والناس يستخدمونها. لا نستطيع أن ننتظر 10 سنوات لتحديد البرمجيات لهياكل متباينة على مستوى كبير، يجب أن يتم ذلك الآن. وبالتالي، بدأنا العمل على فهم المشكلة وما يجب أن يوجد لكي توجد هذه المكدس البرمجي.
نحن حاليًا نتعامل مع العديد من الشركات الرائدة في نیمكونDUCTORS وموفري الخدمات السحابية و سن выпустить مكدس برمجي في течение السنوات ال 12 القادمة. إنه نموذج برمجي موحد مع مجمع ووقت تشغيل قادر على استهداف أي نوع من الهياكل، وتنسيق العمل عبر مجموعات من أنواع مختلفة من الأجهزة، وقادر على التمكين من عقدة واحدة إلى ألف عقدة لتحقيق الأداء الأعلى.
شكرًا على المقابلة الرائعة، القراء الذين يرغبون في معرفة المزيد يجب أن يزوروا Lemurian Labs.












