مقابلات
سهيل خان، المؤسس المشارك والرئيس التنفيذي لشركة Hazen.ai – سلسلة المقابلات

سهيل خان، هو المؤسس المشارك والرئيس التنفيذي لشركة Hazen.ai، وهي شركة تستخدم الرؤية الحاسوبية والتعلم العميق لتصميم برامج تحليلات مرور ذكية مصممة لتفهم حركة كل مركبة.
ما الذي جذبك في البداية إلى مجال الذكاء الاصطناعي؟
كان ذلك خلال الدراسة الجامعية عندما قرأت لأول مرة عن كيفية عمل الرؤية الثنائية (أو الرؤية الثنائية – تقدير العمق من كاميرتين). هذا ما جعلني مهتمًا باستكشاف الرؤية الحاسوبية أكثر. ومن المثير للاهتمام، أنني قرأت عنها لأول مرة في كتاب اشتريته من سوق يوم الجمعة التقليدي حيث يباع الكتب القديمة المستخدمة على رصيف الشارع في مدينتنا. وتابعت للحصول على درجة الدكتوراه في هذا المجال من الولايات المتحدة.
كنت في السابق أستاذًا في واحدة من أكبر الجامعات في باكستان، جامعة لاهور للإدارة والعلوم. ما كانت اهتماماتك في التدريس والبحث؟
عندما انضممت إلى LUMS بعد حصولي على الدكتوراه، بنيت ما كان أول مختبر بحثي للدراسات العليا في الجامعة، من التمويل الذي تلقيت من منحة كبيرة من منظمة الدفاع. كان برنامج الدراسات العليا في علوم الحاسوب جديدًا جدًا، ولم يكن هناك مختبرات بحثية في ذلك الوقت. درّست الرؤية الحاسوبية لمدة 12 عامًا في LUMS، وكان لدي مختبر نشط في هذا المجال. في البداية، كانت الرؤية الحاسوبية تدرس بشكل ضعيف في أي جامعة باكستانية، ولكن لاحقًا أصبحت مادة стандартية، وحقيقة أن العديد من طلابي يدرسون الآن أيضًا في جامعات باكستانية.
يمكنك مناقشة ما启发ك لإطلاق شركة ناشئة متخصصة في خوارزميات الرؤية الحاسوبية والتعلم العميق لتحليل الفيديو؟
كانت الرؤية الحاسوبية لمدة طويلة مجالًا بحثيًا تجريبيًا، مع تطبيقات محدودة في المنتجات. كان هذا بشكل رئيسي بسبب أن نضج الخوارزميات اللازمة لإنشاء منتجات لم يكن موجودًا. للمنتج، يجب أن يعمل خوارزمية فهم الصورة في مجموعة متنوعة من ظروف التصوير والإنارة، وليس فقط في بعض التجارب المسيطرة. كنا نمزح بين طلاب الدراسات العليا في مختبرنا عندما كنت أدرّس الدكتوراه في عام 2000، أنه إذا كنت تستطيع العثور على ثلاث صور تعمل عليها خوارزميتك، يمكنك كتابة ورقة. إذا عملت على ثلاث فيديوهات، تحصل على ورقة جيدة جدًا! النقطة هي أن الكثير من خوارزميات الرؤية عملت فقط في سيناريوهات مختبرية مدروسة بعناية، وليست قوية جدًا.
ولكن الآن الأمور قد تغيرت. مع ظهور التعلم العميق في عام 2012، رأينا بعض التقدم السريع والمثير في فهم الصور. عندما رأينا ذلك، شعرت بأن الوقت مناسب الآن، ربما لإنشاء منتجات صلبة يمكن أن يكون لها تأثير كبير.
ما نوع انتهاكات المرور التي يمكن لـHazen.ai مراقبتها؟
هدفنا هو القدرة على تحديد جميع أنواع السلوكيات الخطرة للقيادة على الطرق. هذا يُدفع من هدفنا العام لتقليل حوادث الطرق. كل 24 ثانية، يموت شخص ما في حادث سيارة، وهو ما يعادل حوالي 15 طائرة 787-8 تحطم كل يوم! لذلك هذا ما ي мотивiertنا. هذا هو السبب في أننا نبني برنامجًا يمكن أن يكتشف سلوكيات خطرة وغير آمنة مختلفة، مثل التغييرات غير الآمنة للخطوط، والمنعطفات غير القانونية، وعبور الإشارة الحمراء أو إشارة التوقف، وعرقلة معبر المشاة، وعدم ارتداء حزام الأمان أو النص أثناء القيادة. نحن أيضًا نعمل على بناء ميزات في برنامجنا خصيصًا لأمان المشاة ودراجات الهوائية، لأن أكثر من نصف الوفيات في حوادث السيارات تحدث في قطاع المستخدمين الضعفاء من المشاة ودراجات الهوائية والدراجات النارية.
ما هي بعض التحديات الفريدة التي تواجهها عند استخدام الرؤية الحاسوبية لمراقبة الأجسام المتحركة بسرعات عالية؟
هناك نوعان من التحديات: الأول هو أداء خوارزميات الرؤية الحاسوبية نفسها – تريد أن يكون لديك منتج يمكنه العمل في ظروف مرور صعبة 24/7 في جميع التباين الإضاءة. بينما كان هناك الكثير من التقدم الفني نحو هذا الهدف، لا يزال هناك بلدان حيث كثافة مستخدمي الطريق عالية جدًا، مثل تجمعات الدراجات النارية أو المشاة في قربة وثيقة، أنه لا يزال من الصعب على الخوارزميات تتبعهم بشكل فردي وفهم المشهد. ولكن الثاني، تحدي أكبر، هو صنع منتج صلب من خوارزميات الرؤية الحاسوبية، يمكن توزيعه على موارد أجهزة محدودة على الحافة، ويمكن مراقبته وإدارته بسهولة على الرغم من توزيعه في جميع أنحاء المدينة. منذ أن تتعامل منتجات الرؤية الحاسوبية مع الكثير من بيانات الفيديو، فإن توزيعها على الحافة، كجهاز IoT، وإدارته بشكل فعال، يبقى مهمة صعبة.
ما هو عملية مستخدم النهاية لتكوين البرنامج ل不同的 تكوينات الطريق؟
كل تقاطع يوفر سيناريو فريد، من حيث حجم المرور وتكوين الخطوط ونوع المركبة، ودراجات الهوائية، أو التفاعلات بين المشاة. بالإضافة إلى ذلك، قد تكون اهتمامات مديري المرور محددة، لتحديد نوع معين من سلوك المرور في كل موقع. على سبيل المثال، قد يحظر الشرطة المرورية الدوران في تقاطع لتنسيق تدفق المرور، وهم مهتمون بتقديم هذه الإحصائية. هذا هو السبب في أننا أبقينا برنامجنا قابلًا للتكوين لسيناريوهات مختلفة. عندما يتم تثبيت كاميرا مع برنامجنا، نقوم بتكوينه من خلال عملية بسيطة لما يتطلبه المستخدم النهائي في ذلك الموقع. داخليًا، بنينا لغة عالية المستوى يمكننا من خلالها وصف سيناريوهات مرور interesة بسهولة. هذا يسمح لنا بتكوين موقع بسرعة لعملائنا.
ما نوع الأجهزة المطلوبة لتشغيل هذا النظام؟
تتطلب تحليلات الفيديو قدرة حسابية كبيرة. لقد قمنا بتحسين رمزنا ليعمل على أجهزة Nvidia GPUs الأصغر التي يمكن توزيعها على الحافة، مثل سلسلة Jetson، وأيضًا على معالجات Intel CPUs لميزات معينة التي نقدمها. في السنوات الأخيرة، أصبحت أجهزة الحافة الأكثر قوة متاحة بسعر معقول، لذلك هذا ما يدفع الكثير من التطبيقات المثيرة.
هل يمكنك مناقشة ما إذا كانت أي ولايات قضائية تختبر أو تستخدم حاليًا تقنية Hazen.ai؟
لدينا الآن تجارب جارية في عدة دول، المملكة المتحدة، الولايات المتحدة، مصر، السعودية، باكستان، عمان، بيرو، ونحن نتعامل مع العملاء المحتملين في دول أخرى أيضًا.
هل هناك شيء آخر تود مشاركته حول Hazen.ai؟
بشكل عام، نشعر بأن تقنيات سلامة المرور لم تتطور بما يكفي، مقارنة بمقياس المشكلة. ومع ذلك، الآن الوقت مناسب، بسبب التقدم الكبير في الرؤية الحاسوبية والتعلم العميق، بالإضافة إلى توافر كاميرات وأجهزة حاسوب رخيصة. سنرى تطبيقات أكثر لتعلم الحافة القائم على الرؤية الحاسوبية في السنوات القادمة. هذه هي الأساسيات التي تدفع Hazen.ai.
شكرًا على المقابلة، القراء الذين يرغبون في معرفة المزيد يجب أن يزوروا Hazen.ai












