اتصل بنا للحصول على مزيد من المعلومات

صهيب خان ، المؤسس المشارك والرئيس التنفيذي لـ Hazen.ai - سلسلة مقابلات

تقديم العرض الوظيفي

صهيب خان ، المؤسس المشارك والرئيس التنفيذي لـ Hazen.ai - سلسلة مقابلات

mm

صهيب خان هو الشريك المؤسس والرئيس التنفيذي لشركة هازن، وهي شركة تستخدم الرؤية الحاسوبية والتعلم العميق لتصميم برنامج ذكي لتحليل حركة المرور مصمم "لفهم" حركة كل مركبة.

ما الذي جذبك في البداية إلى مجال الذكاء الاصطناعي؟

خلال المرحلة الجامعية الأولى قرأت عن كيفية عمل الرؤية المجسمة (أو الرؤية المجهرية - تقدير العمق من كاميرتين). هذا جعلني مدمن مخدرات على استكشاف رؤية الكمبيوتر أكثر. ومن المثير للاهتمام ، أنني قرأت عنها لأول مرة في كتاب التقطته من سوق الجمعة التقليدي حيث باعوا الكتب القديمة المستعملة على رصيف جانب الطريق في مسقط رأسنا. ذهبت للحصول على درجة الدكتوراه في هذا المجال من الولايات المتحدة.

كنت سابقًا أستاذًا في إحدى أكبر الجامعات في باكستان ، وهي جامعة لاهور للعلوم الإدارية (LUMS). ما هي اهتماماتك التعليمية والبحثية؟

عندما انضممت إلى LUMS بعد أن حصلت على درجة الدكتوراه ، قمت ببناء ما كان أول مختبر أبحاث للخريجين في الجامعة ، من تمويل تلقيته من منحة كبيرة من منظمة دفاعية. كان برنامج الدراسات العليا في علوم الكمبيوتر جديدًا جدًا ، ولم تكن هناك مختبرات بحث في ذلك الوقت. قمت بتدريس Computer Vision لمدة 12 عامًا في LUMS ، وكان لدي معمل نشط في هذا المجال. في البداية ، بالكاد يتم تدريس رؤية الكمبيوتر في أي جامعة باكستانية ، ولكن فيما بعد ، أصبحت مادة معيارية ، وفي الواقع ، يقوم العديد من طلابي الآن بالتدريس في الجامعات الباكستانية.

هل يمكنك مناقشة ما الذي ألهمك لإطلاق شركة ناشئة متخصصة في رؤية الكمبيوتر وخوارزميات التعلم العميق لتحليلات الفيديو؟

كانت رؤية الكمبيوتر ، لفترة طويلة ، مجال بحث تجريبي إلى حد كبير ، مع تطبيقات محدودة في المنتجات. كان هذا في المقام الأول لأن نضج الخوارزميات اللازمة لبناء المنتجات لم يكن موجودًا. بالنسبة للمنتج ، يجب أن تعمل خوارزمية فهم الصورة في مجموعة متنوعة من ظروف التصوير والإضاءة ، وليس فقط في بعض التجارب التي يتم التحكم فيها بشكل كبير. كانت لدينا نكتة بين طلاب الدراسات العليا في مختبرنا عندما كنت أحضر الدكتوراه في عام 2000 ، أنه إذا كان بإمكانك العثور على ثلاث صور تعمل عليها خوارزميتك ، فيمكنك كتابة ورقة. إذا كان يعمل على ثلاثة مقاطع فيديو ، فستحصل على ورقة جيدة جدًا! النقطة المهمة هي أن الكثير من خوارزميات الرؤية عملت فقط في سيناريوهات معملية منظمة بعناية ، ولم تكن قوية جدًا.

ولكن الامور تغيرت الان. مع ظهور التعلم العميق في عام 2012 ، شهدنا بعض التقدم السريع والرائع للغاية في فهم الصورة. عندما رأينا ذلك ، شعرنا أن الوقت مناسب الآن لبناء منتجات قوية يمكن أن يكون لها تأثير كبير.

ما نوع المخالفات المرورية التي يمكن لـ Hazen.ai مراقبتها؟

هدفنا هو أن نكون قادرين على تحديد جميع أنواع سلوكيات القيادة الخطرة على الطرق. هذا هو الدافع وراء هدفنا الشامل المتمثل في تقليل الوفيات على الطرق. كل 24 ثانية ، يموت شخص ما في حادث طريق ، وهو ما يعادل حوالي 15-787 دريملاينر تتحطم كل يوم! لذلك هذا حقًا ما يحفزنا. هذا هو السبب في أننا نبني برنامجًا يمكنه اكتشاف أنواع مختلفة من السلوكيات الخطرة وغير الآمنة ، مثل التغييرات غير الآمنة في الممرات ، أو المنعطفات غير القانونية ، أو القفز فوق الضوء الأحمر أو إشارة التوقف ، أو منع عبور المشاة ، أو عدم ارتداء حزام الأمان أو إرسال الرسائل النصية -خلال القيادة. نحن نعمل أيضًا على بناء ميزات في برنامجنا خصيصًا لسلامة المشاة وراكبي الدراجات ، لأن أكثر من نصف الوفيات في حوادث الطرق تحدث في قطاع مستخدمي الطريق المعرضين للخطر من المشاة وراكبي الدراجات وراكبي الدراجات النارية.

ما هي بعض التحديات الفريدة الكامنة وراء استخدام رؤية الكمبيوتر لمراقبة الأجسام التي تتحرك بمثل هذه السرعات العالية؟

هناك نوعان من التحديات: الأول هو أداء خوارزميات الرؤية الحاسوبية نفسها - فأنت تريد أن يكون لديك منتج يمكنه العمل في ظروف حركة المرور الصعبة على مدار الساعة طوال أيام الأسبوع في جميع أشكال الإضاءة. بينما كان هناك الكثير من التقدم تقنيًا نحو هذا الهدف ، لا تزال هناك دول تكون فيها كثافة مستخدمي الطريق عالية جدًا ، مثل مجموعات الدراجات البخارية أو المشاة على مقربة شديدة ، بحيث لا يزال من الصعب على الخوارزميات القيام بذلك. تتبعهم بشكل فردي وفهم المشهد. لكن ثانيًا ، يتمثل التحدي الأكبر في صنع منتج قوي من خوارزميات الرؤية الحاسوبية ، والتي يمكن نشرها على موارد محدودة للأجهزة ، ويمكن مراقبتها وإدارتها بسهولة على الرغم من توزيعها في جميع أنحاء المدينة. نظرًا لأن منتجات رؤية الكمبيوتر تتعامل مع الكثير من بيانات الفيديو ، فإن نشرها على الحافة ، كجهاز إنترنت الأشياء ، وإدارتها بفعالية ، يظل مهمة صعبة.

ما هي العملية التي يتعين على المستخدم النهائي أن يقوم بها لتهيئة البرنامج على تكوينات الطرق المختلفة؟

يوفر كل تقاطع سيناريو فريدًا ، من حيث حجم حركة المرور وتكوين الممرات ونوع المركبات أو راكبي الدراجات أو تفاعلات المشاة. علاوة على ذلك ، قد تكون مصلحة مديري حركة المرور محددة ، لتحديد نوع معين من سلوك حركة المرور في كل موقع. على سبيل المثال ، قد لا تسمح شرطة المرور بالانعطاف للخلف عند تقاطع لتسهيل تدفق حركة المرور ، وتهتم بالتقاط هذه الإحصائية. هذا هو السبب في أننا أبقينا برنامجنا قابلاً للتكوين لسيناريوهات مختلفة. عندما يتم إعداد الكاميرا باستخدام برنامجنا ، نقوم بتكوينها من خلال عملية بسيطة لما يطلبه المستخدم النهائي في ذلك الموقع. داخليًا ، قمنا ببناء لغة عالية المستوى يمكننا من خلالها وصف سيناريوهات حركة المرور ذات الأهمية بطريقة مضغوطة بطريقة بسيطة. هذا يسمح لنا بتهيئة موقع بسرعة لعملائنا.

ما نوع الجهاز المطلوب لتشغيل هذا النظام؟

تتطلب تحليلات الفيديو قوة حسابية كبيرة. لقد قمنا بتحسين الكود الخاص بنا للتشغيل على وحدات معالجة الرسومات Nvidia الأصغر التي يمكن نشرها على الحافة ، مثل سلسلة Jetson الخاصة بهم ، وكذلك على وحدات المعالجة المركزية Intel لبعض الميزات التي نقدمها. في السنوات الأخيرة ، أصبحت الأجهزة المتطورة الأكثر قوة متوفرة بسعر معقول ، لذلك يقود هذا حقًا الكثير من التطبيقات المثيرة.

هل يمكنك مناقشة ما إذا كانت هناك أي سلطات قضائية تقوم حاليًا بتجربة تقنية Hazen.ai أو استخدامها؟

لدينا الآن تجارب جارية في العديد من البلدان ، المملكة المتحدة والولايات المتحدة الأمريكية ومصر والمملكة العربية السعودية وباكستان وعمان وبيرو ونعمل على إشراك العملاء المحتملين في بلدان أخرى أيضًا.

هل هناك أي شيء آخر تود مشاركته حول Hazen.ai؟ 

بشكل عام ، نشعر أن تقنيات السلامة المرورية لم تتقدم بشكل كافٍ ، مقارنة بحجم المشكلة. ومع ذلك ، فقد حان الوقت الآن ، بسبب التقدم الهائل في رؤية الكمبيوتر والتعلم العميق ، فضلاً عن التوافر الرخيص للكاميرا وأجهزة الحوسبة. سنرى المزيد من التطبيقات للرؤية الحاسوبية القائمة على الحافة في السنوات القادمة. هذه هي الأساسيات التي تحرك Hazen.ai.

شكرا لك على المقابلة ، القراء الذين يرغبون في معرفة المزيد يجب أن يزوروا هازن

أنطوان هو قائد صاحب رؤية وشريك مؤسس لشركة Unite.AI، مدفوعًا بشغف لا يتزعزع لتشكيل وتعزيز مستقبل الذكاء الاصطناعي والروبوتات. وهو رجل أعمال متسلسل، ويعتقد أن الذكاء الاصطناعي سيكون له نفس التأثير على المجتمع مثل الكهرباء، وغالبًا ما يتم ضبطه وهو يهذي عن إمكانات التقنيات المبتكرة والذكاء الاصطناعي العام.

ك المستقبليوهو مكرس لاستكشاف كيف ستشكل هذه الابتكارات عالمنا. بالإضافة إلى ذلك، فهو مؤسس Securities.io، وهي منصة تركز على الاستثمار في التقنيات المتطورة التي تعمل على إعادة تعريف المستقبل وإعادة تشكيل قطاعات بأكملها.