مقابلات
جيل الباز، المؤسس المشارك والمدير الفني لشركة Datagen – سلسلة المقابلات

جيل الباز هو المدير الفني والمؤسس المشارك لشركة Datagen، ويقع مقرها في تل أبيب. حصل على شهادته الجامعية في العلوم والفيزياء من جامعة التخنيون. ركز بحث جيل على رؤية الكمبيوتر ثلاثية الأبعاد ونشر في مؤتمر بحوث الرؤية الحاسوبية، وهو أفضل مؤتمر بحث في الرؤية الحاسوبية في العالم. Datagen هي رائدة في مجال البيانات المحاكاة، وهو فرع من البيانات الاصطناعية، والذي يركز على إعادة إنشاء العالم حولنا بطريقة فوتوغرافية حقيقية. أطلقت الشركة من وضع السرية مع أكثر من 18 مليون دولار في التمويل في مارس 2021 وهي تعمل الآن مع عدد من الشركات في قائمة فورتشن 100 في الواقع المعزز والواقع الافتراضي والروبوتات والسيارات، بما في ذلك معظم عمالقة التكنولوجيا الأمريكية الرائدة.
ما الذي جذبك في البداية إلى الروبوتات والتعلم الآلي؟
كتب الخيال العلمي، مثل سلسلة أساسات إسحاق أزيموف وآي روبوت، دفعني إلى التفكير في مستقبل حيث تكون الروبوتات جزءًا لا يتجزأ من حياتنا اليومية. هناك العديد من المهام المملة والمتكررة التي يقوم بها الناس؛ كنت أعرف أنني لا أريد القيام بهم، ولا أستطيع تخيل أي شخص آخر يريد القيام بهم. بالنظر إلى أن الروبوتات هي حتمية تكنولوجية، اعتقدت أن الذهاب في ذلك الاتجاه سيكون quyếtًا حكيمًا و”مستقبلًا” لاتخاذ القرار المهني.
لذلك، اقتربت في البداية من المجال مع التركيز على الجوانب المادية للموضوع، وحصلت على شهادتي في الهندسة الميكانيكية من جامعة التخنيون في حيفا، إسرائيل. نحو نهاية دراستي، بدأت في الغوص عميقًا في عالم أدوات التصميم وتقنياتها. هذه هي الأدوات التي تمكن المهندسين الميكانيكيين من تصميم الهياكل والأجهزة الميكانيكية (أي شيء من جسر إلى سيارة). رأيت فرصة هائلة للتأثير الكبير دون التعامل مع التكرارات البطيئة للعالم المادي. في الممارسة، كانت هذه البرامج تفتقر إلى القدرات الحاسوبية والرؤية الاصطناعية المتكاملة التي تساعد المهندسين على إنشاء أنظمة ميكانيكية أبسط وأرخص وأكثر استقرارًا (هذا يعود إلى عام 2015). انطلقت في اتجاه رؤية الكمبيوتر ثلاثية الأبعاد مع التعلم العميق (كان جديدًا في ذلك الوقت) مع هدف جعل برامج التصميم أكثر ذكاءً. العمل في الأيام الأولى من التعلم العميق الحديث،felt مثل أنني جزء من شيء يمكن أن يكون كبيرًا حقًا – مشابهًا للإنترنت.
في الممارسة، كان بحثي الأول الذي أتى بثورة التعلم العميق إلى كليةنا في جامعة التخنيون. هذا ما تحول لاحقًا إلى ورقة مقبولة في أفضل مؤتمر بحث في الرؤية الحاسوبية في العالم، CVPR، وطارت إلى هاواي في CVPR 2017. تقديم ورقتي واللقاء مع الناس فتح عيني إلى حجم مجتمع الرؤية الحاسوبية (الذي يصل إلى 10 أضعاف اليوم)، آلاف المشاركين جميعهم يعملون ب热情 على البحث في المجال. هذا الحدث جعل اتجاهي متصلبًا، مما أظهر لي قوة الرؤية الحاسوبية والpotential المخفي.
يمكنك أن تشاركنا قصةDatagen؟
تأسست Datagen في عام 2018 مع مهمة تحويل كيفية حصول الفرق على بياناتهم لتدريب شبكات الرؤية الحاسوبية. في العام السابق، شاهدنا عرضًا تقديميًا لجهاز Oculus Rift، الذي يتكون من جهاز واقع افتراضي وجهاز تحكم يدوي. بعد العرض، وجدنا أنفسنا نتساءل، “مع الكاميرات المتطورة المدمجة في الجهاز، لماذا كان جهاز تحكم يدوي مطلوبًا للاتصال بين الفضاء الافتراضي والفضاء المادي (أي تتبع حركة اليد)؟” كانت الشبكات العصبية بالفعل متقدمة بما يكفي لمعالجة ذلك، لذلك ما كان المشكلة؟” وهنا انفجر فكرة الضوء — البيانات! رأينا على الفور الفرصة الهائلة لحل تحديات الحضور المكاني ثلاثي الأبعاد باستخدام رؤية حاسوبية متقدمة وبيانات ثلاثية الأبعاد. بدلاً من التركيز فقط على الواقع الافتراضي / المعزز، اتخذنا نهجًا أكثر شمولية، حيث ركزنا على مشكلة غير القابلة للتحلل ظاهريًا لتوليد بيانات تدريب كافية ودقيقة لتمكين تطبيقات الذكاء الاصطناعي ثلاثية الأبعاد في العالم الحقيقي.
مع التركيز على البشر وتفاعل البيئة البشرية، Datagen هي رائدة في مجال البيانات المحاكاة، وهو فرع من البيانات الاصطناعية، والذي يركز على إعادة إنشاء العالم حولنا بطريقة فوتوغرافية حقيقية. اليوم، نعمل مع أكثر الشركات المبتكرة في العالم لتسريع وتسريع تطوير الرؤية الحاسوبية لديهم، وندعم من قبل بعض أكثر المستثمرين احترامًا في هذا المجال.
للمقاطع التي ليست على دراية، هل يمكنك أن تفسر ما هو البيانات الاصطناعية بشكل محدد؟
البيانات الاصطناعية هي أي بيانات تدريب يتم توليدها، بدلاً من جمعها عن طريق القياس المباشر أو الملاحظة للعالم الحقيقي، يتم إنشاؤها إما عن طريق الخوارزمية أو عن طريق المحاكاة. في سياق الرؤية الحاسوبية، البيانات الاصطناعية هي صور حاسوبية مع بيانات وصفية مرتبطة بها مطلوبة لتدريب الذكاء الاصطناعي. مع مشاكل الخصوصية، ومحدوديات فيزيائية واقتصادية حقيقية للبيانات الصورية في العالم الحقيقي، من الصعب المبالغة في أهمية البيانات الاصطناعية للتعلم الآلي والذكاء الاصطناعي. في تقرير حديث، Gartner تنبأت بأن، بحلول عام 2024، معظم البيانات المستخدمة في مجال الذكاء الاصطناعي سيكون مصنوعًا اصطناعيًا لهذه الأسباب.
ما هي بعض الفوائد للبيانات الاصطناعية مقارنة بالبيانات المكتسبة يدوياً؟
الإجابة القصيرة هي، فكر في كل جانب من جوانب اكتساب البيانات يدوياً الذي هو غير مرغوب فيه، وازالة هذه الجوانب من العملية — هذه هي فوائد البيانات الاصطناعية.
توليد مجموعات بيانات متنوعة على نطاق واسع لتدريب الرؤية الحاسوبية هو عملية مكلفة وطويلة، والتنوع محدود جدًا بسبب حقيقة أن وضع البشر في مواقع محددة وتسجيل صور لهم هو عملية معقدة — أكثر تعقيدًا وتكلفة من القيام بذلك في بيئة محاكاة. أحد الفوائد الرئيسية الأخرى هو القضاء الفعلي على الحاجة إلى التعليق اليدوي، الذي هو ممل ومرهق ومتأثر بالخطأ البشري.
تُشير Datagen إلى البيانات المحاكاة كفرع من البيانات الاصطناعية. هل يمكنك أن تُفسر ما هي البيانات المحاكاة؟
البيانات المحاكاة هي بيانات اصطناعية يتم توليدها من خلال المحاكاة. نستخدم GANs (وكذلك بعض الطرق المتقدمة الأخرى للتعلم الآلي) لتوليد كائنات ثلاثية الأبعاد ووضعها في محاكاة ثلاثية الأبعاد حقيقية للعالم الحقيقي. ما يبدو عليه هو عملية تصوير افتراضي “من منظور أول”، ولكن يعمل في نظام متجسم حقيقي القواعد. هذه المحاكاة تنتج بيانات بصرية (كما لو كانت تم جمعها في العالم الحقيقي)، مع مجموعة كاملة من التعليقات (الفيزياء والإضاءة، إلخ.). لذلك، البيانات المحاكاة هي بيانات اصطناعية حقيقية، محاكاة سياقيًا، صور ثلاثية الأبعاد تم جمعها في بيئة محاكاة.
كيف تُولد Datagen بيانات محاكاة مخصصة؟
تُولد تقنية Datagen بيانات محاكاة يمكن توسيعها بسهولة وتailored لتلبية احتياجات كل عميل فريد. نفعل ذلك من خلال مراعاة كل جانب من جوانب كل مشروع — من نظام الرؤية الحاسوبية المستخدمة إلى التكوين الديموغرافي للمنطقة التي ستعمل فيها. سواء عملنا مباشرة مع عملائنا أو تمكين مهندسيهم، عملية Datagen تبدأ بتحديد المعلمات الرئيسية لكل حالة استخدام محددة، مثل مواصفات العدسة والإضاءة والبيئة والتوزيع الديموغرافي، إلخ. تستخدم Datagen GANs وأدوات وطرق متقدمة أخرى لتوليد مجموعة هائلة من الأصول، بما في ذلك كل شيء من رؤوس بشرية مع تعابير وجه ديناميكية لتدريب الذكاء الاصطناعي في تحليل المشاعر، إلى интерيورات المركبات لمراقبة الركاب في الكابينة، وبيئات المنزل لتطبيقات الاتصالات المرئية، على سبيل المثال لا الحصر.
بفضل هذه القدرات، مجموعات بيانات Datagen ليست فقط كبيرة ومتنوعة، ولكنها مُحسنة لأغراض تدريب نظام فريد لتنفيذ مهمة فريدة (أو مجموعة من المهام) في البيئة الفريدة أو الإعداد الذي سيتم استخدامه — كل ذلك دون المساس bằng القدرة على التوسيع. نأخذ أيضًا في الاعتبار متطلبات التعليق / البيانات الوصفية المحددة لكل تطبيق.
ما هي بعض الأمثلة على الحلول في الروبوتات حيث يتم استخدام البيانات الاصطناعية و / أو المحاكاة؟
أحد أكبر مزايا استخدام البيانات المحاكاة في الروبوتات هو القدرة على توليد صور للأجهزة التي لا تزال قيد التطوير. بهذه الطريقة، يمكن تطوير دماغ الروبوت (الذكاء الاصطناعي) وجسده (الأجهزة) جنبًا إلى جنب. الآن، يمكن أن تتطور التدريبات مع تطور المواصفات، بدلاً من انتظار المنتج النهائي حتى يتم اختراعه قبل أن تتم撮 صوره وبدء تطوير الذكاء الاصطناعي.
أيضًا، لأن البيانات المحاكاة يتم توليدها في السياق، يمكنك مراعاة التفاعل بين روبوتك وبيئته بسهولة أكبر. إذا كنت تتخيل روبوتًا يلتقط ويزيل المنتجات المعيبة من خط التجميع، فإن البيانات المحاكاة ستسمح لك بتوليد بيانات لجميع العيوب المادية المحتملة في المنتج، بالإضافة إلى رؤية الذراع الروبوتي وتفاعله مع الكائن الذي يتم حمله. ما هو أكثر من ذلك، فإن البيانات الثلاثية الأبعاد تعني عدم الحاجة إلى تعليق صورة بعد صورة بشكل متعب لضمان قدرة الروبوت على التعرف بشكل صحيح على المنتج، العيوب، ذراعه، أو أي شيء آخر في مجال رؤيته.
ما هي بعض الحالات التي يمكن استخدام البيانات المحاكاة فيها في السيارات الذكية؟
البيانات المحاكاة في تطوير السيارات الذكية تجعل من السهل تطوير مجموعات بيانات لطرازات السيارات أثناء تصميمها، مع التكرار جنبًا إلى جنب مع السيارة نفسها أثناء مرورها عبر مراحل التصميم والإنتاج المختلفة. مع بيانات الصور المحاكاة، يمكن لمهندسي السيارات استخدام رؤية الكابينة بشكل أكثر فعالية لتحديد السائقين النائمين أو المنشغلين، أو إذا كان السائق قد أزال يده من عجلة القيادة، أو أي حالة حافة لمراعاة سلامة السائق. كما أنها تمكنهم من مراعاة تنوع أكبر في السائقين والركاب، وإدخال التباين في شكل زاوية الصورة والإضاءة — كل ذلك دون المساس بخصوصية الأشخاص الحقيقية.
أعلنت Datagen مؤخرًا عن عدد كبير من التوظيفات الجديدة المثيرة، ماذا يعني هذا للشركة في المستقبل؟
الإضافات الحديثة إلى مجلس الإدارة والقيادة التنفيذية تشمل بعض أكثر المحترفين المتميزين في مجال الذكاء الاصطناعي والرؤية الحاسوبية. معرفتهم، رؤيتهم، وخبرتهم ستساعد في توجيه وتسريع نمو Datagen أثناء الملاحة في صناعة لا تزال شابة ومتألقة الفرص. في مجال به العديد من المجهول، لا شيء أكثر قيمة من المعرفة.
هل هناك أي شيء آخر تود مشاركته حول Datagen؟
يقع مقر Datagen في تل أبيب، وهو جزء من تحول اقتصادي وثقافي أكبر حدث في إسرائيل، ونحن فخورون بكوننا جزءًا منه. في فترة زمنية قصيرة، نمت إسرائيل (تل أبيب على وجه الخصوص) إلى مركز تكنولوجي عالمي رئيسي، مع نظام ابداعي مزدهر ومجتمع استثماري نشط. على الرغم من أن إسرائيل غالبًا ما تعتبر مركزًا لتكنولوجيا الأمن السيبراني، نمت التكنولوجيا المركزة على الذكاء الاصطناعي والبيانات بشكل كبير في السنوات الأخيرة هنا. اليوم، هناك أكثر من 680 شركة ذكاء اصطناعي في إسرائيل، والتي جمعت بشكل جماعي 4.5 مليار دولار. هذا انفجار النمو خلال السنوات القليلة الماضية يعود في الغالب إلى تركيز كبير من المهندسين والجامعات الإسرائيلية الشهيرة. توفر هذه المؤسسات الأكاديمية وصولًا إلى المواهب وتطوير التكنولوجيا الجديدة في هذا المجال. في الأشهر القليلة الماضية، استأجرت Datagen أكثر من 20 موظفًا وتخطط لاستخدام أعضاء فريق إضافيين عبر مبيعات وتسويق وبرمجيات و DevOps وأقسام المنتجات.
شكرًا على المقابلة الرائعة، القراء الذين يرغبون في معرفة المزيد يجب أن يزوروا Datagen.












