مقابلات
رادو روسو، الرئيس التنفيذي و الشريك المؤسس لشركة Fyusion – سلسلة المقابلات

رادو روسو، هو الرئيس التنفيذي و الشريك المؤسس لشركة Fyusion، وهي شركة تهدف إلى بناء تقنيات ثلاثية الأبعاد جديدة وجميلة بصريًا من شأنها تمكينهم من حل مشاكل مرئية معقدة باستخدام الذكاء الاصطناعي. معًا طوروا وبراءة اختراع تنسيق ملف جديد، يسمى .fyuse، يسمح للأشخاص بالتقاط صور ثلاثية الأبعاد رائعة من هواتفهم الذكية، مما يسبب ضجة على وسائل التواصل الاجتماعي وجذب أكثر من 100 مليون مستخدم من خلال تطبيقات الهاتف المحمول للمستهلكين.
لقد كنت تعمل على 3D منذ عام 2012، وأنت حاليًا الرئيس والرئيس التنفيذي لشركة Open Perception، Inc. هل يمكنك مشاركة بيان مهمة هذه المنظمة غير الهادفة للربح؟
بدأت مسيرتي في معالجة بيانات 3D في أوائل عام 2000 أثناء دراستي العليا، مع هذه الفكرة في رأسي أنني سأجعل الروبوتات ترى وتفهم العالم بشكل أفضل من منظور مرئي. هذا أدى بي خلال عقد من الزمن من البحث في رؤية الكمبيوتر ثلاثية الأبعاد المتعلقة بالروبوتات، وفي أوائل عام 2010 لاحظت أن ما كنت أعمل عليه يمكن تطبيقه على مجموعة أوسع من المشاكل. تم إنشاء Open Perception كفرع من Willow Garage، وأخذت واحدة من مبادراتنا مفتوحة المصدر بموجب ترخيص BSD – مشروع مكتبة السحابة النقطية (PCL) – واستمرت في تعزيز نموها. تم دمج Open Perception، Inc. في كاليفورنيا في أبريل 2012 كمنظمة مستقلة تم إنشاؤها لغرض دعم تطوير ونشر واعتماد برنامج مفتوح المصدر لمعالجة بيانات الحس المرئية 2D / 3D، مع تطبيقات في البحث والتعليم وتطوير المنتجات.
في عام 2014، أصبحت الشريك المؤسس والرئيس التنفيذي لشركة Fyusion، Inc. هل يمكنك مشاركة قصة نشأة شركة Fyusion، Inc؟
أثناء الانخراط في أبحاث الروبوتات، أدرك مؤسسو Fyusion وأنا أن العوائق لم تكن خوارزميات nữa ولكن تنسيقات البيانات. كان الذكاء الاصطناعي قد وصل إلى ذروة الدقة في العديد من المجالات في ذلك الوقت لأن نوع البيانات التي كنا نستخدمها، خاصة في التنسيقات المرئية، كان ثنائيًا (مثل الصور والفيديو)، بينما العالم ثلاثي الأبعاد. شعرت بالفرصة لتحويل الطريقة التي يفهم بها الناس العالم من خلال الاستفادة من بيانات 3D في منصات التعلم الآلي.
في عام 2014، قررنا إنشاء نوع جديد من البيانات 3D، التي تم إنشاؤها من خلال برنامج رؤية الكمبيوتر وبرنامج التعلم الآلي، من خلال دمج مصادر بيانات متعددة واستخدام الأجهزة التخزينية المتاحة بكميات كبيرة في جيوبنا – أي هواتفنا الذكية.
أسسنا Fyusion بهدف بناء تقنيات ثلاثية الأبعاد جديدة وجميلة بصريًا من شأنها تمكين الجميع من حل مشاكل مرئية معقدة باستخدام الذكاء الاصطناعي.
معًا طورنا وبراءة اختراع تنسيق ملف جديد، يسمى .fyuse، يسمح للأشخاص بالتقاط صور ثلاثية الأبعاد رائعة من هواتفهم الذكية. هذا تسبب على الفور في ضجة على وسائل التواصل الاجتماعي وجذب أكثر من 100 مليون مستخدم من خلال تطبيقات الهاتف المحمول للمستهلكين.
ما هو ما جذبك في البداية إلى فكرة إعادة تعريف معنى 3D للتطبيقات الاستهلاكية؟
كنا ندرك ببساطة أن لا أحد تعامل مع هذا النطاق. كان هذا مشكلة لم تحل. مثل ما هو الحال في برامجنا للدكتوراه، الأشياء التي تثيرنا فكريًا هي مشاكل معقدة حقًا يقال أنها لا يمكن حلها.
في هذه الحالة، إلى حد ما، كانوا على حق. الخوارزميات المطلوبة لحل هذا لم تكن مفكرة تمامًا، والعتاد المطلوب لتشغيلها لم يكن موجودًا، خاصة على أجهزة حافة مثل الهواتف الذكية. كنا في الواقع بحاجة إلى الانتظار حتى إصدار iPhone 4S حتى نتمكن من تشغيل رمز رؤية الكمبيوتر ثلاثية الأبعاد في الوقت الفعلي على هاتف ذكي، لأن الهواتف الذكية السابقة لم تكن تحتوي على نواة معالج واحدة فقط. بمجرد أن بدأنا نرى ما يمكن أن تفعله عتاد الهاتف الذكي، أصبحنا مهتمين جدًا بالاستفادة من خبرتنا في أبحاث رؤية الكمبيوتر وروبوتاتنا ومراقبة ما يمكننا ضغطه في هذه الكاميرات الصغيرة والوحدات المركزية / وحدات معالجة الرسومات. لقد استغرق الأمر بعض الوقت للعودة إلى لوح الرسم وإعادة التفكير في كيفية تخيل وتنفيذ التقاط حقل الضوء ومعالجته من خلال البرنامج فقط. بمجرد أن رأينا أنه يعمل، كانت Fyusion على الطريق.
كنا نملك في الماضي صورًا ثنائية الأبعاد في شكل مطبوع، ثم تم رقميتهم مع كل شيء آخر. كانت التمثيل الوحيد الذي كنا نمتلكه في عالم 3D على نطاق واسع هو “شبكة مثلثية مع نص” (على سبيل المثال، تنسيقات الملفات مثل OBJ) التي جاءت من ألعاب الكمبيوتر والرسومات الحاسوبية وتمت 意ة لتمثيل كائنات اصطناعية في لعبة. إنها تعتمد بشكل كبير على الهندسة المثالية، وهو ما لا يمكن الحصول عليه – كيف تقوم بالتقاط وتمثيل الماء كشبكة مثلثية مع نص؟ ماذا عن الكائنات الشفافة؟ الأوراق؟ الأشياء التي تبعد عنا؟ وما إلى ذلك …
كان من الواضح أن شخصًا ما يجب أن يعالج الحاجة إلى تنسيقات 3D صديقة للمستهلك. كان يجب أن يكون ذلك على أساس نمط مختلف تمامًا، وحل في طريقة “تجسيد صورة 3D” (أي حقل الضوء)، وإدراج المعلومات المتاحة في وقت التقاطها (مثل توجيه الكاميرا من خلال مستشعر الجيروسكوب) التي عادة ما يتم التخلص منها عند التقاط صورة ثنائية الأبعاد. ثم بالطبع نحن نحاول إعادة استنتاج هذه المعلومات المُلغاة من خلال التعلم الآلي.
كانت هذه فرصتنا، وهذا ما يجب أن تحلمه الشركات الناشئة: العثور على مشكلة صعبة حقًا يعتزون بها، وانتظار الوقت والفرصة المناسبة، والعمل بجنون لحلها.
يسمح التكنولوجيا الأساسية لأي شخص بإنشاء صور ثلاثية الأبعاد غامرة ومتفاعلة تسمى .fyuses عن طريق تحريك أي كاميرا حول شخص أو كائن أو مشهد. هل يمكنك مناقشة عملية إنشاء .fyuses باستخدام تطبيق الهاتف المحمول؟
мы仍 في مرحلة الطفولة لهذه التكنولوجيا، ولكن جوهر الأمر هو: تاخذ هاتفًا ذكيًا يحتوي على تطبيق مكتوب بواسطة Fyusion أو تطبيق شريك يستخدم SDK Fyusion ALIS أسفل، وتفتح الكاميرا. تتلقى تعليمات حول ما يجب فعله، وإن اتبعتها، فستحصل على .fyuse على الجهاز وهو “كائن ملف” معالج بواسطة رؤية الكمبيوتر وبرنامج التعلم الآلي يمكن تقديمه على الجهاز أو على الويب أو على أي جهاز واقع افتراضي / واقع معزز / واقع mieszany.
ما هي بعض تقنيات رؤية الكمبيوتر والتعلم الآلي المستخدمة لجعل هذا حقيقة؟
لا يوجد رصاصة فضية هنا، ولكن خليط ضخم من أدوات رؤية الكمبيوتر ثلاثية الأبعاد والتعلم الآلي التي أنشأناها لحل هذه المشكلة. هناك أفكار من التصوير الجوي (لأننا ننشئ فعليًا مصفوفة كاميرا افتراضية عن طريق تحريك كاميرا واحدة في الفضاء)، وروبوتات (مشكلة ضخمة لدمج الحس لأننا لا نملك كاميرا واحدة nữa، ولكن مجموعة من الحس التي يمكن سحب البيانات منها لمساعدتنا على حل هذه المشكلة)، ورسومات حاسوبية (يمكنك النظر إلى عملنا في Siggraph 2019 لفهم كيف نrepresent بعض الهياكل الأساسية)، وأكثر من ذلك. كل هذا كان يجب أن يتم على الجهاز ويمكن تشغيله في الوقت الفعلي، مما يعني أننا نستخدم compute shaders ونتحدث في لغة التجميع. كما ذكرنا، هذا只是 البداية، وأكثر ما يكون متاحًا لنا من حساسات وطاقة حسابية، أكثر ما سوف نستخدمه لتحسين جوانب عديدة من التكنولوجيا. هذه رؤية طويلة الأمد، ولدينا عقد من العمل أمامنا لكي نكون راضين تمامًا عن الطريقة التي تبدو بها المشاهد الحقيقية المعقدة المقموعة.
من السهل تخيل كيف ستكون .fyuses مدمرة للتطبيقات الواقعية الافتراضية. هل يمكنك مناقشة نوع التطبيقات الواقعية الحالية التي يمكن استخدام .fyuses فيها؟
نعتقد أن أي تطبيق واقعي افتراضي حيث يتم تحويل كائن حقيقي إلى رقمي ثم عرضه يجب أن يستفيد من استخدام محرك ALIS و .fyuses. لا يوجد نقص في التطبيقات الرأسية والتطبيقات في التجارة الإلكترونية والرعاية الصحية والسيارات والتعليم وما بعدها، ونحن متحمسون جدًا لهذا المستقبل.
ماذا تتوقعونه لمستقبل تطبيقات الواقع الافتراضي لشركة Fyuses؟
لا نرى أي قيود للتكنولوجيا الحالية، على الرغم من أن التركيز الحالي أكثر على المشاهد الصغيرة والمتوسطة والأجسام، وليس المناظر الطبيعية الكبيرة.
يمكنني بسهولة تخيل Fyuses التي يتم استخدامها في تطبيقات الواقع المعزز والمixed reality في المستقبل. ما هو رؤيتك لمستقبل Fyuses في كل من إعداد الواقع المعزز والمixed reality؟
نعتامل مع جميع تطبيقات الواقع الافتراضي / الواقع المعزز / الواقع الممتزج بنفس الطريقة: بمجرد أن يتم رقمي كائن ثلاثي الأبعاد باستخدام تكنولوجيانا، يمكن استخراجه من المشهد ووضعه في أي مكان.
هل ناقش فريقك فكرة إنشاء Fyuses مع مساعد افتراضي أو ذكاء اصطناعي؟
لم نستكشف فرصة إنشاء تماثيل افتراضية تفاعلية للأشخاص. هذه إمكانية مثيرة للاهتمام بالتأكيد، ولكن نحن نحاول البقاء مركزين على حل مجموعة المشاكل التي نعمل عليها حاليًا.
هل هناك أي شيء آخر تود مشاركته حول Fyuses أو Fyusion، Inc؟
قد يبدو هذا وكأنه عرض، ولكن … نحن مجموعة من روبوتات مجنونة و科学اء رؤية الكمبيوتر ثلاثية الأبعاد، مخلوطين مع فيزيائيي CERN ومخترقين رائعين ومهندسين، وهذا يعبر فقط عن أعضاء الفريق الفني الأساسي. نحب التنوع بجميع أنواعه، لأن هذا يجعلنا أكثر ذكاء وقوة كفريق. إذا كان أي شيء نعمل عليه يهم أي شخص يقرأ هذا، فلا تتردد في الاتصال بنا. نحن نفعل ما في وسعنا للاجابة على الجميع، وربما تجد نفسك في وضع تذهب إليه لتتناول القهوة ثم تبقى لمدة عقد من الزمن.
شكرًا على المقابلات الرائعة، القراء الذين يرغبون في معرفة المزيد يجب أن يزوروا Fyusion.












