Connect with us

ستيفن ميلر، المؤسس المشارك والرئيس التنفيذي للهندسة في Fyusion – سلسلة المقابلات

مقابلات

ستيفن ميلر، المؤسس المشارك والرئيس التنفيذي للهندسة في Fyusion – سلسلة المقابلات

mm

ستيفن ميلر هو المؤسس المشارك والرئيس التنفيذي للهندسة في Fyusion، وهي شركة لتصوير ثلاثي الأبعاد والرؤية الحاسوبية، وتعتبر جزءًا من مجموعة Cox Automotive. قبل تأسيس Fyusion، كان طالبًا دكتوراه في جامعة ستانفورد حيث دراس العلوم الحاسوبية، وعمل على الروبوتات الشخصية مثل طي الملابس وربط العُقد الجراحية خلال دراسته الجامعية في جامعة كاليفورنيا، بيركلي. وهو زميل في Google Hertz، وزميل SAP Stanford Graduate، وزميل NSF السابق.

يمكنك أن تفسر ما هي Fyusion وكيف تمكن من التقاط وتصوير بيانات 3D بسهولة؟

Fyusion هي شركة رؤية حاسوبية توفر تجارب عملاء ثلاثية الأبعاد مدفوعة بالذكاء الاصطناعي. نحن نسمح للأشخاص بتقاط صور ثلاثية الأبعاد من خلال تطبيق هاتف ذكي بسيط يعمل على معظم أجهزة Android وiOS. يحتوي التطبيق على إرشادات خطوة بخطوة ومصمم لاستخدامه من قبل أي شخص، بغض النظر عن الخبرة الفنية. يستغرق الأمر دقيقة أو دقيقتين لتقاط الصورة. من هناك، يمكن لمحركنا الذكي ALIS تحليل الصور ثلاثية الأبعاد وتحويل البيانات البصرية إلى معلومات قابلة للتنفيذ. حاليًا، نحن مركزون على استخدام الصور ثلاثية الأبعاد لتشخيص الأضرار الخارجية للسيارات.

يمكنك أن تفسر كيف تستخدم الخوارزميات تنسيق الملف .fyuse لتمكين هاتف ذكي ذو كاميرا واحدة من إنشاء صور ثلاثية الأبعاد؟

أجد أنه من المفيد النظر إلى تنسيق .fyuse جنبًا إلى جنب مع الصور والفيديوهات. الصورة تلتقط لحظة في الوقت من زاوية ثابتة، والفيديو يلتقط سلسلة من تلك اللحظات في جدول زمني خطي. على العكس من ذلك، صورة .fyuse تلتقط ما نسميه “لحظة في الفضاء”. لا يتم حصر المشاهد في زاوية واحدة أو جدول زمني خطي: يمكنهم رؤية ليس فقط جانب واحد من شيء ما، ولكن أيضًا حوله.

لإنشاء صورة .fyuse، يحيط المصور الموضوع في اتجاه واحد بكاميرا هاتف خليوي. بديلًا، تتوافق تقنية Fyusion أيضًا مع حلول التصوير الثابتة وحلول التصوير غير التقليدية مثل الطائرات بدون طيار.

تنسيق ملفنا .fyuse هو ما يمنح هذه الصور الحياة. إنه خفيف الوزن ويمكّن من تفاعل متعدّد الأوجه معقد. كما أنه متوافق تمامًا مع الأجهزة اللوحية وأجهزة الكمبيوتر المحمولة والهواتف الذكية التي يمتلكها المستخدم العادي في ترسانته.

يمكنك أن تناقش بعض البيانات التي يتم التقاطها وتحليلها مع Fyusion؟

مع السيارات، يعرف ALIS كل جزء من المركبة، ويمكنه بعد ذلك تحديد مكان الضرر وحجمه ومدى خطورته، وإlimination المحتملة للنتائج الإيجابية الكاذبة، مثل الغبار الذي يُقذف من الطريق. التقنية التي طوّرناها وبرعتها يمكن حل مشاكل أخرى، ولكن هذا هو ما نركز عليه حاليًا.

يمكنك أن تناقش ما هو AI-based Lightfield Information Suite (ALIS)?

ALIS هو المحرك وراء كل منتج Fyusion. إنه يسمح بتصوير ثلاثي الأبعاد خفيف الوزن وفهم بصرية عميق. هناك ثلاثة أجزاء تشكل ALIS: Capture، Engine وViewer. في وحدة Capture، يحتوي التطبيق المحمول على دروس مدمجة وعمليات عمل قابلة للتعديل تتيح للمستخدمين التقاط صور ثلاثية الأبعاد عالية الجودة باستخدام معظم الهواتف الذكية في السوق. تدعم تقنية التقاط الصور في Fyusion أيضًا الكاميرات الرقمية وطائرات بدون طيار ومجموعة من الأجهزة الأخرى.

في الخطوة الثانية، Engine، يتحليل ALIS تلك الصور ثلاثية الأبعاد ويحولها إلى معلومات قابلة للتنفيذ، مثل أنواع الأضرار المطلوبة من قبل عملائنا. كما يمكنه تقديم دعم لاستخلاصاته من خلال إنشاء صور ثنائية الأبعاد عالية الدقة للضرر الذي يكتشفه.

أخيرًا، يعرض Viewer تنسيق الملف .fyuse. تنسيق .fyuse هو براءة اختراع خفيف الوزن ويوفر تجربة ثلاثية الأبعاد غامرة مع أوقات تحميل سريعة. نحن قادرون على إضافة جميع أنواع التجارب إلى .fyuse، بما في ذلك الصوت والفيديو وبالطبع الصور ثنائية الأبعاد.

Fyusion جاهزة لكل من AR وVR، كم تعتقد أن هذه التطبيقات ستكون كبيرة في المستقبل؟

الواقع المعزز هو صناعة مليارية تصبح أكثر شيوعًا، وأصبح من السهل التقاط المحيط في ثلاثية الأبعاد بفضل الأجهزة المحمولة القوية والشبكات منخفضة الزمن. مع تحرك هذه التكنولوجيا إلى السوق الرئيسية، ستزيد التوقعات من تجارب العملاء عبر الإنترنت بسرعة كبيرة كما يمكن للمبدعين المحتوى مواكبة ذلك.

特别 في صناعة السيارات، مع زيادة شراء السيارات عبر الإنترنت، نتوقع في السنوات القليلة القادمة زيادة في الاهتمام بالواقع المعزز وVR والقوائم ثلاثية الأبعاد. الهدف هو تحويل صفحة تفاصيل المركبة البسيطة (VDP) إلى صفحة تجربة المركبة (VEP)، مما يساعد على استمرار تجار السيارات الكبار والصغار في الازدهار. يمكن أن يكون هذا أي شيء من إضافة شعارات ثلاثية الأبعاد ووسوم الوسائط الغنية إلى القوائم، أو السماح للمتسوقين بوضع مجموعة من أندية الغولف في صندوق السيارة افتراضيًا لمعرفة كيف تتناسب معها.

سيكون من المثير رؤية كيفية عمل هذه التطبيقات في استخدامها الشائع. لا أعتقد أننا سننتظر لفترة طويلة.

يمكنك أن تناقش تحسن معدل النقر وال доход الذي يُرى في التجارة الإلكترونية من استخدام الصور ثلاثية الأبعاد مقابل الصور ثنائية الأبعاد؟

أنا أكثر إلمامًا ببيع وشراء السيارات بالجملة والتجزئة. الصور ثلاثية الأبعاد خلقت مستوى جديدًا من الثقة للمتسوقين عبر الإنترنت، وهو ما يعتبر حاسمًا بشكل خاص مع العناصر الكبيرة مثل السيارات.

بياناتنا الداخلية تشير إلى أن الصور ثلاثية الأبعاد تزيد من تفاعل المستخدم والوقت المُقضى على صفحات تفاصيل السيارة، مما يزيد بدوره من مبيعات السيارات. كما توفر تجربة ثلاثية الأبعاد واقعية للسيارة ثقة إيجابية تجاه البائع من خلال زيادة الثقة.

يمكنك أن تناقش واحدة من الخيارات مع Fyusion هي معالجة البيانات محليًا أو على السحابة، يمكنك أن تناقش فوائد كل منها؟

محليًا، يضطر الذكاء الاصطناعي على الحافة المطورين إلى العمل ضمن قيود كبيرة، خاصةً لاستخدام حالة الهواتف المحمولة. بالإضافة إلى المخاوف القياسية لأي مطور ذكاء اصطناعي – كيف يتم تحسين الشبكة؟ كيف يتم تحقيق النتائج الموثوقة؟ – هناك مخاوف عملية تضع سقفًا واضحًا. ضغط الذاكرة، انخفاض البطارية، إمكانية وضع عملية في الخلفية من قبل المستخدم أو نظام التشغيل، الخ. واضعًا في الاعتبار أن معالجات ووحدات معالجة الرسومات المكافئة متاحة على الحافة. حتى لأجهزة الفлаг십، هذا نادرًا ما يكون هو الحال.

يجب التخطيط لكل حالة محتملة؛ في حين أن أي حل في السحابة يمكن مراقبته وضبطه بدقة.

لكن بشكل جماعي، يمكن اعتبار الذكاء الاصطناعي على الحافة هو الحل المثالي “للمساهمة التلقائية”: لكل مستخدم جديد، يكون لديك آلة جديدة تمامًا في متناول يديك. إذا كنت قد حددت شبكتك لتشغيلها بالكامل على الحافة، يمكنك بسهولة خدمة عميلين أو مليوني عميل.

في حين أن أضخم الأجهزة دائمًا ما توجد في السحابة، يُقبل بشكل عام أن البيانات هي الملك. كلما زادت البيانات، وزاد قربها من البيانات الخام، كان ذلك أفضل. الذكاء الاصطناعي على الحافة يمتلك إمكانية الوصول إلى بيانات خام غير معالجة، دون أي قيود. في حين أن حلول الذكاء الاصطناعي في السحابة، يجب معالجة بيانات الإدخال (مضغوطة، جزئية) أو تكون巨ة، عند هذه النقطة يصبح النطاق الترددي قلقًا جديًا.

نظرًا لأنها أقرب إلى المستخدم، يفتح الذكاء الاصطناعي على الحافة إمكانيات لا تفتحها السحابة. إذا تم تحسينه ليعمل في الوقت الفعلي، يمكنه تقديم ملاحظات في الوقت الفعلي. مما يعني أنك يمكنك بناء حلول لا تبتلع البيانات فحسب، بل تشجع المستخدمين على تقديم بيانات أفضل.

كيف ستمكن 5G من النمو السريع في تطبيقات تقنية الرؤية الحاسوبية؟

عند سرعات اتصال أسرع، يمكنك نقل المزيد من المعالجة إلى السحابة، مما يفتح إمكانيات جديدة لتطبيقات الرؤية الحاسوبية. ومع ذلك، يعتمد ذلك على التطبيق وكيف سيتخذها الناس.

5G قد يكون له تأثير منقسم ويزيد من الفجوة الرقمية، حيث تتمتع بعض مناطق العالم باتصالات أسرع وأسرع، بينما تواصل مناطق أخرى الحصول على اتصالات بطيئة. التطبيقات التي تركز على الأشخاص الذين لديهم إمكانية الوصول إلى 5G سوف تستفيد بشكل واضح. ولكن بشكل أوسع، التطبيقات التي تُعتمد على نطاق واسع قد تضطر إلى اختيار بين قضاء الوقت والمال لما سيكون في النهاية إصدارين من نفس التطبيق، أو الالتزام بإصدار واحد أقل قوة يمكن تشغيله على أي اتصال.

ما هي الخطوات التي تتخذها Fyusion للاستفادة من طرح 5G في المستقبل؟

أريد أن أسابق بالقول إن Fyusion قد قامت بوقت كبير لضمان أن يستطيع العملاء الوصول إلى تطبيقاتنا حتى على الهواتف القديمة مع اتصال ضعيف. مع Manheim وحدها، قامت تقنيتنا بتصوير أكثر من مليون سيارة، ولن نكون قد حققنا ذلك بدون ذلك.

قال ذلك، نحن متحمسون جدًا لما نراه حاليًا – إنه ثلاثية من سرعات المعالجة المتزايدة و اتصال 5G وثورة في كاميرات الهواتف. ضع كل ذلك معًا وستحصل على بعض التطورات الجديدة التي للأسف لا أستطيع مشاركتها معك الآن.

هل هناك شيء آخر تود أن تشاركه حول Fyusion؟

إنه وقت مثير للعمل في مجال الرؤية الحاسوبية – كمنضويّة، نحن ندخل السوق الرئيسية بعد سنوات عديدة من الحديث عنها كتكنولوجيا مستقبلية. Fyusion تتوسع بسرعة ونحن نستأجر علماء رؤية حاسوبية من جميع أنحاء العالم. يمكن لأعضاء الفريق العمل من أي مكان، ولكنهم دائمًا مرحب بهم في مكاتبنا في Potrero Hill.

شكرًا على المقابلة الرائعة، القراء الذين يرغبون في معرفة المزيد يجب أن يزوروا Fyusion.

أنطوان هو قائد رؤى ومؤسس شريك في Unite.AI، مدفوعًا بشغف لا يتزعزع لتشكيل وتعزيز مستقبل الذكاء الاصطناعي والروبوتات. رجل أعمال متسلسل، يعتقد أن الذكاء الاصطناعي سيكون مدمرًا للمجتمع مثل الكهرباء، وغالبًا ما يُقبض عليه وهو يثرثر عن إمكانات التكنولوجيات المدمرة و AGI.

كما أنه مستقبلي، فهو مخصص لاستكشاف كيف سيشكل هذه الابتكارات العالم. بالإضافة إلى ذلك، فهو مؤسس Securities.io، وهي منصة تركز على الاستثمار في التكنولوجيات المتقدمة التي تعيد تعريف المستقبل وتهيئ القطاعات بأكملها.