Συνεντεύξεις
Stephen Miller, Συνιδρυτής & Αντιπρόεδρος Μηχανικής στο Fyusion – Σειρά Συνεντεύξεων

Ο Stephen Miller είναι ο συνιδρυτής και Αντιπρόεδρος Μηχανικής στο Fyusion, μια εταιρεία 3D απεικόνισης και υπολογιστικής όρασης, μέρος του ομίλου Cox Automotive. Πριν από την ίδρυση του Fyusion, ήταν φοιτητής διδακτορικού στο Πανεπιστήμιο του Στάνφορντ, σπουδάζοντας Επιστήμη Υπολογιστών, και εργάστηκε σε προσωπική ρομποτική, όπως το πτύσιμο ρούχων και το δέσιμο χειρουργικών κόμπων κατά τη διάρκεια των προπτυχιακών σπουδών του στο UC Berkeley. Είναι fellow του Google Hertz, fellow του SAP Stanford Graduate και fellow του NSF.
Μπορείτε να εξηγήσετε τι είναι το Fyusion και πώς επιτρέπει την εύκολη καταγραφή και οπτικοποίηση των 3D δεδομένων;
Fyusion είναι μια εταιρεία υπολογιστικής όρασης που παρέχει εμπειρίες πελάτη 3D με τη βοήθεια του AI. Επιτρέπουμε στους ανθρώπους να καταγράφουν 3D εικόνες μέσω μιας απλής εφαρμογής για κινητά τηλέφωνα που τρέχει σε meisten Android και iOS συσκευές. Η εφαρμογή έχει βήμα-βήμα οδηγίες και είναι σχεδιασμένη να χρησιμοποιηθεί από οποιονδήποτε, ανεξάρτητα από τις τεχνικές γνώσεις. Παρά τη διάρκεια ενός λεπτού ή δύο για την καταγραφή της εικόνας. Από εκεί, ο κινητήρας AI μας, ALIS, μπορεί να αναλύσει 3D εικόνες και να μετατρέψει τα οπτικά δεδομένα σε ενεργητικά στοιχεία. Αυτή τη στιγμή εστιάζουμε στο να χρησιμοποιήσουμε 3D εικόνες για τη διάγνωση εξωτερικής ζημιάς σε αυτοκίνητα.
Μπορείτε να εξηγήσετε πώς τα αλγόριθμοι χρησιμοποιούν το формάτ .fyuse για να επιτρέψουν σε μια単ή κάμερα κινητού τηλεφώνου να δημιουργήσει 3D εικόνες;
Βρίσκω χρήσιμο να θεωρώ το формάτ .fyuse μαζί με φωτογραφίες και βίντεο. Μια φωτογραφία καταγράφει μια στιγμή στο χρόνο από μια σταθερή γωνία, και ένα βίντεο καταγράφει μια σειρά από αυτές τις στιγμές σε μια γραμμική χρονοσειρά. Αντίθετα, μια εικόνα .fyuse καταγράφει αυτό που喜欢 να λέμε “μια στιγμή στο χώρο”. Ο θεατής δεν είναι περιορισμένος σε μια seule γωνία ή γραμμική χρονοσειρά: Μπορεί να δει όχι μόνο μια πλευρά κάτι, αλλά και γύρω από αυτό.
Για να δημιουργήσετε μια εικόνα .fyuse, ο φωτογράφος κυκλώνει το αντικείμενο σε μια κατεύθυνση με μια κάμερα κινητού τηλεφώνου. Εναλλακτικά, η τεχνολογία Fyusion είναι επίσης συμβατή με σταθερές λύσεις απεικόνισης και μη παραδοσιακές λύσεις απεικόνισης, όπως drones.
Το формάτ .fyuse είναι αυτό που φέρνει αυτές τις εικόνες στη ζωή. Είναι ελαφρύ και επιτρέπει πολύπλοκη, πολλαπλή αλληλεπίδραση. Είναι επίσης πλήρως συμβατό με λάπτοπ, ταμπλέτες και κινητά τηλέφωνα που ο καθημερινός χρήστης ήδη έχει στη διάθεσή του.
Μπορείτε να συζητήσετε κάποια από τα δεδομένα που καταγράφονται και αναλύονται με το Fyusion;
Με τα αυτοκίνητα, το ALIS αναγνωρίζει κάθε μέρος του οχήματος και στη συνέχεια μπορεί να καθορίσει哪里 υπάρχει ζημιά, το μέγεθος και τη σοβαρότητα της ζημιάς, και να εξαλείψει πιθανές ψευδείς θετικές, όπως η βρομιά που ανυψώνεται από το δρόμο. Η τεχνολογία που έχουμε αναπτύξει και έχει κατοχυρωθεί μπορεί να λύσει άλλα προβλήματα, αλλά αυτό είναι αυτό στο οποίο εστιάζουμε αυτή τη στιγμή.
Μπορείτε να συζητήσετε τι είναι το AI-βασισμένο Lightfield Information Suite (ALIS);
ALIS είναι ο κινητήρας πίσω από κάθε προϊόν Fyusion. Επιτρέπει ελαφριά 3D απεικόνιση και βαθιά οπτική κατανόηση. Υπάρχουν τρία μέρη που αποτελούν το ALIS: Capture, Engine και Viewer. Στο模块 Capture, η εφαρμογή για κινητά τηλέφωνα περιέχει ενσωματωμένες οδηγίες και προσαρμόσιμες ροές εργασίας που επιτρέπουν στους χρήστες να καταγράφουν υψηλής ποιότητας 3D εικόνες χρησιμοποιώντας την πλειοψηφία των κινητών τηλεφώνων στην αγορά. Η καταγραφή εικόνων του Fyusion υποστηρίζει επίσης DSLR, drones και eine σειρά από άλλες συσκευές.
Στο δεύτερο βήμα, Engine, το ALIS αναλύει αυτές τις 3D εικόνες και τις μετατρέψει σε ενεργητικά στοιχεία, όπως τα είδη ζημιών που απαιτούνται από τους πελάτες μας. Μπορεί επίσης να παρέχει υποστήριξη για τις ανακαλύψεις του δημιουργώντας υψηλής ανάλυσης 2D εικόνες των ζημιών που βρίσκει.
Τέλος, ο Viewer εμφανίζει το формάτ .fyuse. Το .fyuse είναι κατοχυρωμένο και ελαφρύ, και παρέχει μια εμβυθισμένη 3D εμπειρία με γρήγορη φόρτωση. Μπορούμε να προσθέσουμε όλα τα είδη εμπειριών με ένα .fyuse, συμπεριλαμβανομένων ήχου, βίντεο και φυσικά 2D εικόνων.
Το Fyusion είναι και AR και VR έτοιμο, πόσο μεγάλο πιστεύετε ότι θα είναι αυτές οι εφαρμογές στο μέλλον;
Η αυξημένη πραγματικότητα είναι μια βιομηχανία δισεκατομμυρίων δολαρίων που γίνεται ολοένα και πιο κυρίαρχη, και είναι ακόμη πιο εύκολο να καταγράφονται οι περιβάλλωνες σε 3D χάρη στις ισχυρές νέες κινητές συσκευές και τις χαμηλές καθυστερήσεις δικτύου. Όσο αυτά τα τεχνολογικά μέσα κάνουν την είσοδό τους στην κυρίαρχη αγορά, οι προσδοκίες των πελατών για τις online εμπειρίες θα αυξηθούν τόσο γρήγορα όσο οι δημιουργοί περιεχομένου μπορούν να τις ικανοποιήσουν.
Ιδιαίτερα στην αυτοκινητοβιομηχανία, με την αγορά αυτοκινήτων που γίνεται ολοένα και πιο online, τις επόμενες quelques χρόνια προβλέπουμε μια έξαρση ενδιαφέροντος για AR, VR και 3D λίστες. Ο στόχος είναι να μετατρέψουμε μια απλή σελίδα λεπτομερειών οχήματος (VDP) σε μια σελίδα εμπειρίας οχήματος (VEP), βοηθώντας τόσο τις μεγάλες όσο και τις μικρές αυτοκινητοβιομηχανίες να συνεχίσουν να ευημερούν. Αυτό μπορεί να είναι οτιδήποτε, από την προσθήκη 3D λογότυπων και πλούσιων μεικτών ετικετών στις λίστες, ή την επιτρέψτε στους αγοραστές να τοποθετήσουν εικονικά ένα σετ γκολφ στο πορτμπαγκάζ του αυτοκινήτου για να δουν πώς ταιριάζουν μέσα.
Θα είναι ενδιαφέρον να δούμε πώς αυτού του είδους οι εφαρμογές αρχίζουν να εισέρχονται στην κυρίαρχη χρήση. Δεν πιστεύω ότι θα είναι μια μακρά αναμονή.
Μπορείτε να συζητήσετε τη βελτίωση του ποσοστού κλικ και των εσόδων που παρατηρείται στο ηλεκτρονικό εμπόριο από τη χρήση 3D εικόνων σε σχέση με 2D εικόνες;
Είμαι πιο εξοικειωμένος με τις πωλήσεις αυτοκινήτων στο gros και λιανικό. Οι 3D εικόνες έχουν δημιουργήσει ένα νέο επίπεδο εμπιστοσύνης για τους online αγοραστές, το οποίο είναι ιδιαίτερα κρίσιμο για μεγάλες αγορές όπως τα αυτοκίνητα.
Τα εσωτερικά δεδομένα μας δείχνουν ότι οι 3D εικόνες αυξάνουν την αλληλεπίδραση του χρήστη και τον χρόνο που περνάει στη σελίδα λεπτομερειών του οχήματος, το οποίο με τη σειρά του έχει αποδειχθεί ότι αυξάνει τις πωλήσεις αυτοκινήτων. Η παροχή μιας εικονικής 3D εμπειρίας του οχήματος επίσης χτίζει θετική στάση προς τον πωλητή αυξάνοντας την εμπιστοσύνη.
Μια από τις επιλογές με το Fyusion είναι να επεξεργαστείτε τα δεδομένα τοπικά ή στο cloud, μπορείτε να συζητήσετε τα οφέλη κάθε μιας;
Τοπικά, η edge AI αναγκάζει τους développers να εργαστούν μέσα σε σημαντικές περιορισμοί, ιδιαίτερα για την περίπτωση των κινητών τηλεφώνων. Εκτός από τις τυπικές ανησυχίες για κάθε développer AI—Πόσο βελτιστοποιημένο είναι το δίκτυο; Πόσο αξιόπιστα είναι τα αποτελέσματα;—ορισμένες πρακτικές ανησυχίες ορίζουν σαφείς ορόφους. Πίεση μνήμης, εκφόρτιση μπαταρίας, η πιθανότητα της διαδικασίας σας να γίνει στο υπόβαθρο από τον χρήστη ή το λειτουργικό σύστημα, κ.λπ. Και αυτό υποθέτοντας ότι συγκρίσιμες CPUs και GPUs ήταν διαθέσιμες στην άκρη. Ακόμη και για τα flagship συσκευές, αυτό σπάνια είναι η περίπτωση.
Πρέπει να σχεδιάσετε για κάθε πιθανή περίπτωση; ενώ, στο cloud, κάθε λύση μπορεί να παρακολουθείται και να βελτιστοποιείται.
Αλλά συλλογικά, η edge AI θα μπορούσε να θεωρηθεί η τέλεια “αυτο-κλιμάκωση” λύση: για κάθε νέο χρήστη, έχετε μια ολόκληρη νέα μηχανή στη διάθεσή σας. Αν έχετε βελτιστοποιήσει το δίκτυό σας για να τρέξει εξ ολοκλήρου στην άκρη, μπορείτε να εξυπηρετήσετε δύο, ή δύο εκατομμύρια, πελάτες.
Ενώ το πιο ισχυρό υλικό θα υπάρχει πάντα στο cloud, είναι γενικά αποδεκτό ότι τα δεδομένα είναι ο βασιλιάς. Τα περισσότερα δεδομένα, και η πιο κοντινή σε ακατέργαστο, το καλύτερο. Η AI στην άκρη έχει πρόσβαση σε ακατέργαστα, raw δεδομένα, χωρίς περιορισμούς. Ενώ για μια λύση AI cloud, τα δεδομένα εισόδου πρέπει είτε να επεξεργαστούν (συμπιεσμένα, μερικά) ή τεράστια, στο οποίο σημείο η εύρος ζώνης γίνεται một σοβαρό πρόβλημα.
Επειδή είναι η πιο κοντινή στον χρήστη, η Edge AI ανοίγει μια σειρά από δυνατότητες που η Cloud AI δεν έχει. Αν είναι βελτιστοποιημένη για να τρέξει σε πραγματικό χρόνο, μπορεί να παρέχει ανατροφοδότηση σε πραγματικό χρόνο. Όπως μπορείτε να χτίσετε λύσεις που δεν μόνο καταναλώνουν δεδομένα, αλλά και ενθαρρύνουν τους χρήστες να παρέχουν καλύτερα δεδομένα.
Πώς θα επιτρέψει η 5G τη γρήγορη ανάπτυξη των εφαρμογών της τεχνολογίας υπολογιστικής όρασης;
Σε ταχύτερες ταχύτητες σύνδεσης μπορείτε να μεταφέρετε περισσότερη επεξεργασία στο cloud, το οποίο ανοίγει δυνατότητες για όλους τους τύπους νέων εφαρμογών υπολογιστικής όρασης. Ωστόσο, εξαρτάται πραγματικά από την εφαρμογή και πόσο ευρέως θα υιοθετηθεί.
Η 5G θα μπορούσε να έχει μια θραυσματική επίδραση και να ενισχύσει τον ψηφιακό χάσμα, καθώς ορισμένα μέρη του κόσμου έχουν ταχύτερες και ταχύτερες συνδέσεις ενώ άλλες περιοχές θα συνεχίσουν να έχουν chậmές συνδέσεις. Οι εφαρμογές που επικεντρώνονται σε ανθρώπους με πρόσβαση σε 5G θα ωφεληθούν σαφώς. Αλλά πιο ευρέως αποδεκτές εφαρμογές μπορεί να πρέπει να επιλέξουν ανάμεσα στο να ξοδεύουν χρόνο και χρήματα για αυτό που θα γίνει ουσιαστικά δύο εκδοχές της ίδιας εφαρμογής, ή να μείνουν με μια εκδοχή που είναι λιγότερο robust αλλά μπορεί να τρέξει σχεδόν σε οποιαδήποτε σύνδεση.
Ποια είναι τα βήματα που αναλαμβάνει το Fyusion για να επωφεληθεί από το μελλοντικό rollout της 5G;
Θέλω να προκαταρκτικά πω ότι το Fyusion έχει ξοδεύσει σημαντικό χρόνο για να διασφαλίσει ότι οι πελάτες μπορούν να αποκτήσουν πρόσβαση στις εφαρμογές μας ακόμη και σε παλιά κινητά τηλέφωνα με κακή διαθεσιμότητα ζώνης. Με τον Manheim μόνο η τεχνολογία μας έχει απεικονίσει πάνω από ένα εκατομμύριο αυτοκίνητα, και δεν θα το είχαμε επιτύχει αλλιώς.
Όμως, είμαστε πολύ ενθουσιασμένοι με αυτό που βλέπουμε τώρα–είναι ένα τρίπτυχο αυξανόμενων ταχυτήτων επεξεργασίας, συνδεσιμότητας 5G και τίποτα λιγότερο από μια επανάσταση στις κάμερες κινητών τηλεφώνων. Βάλτε τα όλα μαζί και θα πάρετε κάποια νέα αναπτύξεις που δυστυχώς δεν μπορώ να μοιραστώ μαζί σας ακόμη.
Υπάρχει κάτι άλλο που θα ήθελε να μοιραστεί σχετικά με το Fyusion;
Είναι μια πολύ ενθουσιαστική εποχή για να εργαστείτε στην υπολογιστική όραση–ως एक kỷστημα κινημα ourselves moving στην κυρίαρχη αγορά μετά από πολλά χρόνια να μιλάμε γι’ αυτή ως μια μελλοντική τεχνολογία. Το Fyusion μεγαλώνει γρήγορα και προσλαμβάνουμε επιστήμονες υπολογιστικής όρασης από όλο τον κόσμο. Τα μέλη της ομάδας μας μπορούν να εργαστούν από οπουδήποτε, αλλά είναι πάντα ευπρόσδεκτα στα γραφεία μας στο Potrero Hill.
Ευχαριστώ για τη μεγάλη συνέντευξη, οι αναγνώστες που επιθυμούν να μάθουν περισσότερα πρέπει να επισκεφθούν Fyusion.












