Συνεντεύξεις
Gil Elbaz, Συνιδρυτής & CTO της Datagen – Σειρά Συνεντεύξεων

Ο Gil Elbaz είναι ο CTO και Συνιδρυτής της Datagen, με έδρα την Τελ Αβίβ. Έλαβε το πτυχίο του B.Sc και M.Sc από το Technion. Η διδακτορική του έρευνα επικεντρώθηκε στην 3D Υπολογιστική Όραση και έχει δημοσιευθεί στο CVPR, την κορυφαία διεθνή конференία έρευνας υπολογιστικής όρασης. Η Datagen είναι πιονιέρης στο νέο πεδίο των Προσομοιωμένων Δεδομένων, einem υποσύνολο των συνθετικών δεδομένων, που επικεντρώνεται στην φωτορεαλιστική αναπαράσταση του κόσμου γύρω μας. Η εταιρεία ξεκίνησε από την κρυφότητα με πάνω από 18 εκατομμύρια δολάρια σε χρηματοδότηση τον Μάρτιο του 2021 και τώρα συνεργάζεται με μια σειρά από εταιρείες Fortune 100 στις области επαυξημένης/εικονικής πραγματικότητας, ρομποτικής και αυτοκινητοβιομηχανίας, συμπεριλαμβανομένης της πλειοψηφίας των κορυφαίων εταιρειών τεχνολογίας των ΗΠΑ.
Τι σας έκανε να ενδιαφερθείτε αρχικά για τη ρομποτική και το machine learning;
Τα βιβλία επιστημονικής φαντασίας, όπως η σειρά Foundation του Isaac Asimov και το iRobot, με έκαναν να σκέφτομαι για ένα μέλλον στο οποίο τα ρομπότ θα ήταν αναπόσπαστο μέρος της καθημερινής μας ζωής. Υπάρχουν τόσο πολλές βαρετές, επαναλαμβανόμενες εργασίες που κάνουν οι άνθρωποι· ήξερα ότι δεν ήθελα να τις κάνω, και δεν μπορούσα να φανταστώ κανέναν άλλον να τις θέλει. Λαμβάνοντας υπόψη ότι η ρομποτική είναι μια τεχνολογική αναγκαιότητα, σκέφτηκα ότι η κατεύθυνση προς αυτή την κατεύθυνση θα ήταν một έξυπνη, «απρόσβλητη» επαγγελματική απόφαση.
Έτσι, αρχικά προσεγγίσα την περιοχή με επίκεντρο τα φυσικά аспектs του αντικειμένου, και έλαβα το πτυχίο μου στη Μηχανολογία από το Technion στη Χάιφα, στο Ισραήλ. προς το τέλος του πτυχίου μου, άρχισα να εμβαθύνω στον κόσμο των εργαλείων CAD και των ικανοτήτων. Αυτά τα εργαλεία επιτρέπουν στους μηχανολόγους μηχανικούς να σχεδιάζουν δομές και μηχανικές συσκευές (οτιδήποτε από μια γέφυρα μέχρι ένα αυτοκίνητο). Είδα μια τεράστια ευκαιρία να κάνω μια μεγάλη επίδραση χωρίς να αντιμετωπίσω τις αργές επαναλήψεις του φυσικού κόσμου. Σε πρακτική, αυτά τα προγράμματα είχαν πολύ λίγη, αν όχι καθόλου, ικανότητες μηχανικής μάθησης/υπολογιστικής όρασης που ολοκληρώθηκαν, που βοηθούσαν τους μηχανικούς να δημιουργούν απλούστερες, φθηνότερες και πιο σταθερές μηχανικές συστήματα (αυτό ήταν το 2015). Ξεκίνησα στην κατεύθυνση της Υπολογιστικής Όρασης σε 3D δεδομένα με βαθιά μάθηση (πολύ καινούργια τότε) με στόχο να κάνω έξυπνα προγράμματα CAD. Η εργασία στις πρώτες μέρες της σύγχρονης βαθιάς μάθησης, ένιωθα σαν να ήμουν μέρος κάτι που θα μπορούσε να είναι πραγματικά μεγάλο — παρόμοιο με το διαδίκτυο.
Στην πράξη, η έρευνά μου ήταν η πρώτη που έφερε την επανάσταση του Deep Learning στο τμήμα μας στο Technion. Αυτό αργότερα μετατράπηκε σε ένα έγγραφο που έγινε δεκτό στο κορυφαίο συνέδριο Υπολογιστικής Όρασης στον κόσμο, CVPR, και πέταξα στο Χονολουλού στο CVPR 2017. Η παρουσίαση της εργασίας μου και η συνάντηση με τους ανθρώπους άνοιξαν τα μάτια μου στο μέγεθος της κοινότητας υπολογιστικής όρασης (η οποία σήμερα είναι τουλάχιστον 10 φορές μεγαλύτερη), χιλιάδες συμμετέχοντες που εργάζονται με πάθος στην έρευνα του πεδίου. Αυτό το γεγονός σχεδόν σφράγισε την κατεύθυνσή μου, δείχνοντας μου την δύναμη της υπολογιστικής όρασης και το δυναμικό που περιμένει να απελευθερωθεί.
Μπορείτε να μοιραστείτε την ιστορία της γέννησης της Datagen;
Η Datagen ιδρύθηκε το 2018 με αποστολή να μεταμορφώσει τον τρόπο με τον οποίο οι ομάδες λαμβάνουν τα δεδομένα τους για την εκπαίδευση δικτύων υπολογιστικής όρασης. Το προηγούμενο έτος, είδαμε μια επίδειξη του Oculus Rift, η οποία αποτελούνταν από ένα headset εικονικής πραγματικότητας και μια συσκευή χειροκίνητου ελέγχου. Μετά την επίδειξη, βρεθήκαμε να σκεφτόμαστε, «με τις sophistikated κάμερες που είναι ενσωματωμένες στο headset, γιατί χρειαζόταν μια χειροκίνητη συσκευή για να συνδέσει τον εικονικό χώρο με τον φυσικό χώρο (δηλ. να παρακολουθήσει την κίνηση του χεριού);» Τα νευρωνικά δίκτυα ήταν ήδη αρκετά sophistikated για να το χειριστούν, οπότε ποιο ήταν το πρόβλημα;» Και εκείνη τη στιγμή η λάμπα άναψε — Δεδομένα! Αμέσως είδαμε την τεράστια ευκαιρία να λύσουμε προκλήσεις 3D χωρικής παρουσίας χρησιμοποιώντας προηγμένη υπολογιστική όραση και 3D μεταδεδομένα. Αντί να επικεντρωθούμε αποκλειστικά στην εικονική/αυξημένη πραγματικότητα, παίρναμε μια πιο ολιστική προσέγγιση, επικεντρωμένη στο φαινομενικά αδιάλυτο πρόβλημα της δημιουργίας επαρκών (και ακριβών) δεδομένων εκπαίδευσης για να ενεργοποιήσουμε πραγματικές εφαρμογές 3D AI.
Με επίκεντρο τους ανθρώπους και την αλληλεπίδραση του ανθρώπου με το περιβάλλον, η Datagen είναι πιονιέρης στο νέο πεδίο των Προσομοιωμένων Δεδομένων, einem υποσύνολου των συνθετικών δεδομένων, που επικεντρώνεται στην φωτορεαλιστική αναπαράσταση του κόσμου γύρω μας. Σήμερα, συνεργαζόμαστε με τις πιο καινοτόμες εταιρείες στον κόσμο για να τροφοδοτήσουμε και να επιταχύνουμε την ανάπτυξη υπολογιστικής όρασης και υποστηρίζεται από alguns από τους πιο σεβαστούς επενδυτές στον χώρο.
Για τους αναγνώστες που δεν είναι εξοικειωμένοι, μπορείτε να εξηγήσετε τι είναι συγκεκριμένα τα συνθετικά δεδομένα;
Τα συνθετικά δεδομένα είναι οποιοδήποτε δεδομένο εκπαίδευσης που – αντί να συλλέγεται μέσω άμεσης μέτρησης ή παρατήρησης του πραγματικού κόσμου – δημιουργείται είτε αλγοριθμικά είτε μέσω προσομοίωσης. Στο контέκστ της υπολογιστικής όρασης, τα συνθετικά δεδομένα είναι υπολογιστικά δημιουργημένες εικόνες με συσχετιζόμενα μεταδεδομένα που απαιτούνται για την εκπαίδευση τεχνητής νοημοσύνης. Με προβλήματα ιδιωτικότητας και πολύ πραγματικές φυσικές και οικονομικές περιορισμούς στα δεδομένα του πραγματικού κόσμου, είναι δύσκολο να υπερβολήσει τη σημασία των συνθετικών δεδομένων για τη μηχανική μάθηση και την τεχνητή νοημοσύνη. Σε μια πρόσφατη αναφορά, Gartner προέβλεψε ότι, μέχρι το 2024, το μεγαλύτερο μέρος των δεδομένων που θα χρησιμοποιηθούν στον τομέα της τεχνητής νοημοσύνης θα είναι τεχνητά δημιουργημένα για αυτούς τους λόγους.
Τι είναι κάποια από τα πλεονεκτήματα των συνθετικών δεδομένων σε σύγκριση με τη χειροκίνητη συλλογή δεδομένων;
Η σύντομη απάντηση είναι, σκεφτείτε κάθε аспект της χειροκίνητης συλλογής δεδομένων που είναι ακατάλληλος και αφαιρέστε τους από τη διαδικασία — αυτά είναι τα πλεονεκτήματα των συνθετικών δεδομένων.
Η δημιουργία ποικιλόμορφων συνόλων δεδομένων σε κλίμακα για την εκπαίδευση υπολογιστικής όρασης είναι một δαπανηρή, χρονοβόρα διαδικασία, και η παραλλακτικότητα είναι πολύ περιορισμένη από το γεγονός ότι η τοποθέτηση ανθρώπων σε συγκεκριμένες τοποθεσίες και φωτογράφισή τους είναι μια περίπλοκη διαδικασία — πολύ πιο περίπλοκη και δαπανηρή από το να το κάνετε σε ένα προσομοιωμένο περιβάλλον. Ένα άλλο σημαντικό πλεονέκτημα είναι η αποτελεσματική εξάλειψη της ανάγκης για χειροκίνητη αναnotation, η οποία είναι βαρετή, χρονοβόρα και ευάλωτη σε ανθρώπινα λάθη.
Η Datagen αναφέρεται στα προσομοιωμένα δεδομένα ως υποσύνολο των συνθετικών δεδομένων. Μπορείτε να εξηγήσετε τι είναι τα προσομοιωμένα δεδομένα;
Τα προσομοιωμένα δεδομένα είναι συνθετικά δεδομένα που δημιουργούνται μέσω προσομοίωσης. Χρησιμοποιούμε GANs (以及 einige άλλες προηγμένες μεθόδους μηχανικής μάθησης) για να δημιουργήσουμε 3-Δ αντικείμενα και να τα τοποθετήσουμε σε πολύ πραγματικές 3-Δ προσομοιώσεις του πραγματικού κόσμου. Αυτό που μοιάζει είναι μια διαδικασία «εικονικής λήψης φωτογραφιών» από πρώτο πρόσωπο, αλλά λειτουργώντας σε ένα φωτορεαλιστικό, φυσικά-βασισμένο σύστημα. Αυτές οι προσομοιώσεις παράγουν οπτικά δεδομένα (όπως αν είχαν συλλεγεί στον πραγματικό κόσμο), μαζί με μια πλήρη σειρά αναnotation (φυσικής, φωτισμού, κ.λπ.). Οπότε, τα Προσομοιωμένα Δεδομένα είναι συνθετικά δεδομένα που είναι φωτορεαλιστικά, контекστουαλικά δημιουργημένα, 3-Δ εικόνες, συλλεγμένα σε ένα προσομοιωμένο περιβάλλον.
Πώς η Datagen δημιουργεί προσομοιωμένα δεδομένα που είναι προσαρμοσμένα;
Η τεχνολογία της Datagen δημιουργεί προσομοιωμένα δεδομένα που είναι και έτοιμα για κλίμακα και προσαρμοσμένα για να αντιμετωπίσουν τις μοναδικές ανάγκες κάθε πελάτη. Κάνουμε αυτό λαμβάνοντας υπόψη κάθε аспект κάθε έργου — από το σύστημα υπολογιστικής όρασης που χρησιμοποιείται μέχρι τη δημογραφική σύνθεση της περιοχής στην οποία θα λειτουργήσει. Όταν εργαζόμαστε trực tiếp με τους πελάτες μας, ή απλά ενεργοποιούμε τους μηχανικούς τους, η διαδικασία της Datagen αρχίζει με την καθοδήγηση των κλειδιών παραμέτρων για κάθε συγκεκριμένη περίπτωση χρήσης, όπως οι προδιαγραφές του φακού, ο φωτισμός, το περιβάλλον, η δημογραφική κατανομή, κ.λπ. Η Datagen χρησιμοποιεί GANs και άλλες προηγμένες εργαλεία και τεχνικές για να δημιουργήσει μια τεράστια ποικιλία από στοιχεία, συμπεριλαμβανομένων οτιδήποτε από ανθρώπινες κεφαλές με δυναμικές εκφράσεις προσώπου για να εκπαιδεύσει την τεχνητή νοημοσύνη στην ανάλυση συναισθημάτων, μέχρι εσωτερικούς χώρους οχημάτων για την παρακολούθηση επιβατών και οικιακούς χώρους για εφαρμογές τηλεδιάσκεψης, μόνο για να αναφέρω quelques. Για κάθε τύπο στοιχείου, η Datagen εισάγει παραλλακτικότητα σε αμέτρητους διακριτούς άξονες (από το χρώμα του δέρματος και το ύψος των φρυδιών, μέχρι το μέγεθος, το χρώμα και το σχήμα των οικιακών επίπλων), χρησιμοποιώντας παραμέτρους που είναι συντονισμένες για να αντανακλούν την συγκεκριμένη εφαρμογή στο χέρι.
Χάρη σε αυτές τις ικανότητες, τα σύνολα δεδομένων της Datagen δεν είναι μόνο μεγάλα και πολύ ποικιλόμορφα, αλλά και βελτιστοποιημένα για τους σκοπούς της εκπαίδευσης ενός μοναδικού συστήματος για να εκτελέσει μια μοναδική εργασία (ή σειρά εργασιών) στο μοναδικό περιβάλλον ή τοποθεσία όπου θα λειτουργήσει — όλα χωρίς να συμβιβαστούν με την ικανότητα κλίμακας. Επίσης, λαμβάνουμε υπόψη τις συγκεκριμένες απαιτήσεις αναnotation/μεταδεδομένων κάθε εφαρμογής.
Τι είναι κάποια παραδείγματα λύσεων στη ρομποτική όπου χρησιμοποιούνται συνθετικά και/ή προσομοιωμένα δεδομένα;
Ένα από τα μεγαλύτερα πλεονεκτήματα της χρήσης προσομοιωμένων δεδομένων στη ρομποτική είναι η ικανότητα να δημιουργηθούν εικόνες του υλικού που είναι ακόμη σε εξέλιξη. Έτσι, το «εγκέφαλος» του ρομπότ (ΑΙ) και το «σώμα» (υλικό) μπορούν να αναπτυχθούν παράλληλα. Τώρα, η εκπαίδευση μπορεί να εξελιχθεί καθώς οι προδιαγραφές εξελίσσονται, αντί να περιμένουμε μέχρι το τελικό προϊόν να είναι πλήρως πρωτοτυπωμένο πριν μπορούμε να拍 φωτογραφίες του και να αρχίσουμε την ανάπτυξη της ΑΙ.
Επίσης, επειδή τα προσομοιωμένα δεδομένα δημιουργούνται σε контέκστ, μπορείτε να λάβετε υπόψη την αλληλεπίδραση μεταξύ του ρομπότ και του περιβάλλοντος του με μεγαλύτερη ευκολία. Έτσι, αν φανταστείτε ένα ρομπότ που πιάνει και αφαιρεί ελαττωματικά προϊόντα από μια γραμμή συναρμολόγησης, τα προσομοιωμένα δεδομένα θα σας επτρέψουν να δημιουργήσετε δεδομένα για κάθε φυσικό ελάττωμα που είναι δυνατό στο προϊόν, καθώς και από την οπτική γωνία του ρομπότ για να καταγράψετε την πλήρη κίνηση του ρομποτικού βραχίονα. Τι περισσότερο, τα 3D μεταδεδομένα σημαίνουν ότι δεν υπάρχει ανάγκη για χρονοβόρα αναnotation εικόνων για να διασφαλίσετε ότι το ρομπότ μπορεί να αναγνωρίσει σωστά το προϊόν, τα ελαττώματα, το βραχίονα του, ή οτιδήποτε άλλο στο πεδίο όρασής του.
Τι είναι κάποια παραδείγματα χρήσεων προσομοιωμένων δεδομένων σε έξυπνα αυτοκίνητα;
Τα προσομοιωμένα δεδομένα στην ανάπτυξη έξυπνων αυτοκινήτων κάνουν πολύ πιο εύκολη την ανάπτυξη συνόλων δεδομένων για συγκεκριμένα μοντέλα αυτοκινήτων καθώς σχεδιάζονται, επαναλαμβάνοντας σε συμφωνία με το αυτοκίνητο καθώς προχωράει через τις διάφορες φάσεις του σχεδιασμού και της παραγωγής. Με τα προσομοιωμένα δεδομένα εικόνας, οι μηχανικοί μπορούν επίσης να χρησιμοποιήσουν την όραση μέσα στο αυτοκίνητο πιο αποτελεσματικά για να αναγνωρίσουν τους νυσταγμένους ή αποσπασμένους οδηγούς, αν ο οδηγός έχει αφαιρέσει το χέρι του από το τιμόνι, ή οποιονδήποτε άλλο τύπο περιπτώσεων για να λογαριαστούν για την ασφάλεια του οδηγού. Επίσης, επιτρέπει στους μηχανικούς να λογαριαστούν για μεγαλύτερη ποικιλία στους οδηγούς και τους επιβάτες, και να εισαγάγουν παραλλακτικότητα στη μορφή της γωνίας εικόνας και του φωτισμού — όλα χωρίς να παραβιάζουν την ιδιωτικότητα των πραγματικών ανθρώπων.
Πρόσφατα, η Datagen ανακοίνωσε μια μεγάλη σειρά από ενθουσιαστικές νέες προσλήψεις, τι σημαίνει αυτό για το μέλλον της εταιρείας;
Οι πρόσφατες προσθήκες στο συμβουλευτικό μας συμβούλιο και την ηγετική μας ομάδα περιλαμβάνουν alcuni από τους πιο έξυπνους, καταξιωμένους επαγγελματίες στον τομέα της τεχνητής νοημοσύνης και της υπολογιστικής όρασης. Η γνώση, η εικόνα και η εμπειρία τους θα βοηθήσουν να προσανατολίσουν και να επιταχύνουν την ανάπτυξη της Datagen καθώς διανύουμε einen τομέα που είναι ακόμη νέος και γεμάτος ευκαιρίες. Σε einen τομέα με τόσο πολλές απροσδιόριστες, τίποτα δεν είναι πιο πολύτιμο από τη γνώση.
Υπάρχει κάτι άλλο που θα ήθελε να μοιραστεί σχετικά με την Datagen;
Βασισμένη στην Τελ Αβίβ, η Datagen είναι μέρος μιας πολύ μεγαλύτερης οικονομικής και πολιτιστικής μετατόπισης που έχει λάβει χώρα στο Ισραήλ, και είμαστε υπερήφανοι που είμαστε μέρος αυτής. Σε σύντομο χρονικό διάστημα, το Ισραήλ (η Τελ Αβίβ συγκεκριμένα), έχει εξελιχθεί σε einen σημαντικό παγκόσμιο τεχνολογικό κόμβο, με einen ευημερούσα=startup οικοσύστημα και einen ενεργητικό επενδυτικό κοινότητα. Αν και το Ισραήλ συχνά θεωρείται ως ένας τεχνολογικός κόμβος που επικεντρώνεται στην κυβερνοασφάλεια, η τεχνολογία AI και δεδομένων έχει αυξηθεί εκθετικά τα τελευταία χρόνια εδώ. Σήμερα, υπάρχουν περισσότερες από 680 εταιρείες τεχνητής νοημοσύνης στο Ισραήλ, οι οποίες έχουν συλλέξει коллекτικά 4,5 δισεκατομμύρια δολάρια. Αυτή η εκρηκτική ανάπτυξη τα τελευταία δύο χρόνια οφείλεται σε μεγάλο βαθμό στην υψηλή συγκέντρωση μηχανικών και στα παγκοσμίου επιπέδου πανεπιστήμια του Ισραήλ. Αυτά τα ακαδημαϊκά ιδρύματα παρέχουν πρόσβαση σε ταλαντούχους και στην τελευταία τεχνολογία ανάπτυξης στον τομέα. Τα τελευταία δύο μήνες, η Datagen έχει προσλάβει περισσότερους από 20 υπαλλήλους και σχεδιάζει να προσλάβει επιπλέον μέλη της ομάδας σε πωλήσεις και μάρκετινγκ, λογισμικό και DevOps, και τμήματα προϊόντων.
Ευχαριστώ για τη μεγάλη συνέντευξη, οι αναγνώστες που επιθυμούν να μάθουν περισσότερα πρέπει να επισκεφθούν την Datagen.












