Connect with us

Sohaib Khan, Συνιδρυτής & Διευθύνων Σύμβουλος της Hazen.ai – Σειρά Συνεντεύξεων

Συνεντεύξεις

Sohaib Khan, Συνιδρυτής & Διευθύνων Σύμβουλος της Hazen.ai – Σειρά Συνεντεύξεων

mm

Ο Sohaib Khan, είναι ο Συνιδρυτής & Διευθύνων Σύμβουλος της Hazen.ai, μια εταιρεία που χρησιμοποιεί υπολογιστική όραση και βαθιά μάθηση για να σχεδιάσει έξυπνο λογισμικό ανάλυσης κυκλοφορίας που έχει σχεδιαστεί για να «κατανοήσει» την κίνηση κάθε οχήματος.

Τι σας έκανε να ενδιαφερθείτε αρχικά στο πεδίο της Τεχνητής Νοημοσύνης;

Ήταν κατά τη διάρκεια των προπτυχιακών σπουδών που διάβασα για πρώτη φορά πώς λειτουργεί η στερεο-όραση (ή διπλή όραση – εκτίμηση βάθους από δύο κάμερες). Αυτό με έκανε να ενδιαφερθώ να εξερευνήσω περισσότερο την υπολογιστική όραση. Ενδιαφέρον είναι ότι διάβασα γι’ αυτό σε ένα βιβλίο που το πήρα από μια παραδοσιακή αγορά της Παρασκευής όπου πουλούσαν παλιά użyμένα βιβλία σε einen δρόμο στην πόλη μας. Συνέχισα να κάνω διδακτορικό σε αυτό το πεδίο από τις ΗΠΑ.

Προηγουμένως ήσαστε καθηγητής σε ένα από τα μεγαλύτερα πανεπιστήμια του Πακιστάν, το Lahore University of Management Sciences (LUMS). Ποια ήταν τα ενδιαφέροντά σας για τη διδασκαλία και την έρευνα;

Όταν εντάχθηκα στο LUMS μετά το διδακτορικό μου, δημιούργησα το πρώτο εργαστήριο ερευνών μεταπτυχιακών στο πανεπιστήμιο, με χρηματοδότηση που έλαβα από một μεγάλη χορηγία από một αμυντικό οργανισμό. Το πρόγραμμα μεταπτυχιακών σπουδών στην Πληροφορική ήταν πολύ νέο και δεν υπήρχαν εργαστήρια ερευνών εκείνη την εποχή. Δίδαξα Υπολογιστική Όραση για 12+ χρόνια στο LUMS και είχα ένα ενεργό εργαστήριο σε αυτό το πεδίο. Στο ξεκίνημα, η υπολογιστική όραση δίδασκε σπάνια σε οποιοδήποτε πανεπιστήμιο του Πακιστάν, αλλά αργότερα, έγινε ένα τυποποιημένο μάθημα και στην πραγματικότητα, πολλοί από τους φοιτητές μου διδάσκουν τώρα επίσης σε πανεπιστήμια του Πακιστάν.

Μπορείτε να συζητήσετε τι σας ενέπνευσε να εκκινήσετε μια εταιρεία που ειδικεύεται σε υπολογιστική όραση και αλγόριθμους βαθιάς μάθησης για ανάλυση βίντεο;

Η Υπολογιστική Όραση, για πολύ καιρό, ήταν σε μεγάλο βαθμό ένα πειραματικό ερευνητικό πεδίο, με περιορισμένες εφαρμογές σε προϊόντα. Αυτό οφειλόταν κυρίως στο ότι η ωριμότητα των αλγορίθμων που χρειάζονταν για την κατασκευή προϊόντων δεν ήταν εκεί. Για ένα προϊόν, ο αλγόριθμος κατανόησης εικόνας πρέπει να λειτουργεί σε eine ποικιλία συνθηκών εικόνας και φωτισμού και όχι μόνο σε κάποιες πολύ ελεγχόμενες πειραματικές συνθήκες. Έχαμε ένα αστείο μεταξύ των μεταπτυχιακών φοιτητών στο εργαστήριό μας όταν έκανα το διδακτορικό μου το 2000, ότι αν μπορείτε να βρείτε τρεις εικόνες στις οποίες ο αλγόριθμος σας λειτουργεί, μπορείτε να γράψετε μια εργασία. Αν λειτουργεί σε τρεις βίντεο, παίρνετε μια πολύ καλή εργασία! Το σημείο είναι ότι πολλοί αλγόριθμοι όρασης λειτουργούσαν μόνο σε προσεκτικά επιλεγμένες εργαστηριακές συνθήκες και δεν ήταν πολύ robust.

Αλλά τώρα τα πράγματα έχουν αλλάξει. Με την έλευση της βαθιάς μάθησης το 2012, έχουμε δει κάποια πολύ γρήγορη και fascinující πρόοδο στην κατανόηση εικόνας. Όταν είδαμε ότι, αισθανθήκαμε ότι τώρα η κατάλληλη στιγμή είναι ίσως να κατασκευάσουμε στερεά προϊόντα που μπορούν να έχουν σημαντική επίδραση.

Τι τύπος παραβάσεων κυκλοφορίας μπορεί να παρακολουθήσει η Hazen.ai;

Ο στόχος μας είναι να μπορέσουμε να αναγνωρίσουμε όλους τους τύπους επικίνδυνης οδηγικής συμπεριφοράς στους δρόμους. Αυτό οδηγείται από τον υπέρτατο στόχο μας να μειώσουμε τους θανάτους στους δρόμους. Κάθε 24 δευτερόλεπτα, κάποιος πεθαίνει σε einen τροχαίο ατύχημα, που ισοδυναμεί με περίπου 15 787-8 Dreamliners που συντρίβονται κάθε μέρα! Έτσι αυτό είναι πραγματικά αυτό που μας мотивίζει. Για αυτό το λόγο κατασκευάζουμε λογισμικό που μπορεί να ανιχνεύσει διαφορετικούς τύπους επικίνδυνων και ασφαλών συμπεριφορών, όπως ασφαλείς αλλαγές λωρίδας, παράνομες στροφές, υπέρβαση κόκκινου φαναρίου ή σήματος στάσης, блокάρισμα πεζοδρομίου, μη φοίτηση ζωνηού ασφαλείας ή στέλνω μηνύματα-ενώ-οδηγώ. Εργαζόμαστε επίσης για να κατασκευάσουμε χαρακτηριστικά στο λογισμικό μας ειδικά για την ασφάλεια πεζών και ποδηλατών, επειδή περισσότερο από το μισό των θανάτων σε τροχαία ατυχήματα συμβαίνουν στο τμήμα ευάλωτων χρηστών του δρόμου των πεζών, ποδηλατών και μοτοσικλετιστών.

Τι είναι κάποιοι από τους μοναδικούς προκλήσεις πίσω από τη χρήση υπολογιστικής όρασης για να παρακολουθήσετε αντικείμενα που κινούνται σε τέτοια υψηλές ταχύτητες;

Υπάρχουν δύο τύποι προκλήσεων: Πρώτα είναι η απόδοση των αλγορίθμων υπολογιστικής όρασης – θέλετε να έχετε ένα προϊόν που μπορεί να λειτουργήσει σε προκλητικές συνθήκες κυκλοφορίας 24/7 σε όλες τις παραλλαγές φωτισμού. Ενώ έχει υπάρξει πολλή πρόοδος τεχνικά προς αυτό το στόχο, υπάρχουν ακόμη χώρες στις οποίες η πυκνότητα των χρηστών του δρόμου είναι τόσο υψηλή, όπως συστάδες μοτοσικλετών ή πεζών σε πολύ κοντινή απόσταση, που είναι ακόμη προκλητικό για τους αλγόριθμους να παρακολουθήσουν τους ατομικά και να κατανοήσουν την σκηνή. Αλλά δεύτερον, μια μεγαλύτερη πρόκληση είναι να κατασκευάσετε ένα στερεό προϊόν από αλγόριθμους υπολογιστικής όρασης, που μπορεί να αναπτυχθεί σε περιορισμένα υλικά πόρους στο άκρο, και μπορεί να παρακολουθηθεί και να διαχειριστεί εύκολα παρά την κατανομή σε όλη την πόλη. Καθώς τα προϊόντα υπολογιστικής όρασης χειρίζονται πολλά δεδομένα βίντεο, η ανάπτυξή τους στο άκρο, ως ένα συσκευή IoT, και η διαχείριση τους αποτελεσματικά, παραμένει eine δύσκολη εργασία.

Τι είναι η διαδικασία για τον τελικό χρήστη να ρυθμίσει το λογισμικό σε διαφορετικές διαμορφώσεις δρόμου;

Κάθε διασταύρωση παρέχει μια μοναδική σκηνή, όσον αφορά τον όγκο κυκλοφορίας, τη διαμόρφωση λωρίδας και τον τύπο οχήματος, ποδηλάτων ή αλληλεπιδράσεων πεζών. Επιπλέον, το ενδιαφέρον των διαχειριστών κυκλοφορίας μπορεί να είναι συγκεκριμένο, να αναγνωρίσουν einen συγκεκριμένο τύπο κυκλοφοριακής συμπεριφοράς σε κάθε σημείο. Για παράδειγμα, η αστυνομία κυκλοφορίας μπορεί να απαγορεύσει μια στροφή σε μια διασταύρωση για να λειάνσει την κυκλοφορία και ενδιαφέρεται να αναγνωρίσει αυτή τη στατιστική. Για αυτό το λόγο έχουμε giữ το λογισμικό μας ρυθμίσιμο σε διαφορετικές σκηνές. Όταν μια κάμερα ρυθμίζεται με το λογισμικό μας, τη ρυθμίζουμε μέσω μιας απλής διαδικασίας για ότι απαιτεί ο τελικός χρήστης σε αυτό το σημείο. Εσωτερικά, έχουμε κατασκευάσει μια υψηλού επιπέδου γλώσσα με την οποία μπορούμε να περιγράψουμε συμπυκνωμένα σκηνές κυκλοφορίας ενδιαφέροντος με έναν απλό τρόπο. Αυτό μας επιτρέπει να ρυθμίσουμε γρήγορα ένα σημείο για τους πελάτες μας.

Τι τύπος υλικού χρειάζεται για να λειτουργήσει αυτό το σύστημα;

Η ανάλυση βίντεο απαιτεί σημαντική υπολογιστική ισχύ. Έχουμε βελτιώσει τον κώδικά μας για να τρέξει σε μικρότερες Nvidia GPUs που μπορούν να αναπτυχθούν στο άκρο, όπως η σειρά Jetson, και επίσης σε Intel CPUs για ορισμένα χαρακτηριστικά που προσφέρουμε. Τα τελευταία χρόνια, πιο ισχυρό υλικό άκρου γίνεται διαθέσιμο σε ένα λογικό κόστος,所以 αυτό πραγματικά οδηγεί πολλές ενθουσιαστικές εφαρμογές.

Μπορείτε να συζητήσετε αν κάποιες δικαιοδοσίες είναι τώρα σε δοκιμές ή χρησιμοποιούν την τεχνολογία Hazen.ai;

Τώρα έχουμε συνεχιζόμενες δοκιμές σε πολλές χώρες, Ηνωμένο Βασίλειο, ΗΠΑ, Αίγυπτο, Σαουδική Αραβία, Πακιστάν, Ομάν, Περού και εμπλέκουμε πελάτες σε άλλες χώρες επίσης.

Υπάρχει κάτι άλλο που θα ήθελε να μοιραστεί σχετικά με την Hazen.ai;

Συνολικά, αισθανόμαστε ότι οι τεχνολογίες ασφάλειας κυκλοφορίας δεν έχουν προχωρήσει αρκετά, σε σύγκριση με το μέγεθος του προβλήματος. Ωστόσο, τώρα η κατάλληλη στιγμή είναι σωστή, λόγω της ταχείας πρόοδου στην υπολογιστική όραση και τη βαθιά μάθηση, καθώς και της φθηνής διαθεσιμότητας κάμερων και υλικού υπολογισμού. Θα δούμε πολλές περισσότερες εφαρμογές της υπολογιστικής όρασης στο άκρο τα επόμενα χρόνια. Αυτά είναι τα βασικά που οδηγούν την Hazen.ai.

Ευχαριστώ για τη συνέντευξη, οι αναγνώστες που επιθυμούν να μάθουν περισσότερα πρέπει να επισκεφθούν Hazen.ai

Ο Antoine είναι ένας οραματιστής ηγέτης και συνιδρυτής του Unite.AI, οδηγείται από μια αμετάβλητη страсть για το σχήμα και την προώθηση του μέλλοντος του AI και της ρομποτικής. Ένας σειριακός επιχειρηματίας, πιστεύει ότι το AI θα είναι τόσο διαταρακτικό για την κοινωνία όσο η ηλεκτρική ενέργεια, και συχνά πιάνεται να μιλάει για το δυναμικό των διαταρακτικών τεχνολογιών και του AGI.

Ως futurist, είναι αφοσιωμένος στο να εξερευνήσει πώς αυτές οι καινοτομίες θα σχήματίσουν τον κόσμο μας. Επιπλέον, είναι ο ιδρυτής του Securities.io, μια πλατφόρμα που επικεντρώνεται στις επενδύσεις σε τεχνολογίες που αναedefinουν το μέλλον και ανασχήματίσουν ολόκληρους τομείς.