στέλεχος Tyler Weitzman, Συνιδρυτής & Επικεφαλής του AI στο Speechify - Σειρά Συνεντεύξεων - Unite.AI
Συνδεθείτε μαζί μας

συνεντεύξεις

Tyler Weitzman, συνιδρυτής και επικεφαλής του AI στο Speechify – Σειρά Συνεντεύξεων

mm
Ενημερώθηκε on

Ο Tyler Weitzman είναι ο συνιδρυτής, επικεφαλής της τεχνητής νοημοσύνης και πρόεδρος στο Δημηγορώ, η #1 εφαρμογή μετατροπής κειμένου σε ομιλία στον κόσμο, με συνολικά πάνω από 100,000 κριτικές 5 αστέρων. Ο Weitzman είναι απόφοιτος του Πανεπιστημίου του Στάνφορντ, όπου έλαβε πτυχίο στα μαθηματικά και MS στην Επιστήμη Υπολογιστών στο κομμάτι της Τεχνητής Νοημοσύνης. Έχει επιλεγεί από το Inc. Magazine ως Top 50 Entrepreneur και έχει παρουσιαστεί στα Business Insider, TechCrunch, LifeHacker, CBS, μεταξύ άλλων εκδόσεων. Η έρευνα για το μεταπτυχιακό του Weitzman επικεντρώθηκε στην τεχνητή νοημοσύνη και τη μετατροπή κειμένου σε ομιλία, όπου η τελευταία του εργασία είχε τίτλο: "CloneBot: Personalized Dialogue-Response Predictions".

Ξεκινήσατε την κωδικοποίηση όταν ήσασταν μόλις 9 ετών, τι σας τράβηξε αρχικά στην επιστήμη των υπολογιστών;

Ήμουν αρκετά εμμονή ως παιδί με το Dragon Ball Z και ήθελα να μάθω να εμψυχώνω τον εαυτό μου. Έμαθα το Adobe Flash και το Photoshop και έβαλα τα δικά μου κινούμενα σχέδια του Goku σε μια ιστοσελίδα θαυμαστών που έφτιαξα. Ήταν λίγο αφότου άρχισα να μαθαίνω για συστήματα και αλγόριθμους, και όταν έμαθα ότι μπορούσα να προγραμματίσω για να ζήσω που ήταν αρκετά συναρπαστικό. Νόμιζα ότι ήταν απλώς ένα χόμπι σαν να παίζω παιχνίδια.

Τότε ξεκινήσατε να δημιουργείτε εφαρμογές για iPhone όταν ήσασταν μόλις 12 ετών, ποιες ήταν μερικές από αυτές τις εφαρμογές;

Μια εφαρμογή ονομάζεται Black SMS και επιτρέπει στους χρήστες να στέλνουν κρυπτογραφημένα μηνύματα κειμένου μεταξύ τους. Μια άλλη εφαρμογή ονομαζόταν Frontback που επιτρέπει στους χρήστες να βγάζουν selfies και φωτογραφίες από ό,τι είναι μπροστά τους την ίδια ακριβώς στιγμή.

Θα μπορούσατε να συζητήσετε την έρευνά σας στο Πανεπιστήμιο του Στάνφορντ και πώς επικεντρώθηκε στην επεξεργασία φυσικής γλώσσας και τη σύνθεση ομιλίας;

Η έρευνά μου αφορούσε πολλαπλές χρήσεις για δίκτυα μετασχηματιστών, συμπεριλαμβανομένων μοντέλων δημιουργίας γλώσσας για συνομιλία, επισήμανση μέρους του λόγου, πρόβλεψη σημείων στίξης και μετατροπή κειμένου σε ομιλία. Η βελτιστοποίηση συμπερασμάτων νευρωνικών δικτύων για φορητές CPU ήταν η κύρια εστίαση και αυτό μεταφράστηκε απευθείας στις φωνές εκτός σύνδεσης που είναι διαθέσιμες στο Speechify, οι οποίες λειτουργούν ακόμη και σε λειτουργία πτήσης.

Θα μπορούσατε να μοιραστείτε την ιστορία γένεσης πίσω από το Speechify;

Είμαι τυφλός στο ένα μάτι και ο αδελφός μου ο Κλιφ είναι δυσλεκτικός. Χρησιμοποιήσαμε ηχητικά βιβλία και τεχνολογία ήχου κειμένου σε ομιλία για όσο διάστημα θυμόμαστε για να περάσουμε το σχολείο και όταν ήμασταν μικροί για την ανάγνωση βιβλίων όπως ο Χάρι Πότερ. Καθώς μεγαλώναμε και αρχίσαμε να χρησιμοποιούμε περισσότερα προϊόντα τεχνολογίας, αρχίσαμε να συνειδητοποιούμε ότι υπήρχε μια ευκαιρία να δημιουργήσουμε καλύτερες εφαρμογές κειμένου σε ομιλία στον ιστό και στα κινητά με καλύτερες φωνές χάρη στις εξελίξεις στην τεχνητή νοημοσύνη και μια καλύτερη εμπειρία χρήστη. Αποφασίσαμε λοιπόν να το κάνουμε Δημηγορώ.

Ποιες είναι μερικές από τις διαφορετικές τεχνολογίες μηχανικής εκμάθησης που χρησιμοποιούνται στο Speechify;

Έχουμε υιοθετήσει τεχνικές αιχμής για προηγμένες αρχιτεκτονικές παραγωγής — μετασχηματιστές/διαμορφωτές, προεκπαίδευση μεγάλης κλίμακας, κατανεμημένη εκπαίδευση, συσσώρευση κλίσης, αυτόματα κωδικοποιημένοι λανθάνοντες χώροι, διάχυση, αντίθετα δίκτυα και μοντελοποίηση γλώσσας. Χρησιμοποιούμε υποστηρικτικές τεχνικές για την επεξεργασία χαρακτηριστικών γύρω από τη φωνοποίηση, τον τόνο και το συναίσθημα, για να μοντελοποιήσουμε καλύτερα την ομιλία.

Ποιες είναι μερικές από τις προκλήσεις πίσω από τη δημιουργία μιας εφαρμογής μετατροπής κειμένου σε ομιλία;

Μια βασική πρόκληση είναι η οικοδόμηση φωνές υψηλής ποιότητας που ακούγονται σαν αληθινοί άνθρωποι παρά σαν ρομπότ. Στόχος μας είναι οι άνθρωποι να μην μπορούν να διακρίνουν τη διαφορά μεταξύ του πώς ακούγονται οι φωνές μας και του πώς ακούγονται οι άνθρωποι, έτσι ώστε οι χρήστες μας να ακούνε άνετα περιεχόμενο στο Speechify για μεγάλες χρονικές περιόδους. Μια δεύτερη πρόκληση είναι η διανομή των μοντέλων μας AI σε εκατομμύρια χρήστες. Άλλο είναι να δημιουργείς φωνές τεχνητής νοημοσύνης υψηλής ποιότητας και άλλο να διασφαλίζεις ότι εκατομμύρια χρήστες σε όλο τον κόσμο τις μαθαίνουν και τις χρησιμοποιούν.

Το Speechify είναι η #1 εφαρμογή στην κατηγορία του στο app store, σε τι αποδίδετε αυτή την επιτυχία;

Πιστεύουμε ότι έχουμε δημιουργήσει τα καλύτερα προϊόντα στην αγορά για άτομα που θέλουν να ακούσουν το διάβασμα που πρέπει να καταναλώσουν – είτε πρόκειται για μαθητές με εργασίες στο σπίτι, για επαγγελματίες που διαβάζουν για δουλειά ή για αναγνώστες αναψυχής που θέλουν απλώς να ψυχαγωγηθούν. Έχουμε την καλύτερη επιλογή φωνών, συμπεριλαμβανομένων διασημοτήτων όπως ο Snoop Dogg, και την καλύτερη διεπαφή χρήστη για να ανεβάζουν εύκολα και να έχουν πρόσβαση οι χρήστες στο περιεχόμενο που θέλουν να καταναλώσουν. Και η εμπειρία χρήστη μας είναι απρόσκοπτη σε όλο το οικοσύστημα Speechify – μπορείτε να ξεκινήσετε να ακούτε ένα άρθρο στον υπολογιστή σας και στη συνέχεια να το κάνετε εύκολα zap για να το κρατήσετε ακούγοντας στο τηλέφωνό σας.

Ποιες είναι μερικές από τις μεγαλύτερες περιπτώσεις χρήσης για αυτήν την εφαρμογή;

Speechify's γενετική AI λύνει πραγματικά προβλήματα για μαθητές που θέλουν να κάνουν πολλές εργασίες για το σπίτι γρηγορότερα, πραγματικούς ανθρώπους με δυσλεξία και ΔΕΠΥ που έχουν προβλήματα ανάγνωσης, ηλικιωμένους με χαμηλή όραση, επαγγελματίες που θέλουν να διαβάζουν περισσότερο και να είναι πιο παραγωγικοί, συγγραφείς που θέλουν να ακούσουν τη δουλειά τους , ακουστικούς μαθητές και αμέτρητους άλλους.

Ποιο είναι το όραμά σας για το μέλλον της τεχνητής νοημοσύνης;

Θέλουμε AI – και συγκεκριμένα AI φωνές κειμένου σε ομιλία – να εξαλείψετε τα εμπόδια στη μάθηση ανεξάρτητα από το επίπεδο εισοδήματός σας, τις μαθησιακές διαφορές, τη γεωγραφία ή τη γλώσσα. Βλέπουμε την τεχνητή νοημοσύνη ως εργαλείο κοινωνικού καλού για την ανύψωση της ποιότητας ζωής που μπορούν να ζήσουν οι άνθρωποι μέσω της βελτίωσης της εκπαίδευσής τους.

Σας ευχαριστούμε για την υπέροχη συνέντευξη, οι αναγνώστες που επιθυμούν να μάθουν περισσότερα πρέπει να το επισκεφτούν Δημηγορώ.

Ιδρυτικός συνεργάτης της unite.AI & μέλος της Τεχνολογικό Συμβούλιο Forbes, Ο Αντουάν είναι α μελλοντιστής που είναι παθιασμένος με το μέλλον της τεχνητής νοημοσύνης και της ρομποτικής.

Είναι επίσης ο Ιδρυτής του Securities.io, ένας ιστότοπος που εστιάζει στην επένδυση σε ανατρεπτική τεχνολογία.