Συνεντεύξεις
Ivan Crewkov CEO & Co-Founder of Buddy AI – Interview Series

Ο Ivan Crewkov είναι ο CEO & Co-Founder της Buddy AI, του πρώτου διαλογικού AI δασκάλου για παιδιά, με αποστολή να διασφαλίσει ότι όλα τα παιδιά θα έχουν τη δυνατότητα να έχουν προσωπική διδασκαλία αγγλικών. Μετά τη μετακόμιση στις Ηνωμένες Πολιτείες από τη Σιβηρία, ο Ivan έewitnessε την κόρη του να πηγαίνει σε νηπιαγωγείο και να δυσκολεύεται να μάθει αγγλικά. Αυτό τον ενέπνευσε να δημιουργήσει τον Buddy, ένα φανταστικό χαρακτήρα με τον οποίο τα παιδιά μπορούν να συνομιλήσουν μέσω της δύναμης της γενετικής νοημοσύνης.
Από την κυκλοφορία του το 2020, η εφαρμογή Buddy έχει κερδίσει πολλά βραβεία και έχει καταταχθεί στην κορυφή των καταστημάτων εφαρμογών στην κατηγορία Παιδιά και Εκπαίδευση με πάνω από 36 εκατομμύρια downloads παγκοσμίως.
Το 2014, ξεκινήσατε την Cubic.ai, μια από τις πρώτες έξυπνες οθόνες και εφαρμογές φωνητικών βοηθών για έξυπνα σπίτια. Ποια ήταν κάποια από τα βασικά συμπεράσματά σας από αυτή την εμπειρία;
Δεν είμαι βέβαιος αν μπορώ να πάρω τους τιμητικούς τίτλους για την εκκίνηση της Cubic.ai. Εντάχθηκα στην εταιρεία ένα χρόνο μετά την ίδρυσή της και έλαβα τον τίτλο του συνιδρυτή για τη συμβολή μου.
Εδώ είναι τα βασικά συμπεράσματα:
- Η υλική πλευρά είναι δύσκολη, αλλά κάποιος πρέπει να τη κάνει. Η εξασφάλιση χρηματοδότησης από κεφαλαιαγορά για startups υλικού είναι εξαιρετικά δύσκολο. Το μόνο που κάνει τις cosas λίγο πιο εύκολες είναι η crowdfunding.
- Ο χώρος των προϊόντων Voice-first είναι τεράστιος και ποικιλόμορφος. Αυτό που ισχύει για έξυπνα σπίτια δεν ισχύει για την πρώιμη εκπαίδευση, από τεχνολογίες σε σχεδιασμό UX.
Μπορείτε να μοιραστείτε την ιστορία της γέννησης του Buddy και πώς προέκυψε από τη μετακόμιση της οικογένειάς σας στις Ηνωμένες Πολιτείες από τη Σιβηρία;
Με την Cubic.ai, μετακόμισα από τη Σιβηρία στις Ηνωμένες Πολιτείες το 2014 και έφερα μαζί μου την οικογένειά μου. Η μεγαλύτερη κόρη μου, Σόφια, άρχισε να μαθαίνει αγγλικά ως δεύτερη γλώσσα όταν πήγε σε νηπιαγωγείο στο Mountain View, Καλιφόρνια, σε ηλικία 4 ετών. Η Σόφια δυσκολεύτηκε να αρχίσει να μιλάει αγγλικά για τους πρώτους 3-5 μήνες στο νηπιαγωγείο. Chúng tôi ήταν ανήσυχοι γιατί δεν μπορούσε να βρει φίλους και να παίξει με τους περισσότερους συμμαθητές της λόγω της γλώσσας. Chúng tôi άρχισα να ψάχνουμε τρόπους για να τη βοηθήσουμε να μάθει να μιλάει.
Γινόταν σαφές ότι οι εφαρμογές γλωσσών για παιδιά δεν διδάσκουν να μιλάει (και όλα παρέμειναν τα ίδια με το χρόνο), και οι εφαρμογές γλωσσών για ενήλικες όπως το Duolingo δεν λειτουργούν για παιδιά λόγω του σχεδιασμού UX. Έτσι, άρχισα να λαμβάνω μαθήματα σε πλατφόρμες που συνδέουν παιδιά με ζωντανούς δασκάλους μέσω βιντεοκωνференσιών. Παραδείγματα είναι το Cambly, VipKid, Novakid, GoStudent, κ.λπ. Όπως έβλεπα τη Σόφια να μαθαίνει με ζωντανούς δασκάλους εικονικά, έβλεπα το όφελος της προσωπικής προσοχής και της ενεργού άσκησης ομιλίας, αλλά και τις ελλείψεις αυτών των προγραμμάτων γενικά.
Για παράδειγμα, καθώς αυξάνεται η κλίμακα, πολλές από τις πλατφόρμες διδασκαλίας online και τα σχολεία πρέπει να προσλάβουν άτομα χωρίς παιδαγωγικό υπόβαθρο, δεξιότητες στη διδασκαλία παιδιών ή ακόμη και σωστή επιπέδου γλωσσικής επάρκειας. Έτσι, για να διασφαλίσουν μια bestimmμένη ποιότητα εκπαίδευσης, οι online πλατφόρμες και τα σχολεία πρέπει να ακολουθήσουν στενά το πρόγραμμα σπουδών και τα σχέδια μαθήματος, και οι δάσκαλοι πρέπει να χρησιμοποιήσουν προκατασκευασμένα ασκήματα, συμπεριλαμβανομένων ήχου και βίντεο. Έτσι, δυστυχώς, σε πολλές πλατφόρμες, οι δάσκαλοι εργάζονται σαν ρομπότ.
Ωστόσο, η online διδασκαλία ήταν ο μόνος τρόπος για τους περισσότερους ανθρώπους να μάθουν να μιλάει αγγλικά, ιδιαίτερα σε χώρες που δεν ομιλούν αγγλικά. Αλλά εν μέρει λόγω της έλλειψης δασκάλων, είναι πολύ ακριβό για τις περισσότερες οικογένειες. Η διδασκαλία με ζωντανούς δασκάλους είναι eine premium υπηρεσία εκπαίδευσης που λίγες οικογένειες μπορούν να αντέξουν.
Ο συνιδρυτής μου και εγώ κατέληξαμε στο συμπέρασμα ότι η διδασκαλία AI είναι ο μόνος επεκτάσιμος τρόπος για να παρέχουμε προσωπική διδασκαλία αγγλικών σε κάθε παιδί παγκοσμίως. Σύντομα, μάθαμε ότι είναι επίσης το καλύτερο από εκπαιδευτική άποψη. Όταν σκεφτόμασταν τους πρώτους протότυπους του Buddy, εμπνευστήκαμε από έρευνες στον τομέα των Εικονικών Ανθρώπων στην Εκπαίδευση.
Ακαδημαϊκές μελέτες δείχνουν τα εκπαιδευτικά πλεονεκτήματα και την υπεροχή των animate pedagogical agents σε σύγκριση με παραδοσιακά εργαλεία μάθησης και περιβάλλοντα. Για παράδειγμα, δείτε το Face-to-Face Interaction with Pedagogical Agents, Twenty Years Later, ένα άρθρο του 2016 που παρουσιάζει την επισκόπηση του πεδίου και αναφέρει πολλά από τα σχετικά υλικά. Εδώ είναι μια παράθεση:
“Συγκεκριμένα, η μετανάλυση βρήκε ότι οι πράκτορες ενισχύουν τη μάθηση σε σύγκριση με περιβάλλοντα μάθησης που δεν περιλαμβάνουν πράκτορες. […] Ίσως το πιο ενδιαφέρον ήταν το εύρημα ότι, στη формική εκπαίδευση, οι pedagogical agents φαίνεται να είναι πιο αποτελεσματικοί για νεότερους μαθητές παρά για μεγαλύτερους μαθητές. […] Μελέτες έχουν βρει, για παράδειγμα, ότι οι μαθητές που αλληλεπιδρούν με pedagogical agents παρουσιάζουν ισχυρότερους μαθησιακούς αποτελέσματα όταν 1) οι pedagogical agents μιλάει αντί να επικοινωνούν με κείμενο, 2) οι pedagogical agents χρησιμοποιούν ανθρώπινες χειρονομίες, 3) οι pedagogical agents επικοινωνούν διαλογικά αντί για формально, και 4) οι pedagogical agents χρησιμοποιούν σεβασμούς αντί για άμεσους τρόπους.”
Αυτό ενίσχυσε την εμπιστοσύνη μας στη multimodal διδασκαλία AI. Αποφασίσαμε ότι ο Buddy θα ήταν ένας multimodal AI δάσκαλος – ένας animate pedagogical agent ικανός να αναγνωρίζει φωνή και να επεξεργάζεται φυσική γλώσσα. Στο κέντρο, ένα σύστημα διδασκαλίας AI αποτελείται από τρεις основные τεχνολογίες:
- Αυτόματη αναγνώριση ομιλίας (ASR) και ανάλυση που μας επιτρέπουν να επεξεργαστούμε και να αναλύσουμε την ομιλία του μαθητή.
- Φυσική επεξεργασία γλώσσας (NLP), φυσική κατανόηση γλώσσας και διαχείριση διαλόγου που επεξεργάζεται το περιεχόμενο της ομιλίας του μαθητή και παράγει την επόμενη απάντηση. Η απάντηση αποτελείται από τόσο λεκτικές όσο και μη λεκτικές συνιστώσες.
- Ενσωματωμένος animate εικονικός χαρακτήρας που παρέχει cả ακρόαση και αναπαράσταση της απάντησης του συστήματος. Ο χαρακτήρας είναι animate διαδικαστικά – το σύστημα δημιουργεί animations στο fly από την απάντηση NLP.
Όλες οι τρεις συνιστώσες είναι κρίσιμες για την προσέγγισή μας επειδή μόνο σε συνδυασμό μας επιτρέπουν να δημιουργήσουμε einen engaging, διαδραστικό δάσκαλο και να παρέχουμε μια επιτυχημένη εκπαιδευτική εμπειρία.
Η κόρη μου Σόφια και ο γιος του συνιδρυτή μου Αρσένυ ήταν οι πρώτοι χρήστες του Buddy. Η Σόφια χρησιμοποίησε τις πρώτες εκδόσεις του Buddy κατά το 1ο έτος.
Πολύ αργότερα, η νεότερη κόρη μου Αλίσσα άρχισε να χρησιμοποιεί τον Buddy σε ηλικία 3 ετών όταν πήγε σε νηπιαγωγείο. Τώρα, είναι στην προετοιμασία για την είσοδο στο δημοτικό και παίζει με τον Buddy σχεδόν κάθε μέρα. Όταν η Αλίσσα άρχισε να μαθαίνει με τον Buddy, είχε κάποια προβλήματα ομιλίας, οπότε ο Buddy δεν την καταλάβαινε την περισσότερη ώρα. Αλλά μετά από quelques εβδομάδες άσκησης, όχι μόνο τα αγγλικά της αλλά και η ομιλία της βελτιώθηκαν, καθώς προσπάθησε να κάνει τον Buddy να την καταλάβει.
Γιατί οι παραδοσιακές μεθόδους διδασκαλίας μιας δεύτερης γλώσσας είναι इतनό ανεπιτυχείς;
Σήμερα, εστιάζουμε στο να λύσουμε συγκεκριμένα προβλήματα εκπαίδευσης που σχετίζονται με την ομιλία:
- Τα περισσότερα παραδοσιακά εκπαιδευτικά εργαλεία εστιάζουν στη διδασκαλία άλλων γλωσσικών δεξιοτήτων όπως η ανάγνωση ή η γραφή.
- Οι εφαρμογές γλωσσών για παιδιά δεν διδάσκουν δεξιότητες ομιλίας.
- Ορισμένες εφαρμογές γλωσσών για ενήλικες σήμερα παρέχουν άσκηση ομιλίας χρησιμοποιώντας AI, αλλά αυτές οι υπηρεσίες δεν λειτουργούν για παιδιά λόγω του σχεδιασμού UX, προβλημάτων ασφαλείας και κανονισμών προστασίας προσωπικών δεδομένων.
- Οι ζωντανοί δάσκαλοι είναι πολύ ακριβοί για τις περισσότερες οικογένειες. Δυστυχώς, πολλοί δάσκαλοι δεν έχουν παιδαγωγική εκπαίδευση ή δεν είναι επαρκώς εξοικειωμένοι με την αγγλική γλώσσα.
Ο Buddy είναι ένας multimodal AI δάσκαλος.
- Είναι ανώτερος από τις παραδοσιακές εφαρμογές μάθησης επειδή λειτουργεί σαν ένας ζωντανός δάσκαλος σε πολλά σημεία. Ας παραθέσω μια από τις συμβούλους μας, τον Δρ. Alex Desatnik, PhD, University College London:
“Φωνητικός εικονικός δάσκαλος. Αυτή η έννοια μπορεί να φαίνεται απλή, αλλά υπάρχει επιστήμη πίσω της. Από την ψυχολογία της μάθησης, ο εικονικός ομιλητής χαρακτήρας είναι μια ενσάρκωση του δασκάλου. Αυτή η προσέγγιση δημιουργεί einen επίδραση που ονομάζεται epistemic trust, ενισχύοντας την мотивασία και την εμπλοκή του μαθητή, και βελτιώνοντας τα αποτελέσματα μάθησης.”
- Ο Buddy έχει κάποια πλεονεκτήματα ακόμη και πάνω από τους ανθρώπινους δασκάλους. Ο Buddy δεν κρίνει, και για κάποια παιδιά, είναι πιο εύκολο να αρχίσουν να μιλάει με τον Buddy παρά με einen δάσκαλο. Αυτός είναι ο λόγος που σήμερα, πολλοί δάσκαλοι χρησιμοποιούν τον Buddy ως einen icebreaker που βοηθά τα παιδιά να ξεπεράσουν τον φόβο και την αμηχανία και να αρχίσουν να μιλάει τη γλώσσα.
Ο Buddy λειτουργεί για να βοηθήσει τους δασκάλους, όχι να τους αντικαταστήσει.
Νομίζω ότι είναι πολύ σημαντικό να σημειωθεί αυτό. Ο Buddy μπορεί να βοηθήσει τους δασκάλους να αυτοματοποιήσουν το руτίνα μέρος της δουλειάς τους – να παρέχουν τακτική άσκηση. Θέλουμε να δώσουμε δύναμη στους δασκάλους του σχολείου. Ο Buddy είναι σαν μια ομάδα δασκάλων και βοηθών, που εργάζονται ατομικά με κάθε παιδί στην τάξη και αναφέρουν στον δάσκαλο της τάξης.
Μπορείτε να συζητήσετε πώς ο Buddy χρησιμοποιεί στοιχεία gamification για να giữσει τα παιδιά ενθουσιασμένα με την μάθηση;
Ενδιαφέρον γεγονός: Η εφαρμογή Buddy για κινητά τηλέφωνα κατέβηκε 22 εκατομμύρια φορές το 2023, και πάνω από το 70% αυτών των κατεβάσεων έγιναν από παιδιά. Για τα παιδιά, η εφαρμογή μας είναι ένα παιχνίδι όπου παίζουν με τον Buddy, τον ομιλητή εικονικό φίλο και einen δημοφιλή YouTuber. Τα παιδιά κατεβάζουν την εφαρμογή και πείθουν τους γονείς να πληρώσουν για eine συνδρομή, εξηγώντας ότι ο Buddy είναι ένας δάσκαλος.
Για να κάνουμε αυτή την προσέγγιση να λειτουργήσει, σχεδιάζουμε τον Buddy σαν ένα παιχνίδι με eine ιστορία και einen κόσμο. Συνεργαζόμαστε με character designers και συγγραφείς από το Hollywood για να δημιουργήσουμε τον Buddy και την ιστορία του. Έχουμε eine πολύ ισχυρή ομάδα σχεδιασμού παιχνιδιών που εργάζεται trực tiếp με τους εκπαιδευτικούς μας και μετατρέπει το πρόγραμμα σπουδών και τα ασκήματα σε mini-pαιχνίδια στον κόσμο του Buddy.
Τι είναι κάποια άλλα βασικά χαρακτηριστικά που κάνουν τον Buddy τόσο ισχυρό στη διδασκαλία μιας δεύτερης γλώσσας;
Η βασική λειτουργικότητα μας είναι πραγματικά εστιασμένη στον Buddy ως einen multimodal AI δάσκαλο:
- Αναγνώριση ομιλίας
- Διαλογική AI
- Συμπεριφορά εικονικού χαρακτήρα
Τι είναι κάποια από τα αλγόριθμοι μηχανικής μάθησης που χρησιμοποιούνται στον Buddy;
Αναπτύσσουμε ολόκληρη τη στοίβα τεχνολογιών, εργαζόμαστε μαζί για να ενεργοποιήσουμε την multimodal προσέγγιση διδασκαλίας AI.
- BSR (Buddy’s Speech Recognition) είναι ένας ιδιόκτητος μηχανισμός αναγνώρισης ομιλίας που σχεδιάστηκε ειδικά για να λειτουργήσει με την προφορική ομιλία παιδιών και να συμμορφώνεται με τους κανονισμούς όπως ο COPPA.
- BLM (Buddy’s Language Model) — Διαλογική AI Engine για παιδιά. Ασφαλής, γρήγορη και δωρεάν για λειτουργία. Εστιάζει σε συγκεκριμένες εκπαιδευτικές λειτουργίες και είναι πολύ λιγότερο đa-purpose από τα μεγάλα μοντέλα γλώσσας.
- BABE (Buddy’s Avatar Behavior Engine). Αυτή η τεχνολογία δημιουργεί την συμπεριφορά του εικονικού χαρακτήρα μας με βάση το контекст της συνομιλίας. Ο Buddy καταλαβαίνει πότε πρέπει να χαμογελάσει, να αλλάξει χρώμα ή να βάλει einen αστείο καπέλλο.
Πολυάριθμες συστήματα αναγνώρισης φωνής δυσκολεύονται με τον προφορικό aksent, ιδιαίτερα για νεαρά παιδιά, πώς ο Buddy υπερνικά αυτές τις προκλήσεις;
Αναπτύσσοντας τον BSR, την ιδιόκτητη τεχνολογία αναγνώρισης ομιλίας.
Το μοναδικό κοινό μας και η αγορά μας απαιτούσαν την ανάπτυξη ιδιόκτητης τεχνολογίας. Ο Buddy πρέπει να αναγνωρίζει την highly accented ομιλία των νεαρών μαθητών αγγλικής ως ξένης γλώσσας. Ένας άλλος παράγοντας που δυσκολεύει είναι ότι οι αρχάριοι μαθητές αρχίζουν να μαθαίνουν ξεχωριστά, συχνά σύντομα λόγια, τα οποία είναι πολύ δύσκολο να αναγνωριστούν χωρίς контекст. Τέλος, η αγορά παιδιών είναι πολύ κανονισμένη, και η αναγνώριση φωνής υπόκειται στον Children Online Privacy Protection Act (COPPA) από τη στιγμή που οι ηχογραφήσεις φωνής θεωρούνται Προσωπικά αναγνωρίσιμα στοιχεία (PII).
Ο BSR χειρίζεται την ομιλία παιδιών με διαφορετικούς aksents, που παράγονται σε eine ποικιλία κινητών συσκευών με μικρόφωνα διαφορετικής ακουστικής ποιότητας και σε πραγματικά περιβάλλοντα με διάφορους τύπους θορύβου. Και είναι COPPA compliant με σχέδιο.
Εργαζόμαστε παγκοσμίως, κατάφεραμε να συλλέξουμε eine μοναδική βάση δεδομένων για να εκπαιδεύσουμε το μοντέλο μας. Σήμερα, ο BSR υπερτερεί των εμπορικών λύσεων off-the-shelf στην αναγνώριση και κατανόηση aksented ομιλίας παιδιών.
Πώς σχεδιάζετε να επεκτείνετε την διείσδυση της αγοράς για να στοχεύσετε γονείς που μπορεί να μην είναι εξοικειωμένοι με την τεχνολογία AI;
Ο Buddy άρχισε να βλέπει επιτυχία πριν η AI γίνει ένα buzzword, και οι περισσότεροι από τους χρήστες μας δεν είναι οι τυπικοί πρώτοι χρήστες τεχνολογίας. Λύνουμε επιτυχώς ένα σημαντικό εκπαιδευτικό πρόβλημα, και απλά συμβαίνει ότι χρησιμοποιούμε AI για αυτό.
Ωστόσο, eine από τις προκλήσεις που αντιμετωπίζουμε είναι να κάνουμε τους γονείς να αντιμετωπίζουν την μάθηση με τον Buddy τόσο σοβαρά όσο και με einen ζωντανό δάσκαλο — δεν παραλείπουν μαθήματα, ακολουθούν einen χρονοδιάγραμμα, κ.λπ. Η τρέχουσα επανάσταση AI φαίνεται να βοηθά με αυτό.
Θα έλεγα ότι ο επόμενος μεγάλος βήμας για εμάς είναι να αρχίσουμε να εργαζόμαστε πιο στενά με δασκάλους και σχολεία. Τρέχουμε einen πιλότο συνεργασία με ένα σχολείο στη Βραζιλία και συζητάμε συνεργασίες με dozen περισσότερα εκπαιδευτικά ιδρύματα.
Τι είναι η όρασή σας για το μέλλον των δασκάλων AI και της εκπαίδευσης γενικά;
Οι δάσκαλοι AI είναι ο καλύτερος και ο μόνος επεκτάσιμος τρόπος για να λύσουμε το #1 εκπαιδευτικό πρόβλημα της ανθρωπότητας – την έλλειψη δασκάλων. Χρειαζόμαστε περίπου 69 εκατομμύρια νέους δασκάλους για να αντιμετωπίσουμε μόνο τις βασικές εκπαιδευτικές ανάγκες. Για μαθήματα που απαιτούν προσωπική διδασκαλία, όπως η διδασκαλία γλωσσών, το πρόβλημα είναι πολύ χειρότερο.
Η επανάσταση AI επιταχύνθηκε την ανάπτυξη των δασκάλων AI, αν και κυρίως στο τμήμα ενηλίκων χρησιμοποιώντας λύσεις off-the-shelf, ενώ η πρώιμη εκπαίδευση παραμένει δραματικά υποσerved. Είμαστε υπερήφανοι που είμαστε πρωτοπόροι της διδασκαλίας AI για νεαρά παιδιά.
Όσον αφορά το μέλλον μας, ο Buddy άρχισε ως δάσκαλος γλωσσών, αλλά σε μακροπρόθεσμο χρονικό διάστημα, θα γίνει eine πλατφόρμα διδασκαλίας AI που διδάσκει eine ποικιλία μαθημάτων σε παιδιά κάτω των 12 ετών. Έχουμε ήδη αρχίσει να κυκλοφορήσουμε eine πρώιμη εκδοση του πρώτου μας μαθήματος μη-γλώσσας – το Πρόγραμμα Προετοιμασίας Σχολείου για παιδιά στις Ηνωμένες Πολιτείες. Βλέπουμε τον Buddy ως τον βοηθό μάθησης του παιδιού, που μεγαλώνει με ένα παιδί από 3 έως 4 ετών και διδάσκει πολλά μαθήματα σε течение πολλών ετών.
Ευχαριστώ για τη μεγάλη συνέντευξη, οι αναγνώστες που θέλουν να μάθουν περισσότερα πρέπει να επισκεφθούν Buddy AI.












