Connect with us

Ivan Crewkov CEO & Co-Founder di Buddy AI – Intervista alla serie

Interviste

Ivan Crewkov CEO & Co-Founder di Buddy AI – Intervista alla serie

mm

Ivan Crewkov è il CEO e Co-Fondatore di Buddy AI, il primo tutor di intelligenza artificiale conversazionale per bambini, con la missione di garantire che tutti gli studenti possano permettersi un tutoraggio di inglese 1:1. Dopo essersi trasferito negli Stati Uniti dalla Siberia, Ivan ha visto sua figlia di età prescolare lottare per imparare l’inglese. Ciò lo ha ispirato a costruire Buddy, un personaggio fittizio con cui i bambini possono effettivamente conversare attraverso il potere dell’intelligenza artificiale generativa.

Dal suo lancio nel 2020, l’app Buddy ha vinto diversi premi e si è classificata in cima alle classifiche nella categoria Kids e Education dell’App Store con oltre 36M di download in tutto il mondo.

Nel 2014, hai lanciato Cubic.ai, uno dei primi altoparlanti intelligenti e app di assistenti vocali per case intelligenti. Quali sono state alcune delle tue principali considerazioni su questa esperienza?

Non sono sicuro di poter prendere il merito di aver lanciato Cubic.ai. Mi sono unito alla società un anno dopo la sua fondazione e ho ricevuto il titolo di co-fondatore per il mio contributo.

Ecco le principali considerazioni:

  • Il hardware è difficile, ma qualcuno deve farlo comunque. Ottenere finanziamenti per le startup di hardware è estremamente difficile. L’unica cosa che rende le cose un po’ più facili è il crowdfunding.
  • Lo spazio dei prodotti Voice-first è vasto e diversificato. Ciò che si applica alle case intelligenti non si applica all’apprendimento precoce, dalle tecnologie alla progettazione dell’esperienza utente.

Puoi condividere la storia di genesi di Buddy e come è originata dal trasferimento della tua famiglia negli Stati Uniti dalla Siberia?

Con Cubic.ai, mi sono trasferito dalla Siberia negli Stati Uniti nel 2014 e ho portato con me la mia famiglia. Mia figlia maggiore Sofia ha iniziato a imparare l’inglese come seconda lingua quando è andata in una scuola materna a Mountain View, in California, all’età di 4 anni. Sofia ha lottato per iniziare a parlare in inglese per i primi 3 – 5 mesi nella scuola materna. Eravamo preoccupati perché non riusciva a trovare amici e a giocare con la maggior parte dei suoi coetanei a causa della lingua. Abbiamo iniziato a cercare modi per aiutarla a imparare a parlare.

È diventato chiaro che le app di lingua per bambini non insegnano a parlare (e tutto è rimasto lo stesso nel tempo), e le app di lingua per adulti come Duolingo non funzionano per i bambini a causa dell’esperienza utente. Quindi, abbiamo iniziato a prendere lezioni su piattaforme che collegano i bambini con insegnanti live tramite videoconferenza. Esempi sono Cambly, VipKid, Novakid, GoStudent, ecc. Mentre osservavo Sofia imparare con insegnanti live virtualmente, ho visto il beneficio dell’attenzione 1:1 e della pratica attiva di parlare, ma ho anche visto le carenze di questi programmi in generale.

Ad esempio, poiché si espandono, molte delle piattaforme di tutoraggio online e delle scuole online devono assumere persone senza background pedagogici, competenze nell’insegnamento ai bambini o addirittura un livello di proficienza inglese adeguato. Quindi, per garantire una certa qualità di istruzione, le piattaforme online e le scuole scrivono rigorosamente i piani di studio e le lezioni, e gli insegnanti devono utilizzare esercizi precotti, inclusi frammenti audio e video. Quindi, purtroppo, su molte piattaforme, i tutor lavorano fondamentalmente come bot.

Tuttavia, il tutoraggio online è stato l’unico modo per la maggior parte delle persone di imparare a parlare inglese, specialmente nei paesi non di lingua inglese. Ma in parte a causa della carenza di insegnanti, è troppo costoso per la maggior parte delle famiglie. Imparare con insegnanti live è un servizio di istruzione premium che poche famiglie possono permettersi.

Il mio co-fondatore e io siamo arrivati alla conclusione che il tutoraggio di intelligenza artificiale è l’unico modo scalabile per fornire un tutoraggio di inglese 1:1 a ogni bambino in tutto il mondo. Presto, abbiamo scoperto che è anche il migliore da un punto di vista educativo. Quando stavamo considerando i primi prototipi di Buddy, ci siamo ispirati alla ricerca nel campo degli esseri umani virtuali nell’istruzione.

Gli studi accademici mostrano i vantaggi educativi e la superiorità degli agenti pedagogici animati rispetto a strumenti di apprendimento più tradizionali e ambienti. Ad esempio, vedere Face-to-Face Interaction with Pedagogical Agents, Twenty Years Later, un articolo del 2016 che panoramica il campo e cita molto del materiale rilevante. Ecco una citazione:

“In particolare, la meta-analisi ha scoperto che gli agenti migliorano l’apprendimento rispetto agli ambienti di apprendimento che non presentano agenti. […] Forse più interessante è stata la scoperta che, nell’istruzione formale, gli agenti pedagogici sembrano essere più efficaci per gli studenti più giovani che per gli studenti più anziani. […] Gli studi hanno scoperto, ad esempio, che gli studenti che interagiscono con gli agenti pedagogici mostrano risultati di apprendimento più forti quando 1) gli agenti pedagogici parlano invece di comunicare con il testo, 2) gli agenti pedagogici utilizzano gesti umani, 3) gli agenti pedagogici comunicano in modo conversazionale invece di formale, e 4) gli agenti pedagogici utilizzano un linguaggio cortese invece di diretto.”

Ciò ha rafforzato la nostra fiducia nell’approccio di tutoraggio di intelligenza artificiale multimodale. Abbiamo deciso che Buddy sarebbe stato un agente pedagogico animato multimodale – un agente pedagogico animato in grado di riconoscimento vocale e di elaborazione del linguaggio naturale. Al suo nucleo, un sistema di tutoraggio di intelligenza artificiale consiste in tre tecnologie principali:

  1. Riconoscimento e analisi del discorso automatico (ASR) ci consentono di elaborare e analizzare il discorso dello studente.
  2. Elaborazione del linguaggio naturale (NLP), comprensione del linguaggio naturale e gestione del dialogo che elabora il contenuto del discorso dello studente e produce la risposta successiva. La risposta consiste in componenti verbali e non verbali.
  3. Carattere virtuale animato incorporato che fornisce sia feedback di ascolto che riproduce la risposta del sistema. Il personaggio è animato proceduralmente – il sistema crea animazioni in tempo reale dalla risposta NLP.

Tutti e tre i componenti sono cruciali per il nostro approccio perché solo in combinazione ci consentono di costruire un tutor interattivo e coinvolgente e di fornire un’esperienza educativa di successo.

Mia figlia Sofia e il figlio del mio co-fondatore Arseny sono diventati i primi utenti di Buddy. Sofia ha utilizzato le prime versioni di Buddy attraverso il 1° grado.

Diversi anni dopo, mia figlia minore Alisa ha iniziato a utilizzare Buddy a tre anni quando è andata alla scuola materna. Ora è in Transitional Kindergarten e gioca con Buddy quasi ogni giorno. Quando Alisa ha iniziato a imparare con Buddy, aveva diversi problemi di linguaggio, quindi Buddy non riusciva a capirla la maggior parte del tempo. Ma dopo un paio di settimane di pratica, non solo il suo inglese ma anche il suo linguaggio è migliorato, poiché ha cercato di fare del suo meglio per far capire a Buddy.

Perché i metodi tradizionali di insegnamento di una seconda lingua sono così inefficaci?

Oggi, ci concentriamo sul risolvere problemi educativi specifici connessi alla lingua:

  • La maggior parte degli strumenti educativi tradizionali si concentra sull’insegnamento di altre abilità linguistiche come la lettura o la scrittura.
  • Le app di lingua per bambini non insegnano le abilità di parlare.
  • Alcune app di lingua per adulti oggi forniscono la pratica di parlare utilizzando l’intelligenza artificiale, ma questi servizi non funzionano per i bambini a causa dell’esperienza utente, delle preoccupazioni sulla sicurezza e delle norme sulla privacy.
  • I tutor live sono troppo costosi per la maggior parte delle famiglie. Purtroppo, molti tutor non hanno una formazione pedagogica o non sono proficienti in inglese.

Buddy è un tutor di intelligenza artificiale multimodale.

  • È superiore agli strumenti di apprendimento tradizionali perché funziona come un insegnante live in molti modi. Lasciami citare uno dei nostri consulenti, il dottor Alex Desatnik, PhD, University College London:

“Tutor virtuale basato sulla voce. Questo concetto può sembrare semplice, ma c’è scienza dietro. Dal punto di vista della psicologia dell’apprendimento, il personaggio virtuale che parla è un’incarnazione dell’insegnante. Questo approccio crea un effetto chiamato fiducia epistemica, rafforzando la motivazione e l’impegno dello studente e migliorando i risultati di apprendimento.”

  • Buddy ha alcuni vantaggi anche sugli insegnanti umani. Buddy non giudica, e per alcuni bambini, è più facile iniziare a parlare con Buddy che con un insegnante. È per questo che oggi, molti tutor utilizzano Buddy come un rompi-ghiaccio che aiuta i bambini a superare la loro paura e il loro disagio e a iniziare a parlare la lingua.

Buddy funziona per aiutare gli insegnanti, non per sostituirli.

Penso che sia molto importante notare questo. Buddy può aiutare gli insegnanti ad automatizzare la parte noiosa del loro lavoro – fornire pratica regolare. Vogliamo dare potere agli insegnanti delle scuole. Buddy è come una squadra di tutor e assistenti di insegnanti, che lavorano individualmente con ogni bambino nella classe e riferiscono all’insegnante della classe.

Puoi discutere come Buddy utilizza elementi di gamificazione per mantenere i bambini entusiasti dell’apprendimento?

Fatto divertente: l’app mobile di Buddy è stata scaricata 22 milioni di volte nel 2023, e oltre il 70% di questi download sono stati effettuati da bambini. Per i bambini, la nostra app è un gioco in cui giocano con Buddy, il loro amico virtuale che parla e un noto youtuber. I bambini scaricano l’app e convincono i genitori a pagare per un abbonamento, spiegando che Buddy è un insegnante.

Per far funzionare questo approccio, stiamo progettando Buddy come un gioco con una storia e un universo. Lavoriamo con designer di personaggi di Hollywood e scrittori per creare Buddy e la sua storia. Abbiamo una squadra di progettazione di giochi molto forte che lavora direttamente con i nostri educatori e trasforma il curriculum e gli esercizi in mini-giochi nel mondo di Buddy.

Quali sono alcune altre funzionalità principali che rendono Buddy così potente nell’insegnamento di una seconda lingua?

La nostra funzionalità principale è realmente focalizzata su Buddy come tutor di intelligenza artificiale multimodale:

  • Riconoscimento vocale
  • Intelligenza artificiale conversazionale
  • Comportamento visivo dell’avatar

Quali sono alcuni degli algoritmi di apprendimento automatico utilizzati in Buddy?

Stiamo sviluppando l’intero set di tecnologie, lavorando insieme per abilitare il nostro approccio di tutoraggio di intelligenza artificiale multimodale.

  • BSR (Riconoscimento vocale di Buddy) è un motore di riconoscimento vocale proprietario progettato specificamente per lavorare con il discorso dei bambini con accento e per essere conforme alle norme come COPPA.
  • BLM (Modello di linguaggio di Buddy) — Motore di intelligenza artificiale conversazionale per bambini. Sicuro, veloce e gratuito da utilizzare. Si concentra su funzionalità educative specifiche e è molto meno versatile dei grandi modelli di linguaggio.
  • BABE (Motore di comportamento dell’avatar di Buddy). Questa tecnologia genera il comportamento visivo del nostro personaggio in base al contesto della conversazione. Buddy capisce quando deve sorridere, cambiare colore o mettere un cappello divertente.

Molti sistemi di riconoscimento vocale lottano con gli accenti, specialmente per i bambini piccoli, come fa Buddy a superare queste sfide?

Sviluppando BSR, la nostra tecnologia di riconoscimento vocale proprietaria.

Il nostro pubblico unico e il mercato hanno richiesto lo sviluppo di tecnologie proprietarie. Buddy deve riconoscere il discorso fortemente accentato di giovani studenti di inglese come lingua straniera (EFL). Un altro fattore complicante è che gli studenti principianti iniziano imparando parole separate, spesso brevi, che sono molto difficili da riconoscere senza contesto. Infine, il mercato dei bambini è altamente regolamentato e il riconoscimento vocale è soggetto al Children Online Privacy Protection Act (COPPA) poiché le registrazioni vocali sono considerate Informazioni personali identificabili (PII).

BSR gestisce il discorso dei bambini con diversi accenti, prodotti su una varietà di dispositivi mobili con microfoni di qualità acustica diversa e in ambienti reali con molti tipi di rumore di sottofondo. E è conforme a COPPA per design.

Lavorando a livello globale, siamo riusciti a accumulare un set di dati unico per addestrare il nostro modello. Oggi, BSR supera le soluzioni commerciali pronte all’uso nel riconoscimento e nella comprensione del discorso dei bambini con accento.

Come pianifichi di espandere la penetrazione del mercato per raggiungere i genitori che potrebbero non essere familiari con la tecnologia di intelligenza artificiale?

Buddy ha iniziato a vedere il successo prima che l’intelligenza artificiale diventasse una parola chiave, e la maggior parte dei nostri utenti non sono gli adottanti precoci della tecnologia. Stiamo risolvendo con successo un importante problema educativo, e si dà il caso che stiamo utilizzando l’intelligenza artificiale per farlo.

Tuttavia, una delle sfide che affrontiamo è quella di far sì che i genitori trattino l’apprendimento con Buddy con la stessa serietà con cui trattano un insegnante live – non saltare le lezioni, attenersi a un programma, ecc. La rivoluzione attuale dell’intelligenza artificiale sembra aiutare in questo.

Direi che il prossimo grande passo per noi è iniziare a lavorare più a stretto contatto con gli insegnanti e le scuole. Stiamo eseguendo un progetto pilota con una scuola in Brasile e discutendo partenariati con un’altra dozzina di istituzioni educative.

Qual è la tua visione per il futuro dei tutor di intelligenza artificiale e dell’istruzione in generale?

I tutor di intelligenza artificiale sono il modo migliore e l’unico scalabile per risolvere il problema educativo numero uno dell’umanità – la carenza globale di insegnanti. Abbiamo bisogno di circa 69 milioni di nuovi insegnanti per affrontare solo le esigenze di apprendimento di base. Per le materie che richiedono un tutoraggio 1:1, come l’apprendimento della lingua, il problema è molto peggiore.

La rivoluzione dell’intelligenza artificiale ha accelerato lo sviluppo dei tutor di intelligenza artificiale, sebbene principalmente nel segmento degli adulti utilizzando soluzioni pronte all’uso, mentre l’apprendimento precoce rimane drasticamente sottoservito. Siamo orgogliosi di essere pionieri del tutoraggio di intelligenza artificiale per i bambini piccoli.

Per quanto riguarda il nostro futuro, Buddy è iniziato come un tutor di apprendimento della lingua, ma nel lungo termine, diventerà una piattaforma di tutoraggio di intelligenza artificiale che insegnerà una vasta gamma di soggetti ai bambini sotto i 12 anni. Abbiamo già iniziato a distribuire una versione precoce del nostro primo corso non linguistico – il curriculum di preparazione scolastica per i bambini degli Stati Uniti. Vediamo Buddy come l’assistente di apprendimento del bambino, che cresce con il bambino dall’età di 3 o 4 anni e insegna molti corsi nel corso di molti anni.

Grazie per la grande intervista, i lettori che desiderano saperne di più possono visitare Buddy AI.

Antoine è un leader visionario e socio fondatore di Unite.AI, guidato da una passione incrollabile per plasmare e promuovere il futuro dell'AI e della robotica. Un imprenditore seriale, crede che l'AI sarà altrettanto disruptiva per la società quanto l'elettricità, e spesso viene colto a parlare con entusiasmo del potenziale delle tecnologie disruptive e dell'AGI.
Come futurist, è dedicato a esplorare come queste innovazioni plasmeranno il nostro mondo. Inoltre, è il fondatore di Securities.io, una piattaforma focalizzata sugli investimenti in tecnologie all'avanguardia che stanno ridefinendo il futuro e ridisegnando interi settori.