mozzicone Ivan Crewkov CEO e co-fondatore di Buddy AI - Serie di interviste - Unite.AI
Seguici sui social

interviste

Ivan Crewkov CEO e co-fondatore di Buddy AI – Serie di interviste

mm
aggiornato on

Ivan Crewkov è il CEO e co-fondatore di Amico AI, il primo tutor di intelligenza artificiale conversazionale per bambini al mondo, con la missione di garantire che tutti gli studenti possano permettersi un tutoraggio di inglese individuale. Dopo essersi trasferito negli Stati Uniti dalla Siberia, Ivan ha visto la figlia in età prescolare lottare per imparare l'inglese. Questo lo ha ispirato a costruire Buddy, un personaggio immaginario con cui i bambini possono effettivamente conversare grazie al potere dell'intelligenza artificiale generativa.

Dal suo lancio nel 2020, l'app Buddy ha vinto numerosi premi e ha raggiunto la vetta delle classifiche nella categoria Kids and Education dell'App Store con oltre 36 milioni di download in tutto il mondo.

Nel 2014 hai lanciato Cubic.ai, uno dei primi altoparlanti intelligenti e app di assistente vocale per case intelligenti. Quali sono stati alcuni dei principali insegnamenti di questa esperienza?

Non sono sicuro di potermi prendere il merito di aver lanciato Cubic.ai. Sono entrato in azienda un anno dopo la sua fondazione e per il mio contributo ho ricevuto il titolo di cofondatore.

Ecco i punti chiave da asporto:

  • L'hardware è difficile, ma qualcuno deve pur farlo comunque. Garantire finanziamenti di venture capital per le startup hardware è estremamente difficile. L’unica cosa che rende le cose un po’ più facili è il crowdfunding.
  • Lo spazio dei prodotti Voice-first è vasto e diversificato. Ciò che vale per le case intelligenti non vale per l’apprendimento precoce, dalle tecnologie alla progettazione UX.

Potresti condividere la storia della genesi di Buddy e di come ha avuto origine dal trasferimento della tua famiglia dalla Siberia negli Stati Uniti?

Con Cubic.ai mi sono trasferito dalla Siberia negli Stati Uniti nel 2014 e ho portato con me la mia famiglia. Mia figlia maggiore Sofia ha iniziato a imparare l'inglese come seconda lingua quando andava in una scuola materna a Mountain View, in California, all'età di 4 anni. Sofia ha avuto difficoltà a iniziare a parlare inglese per i primi 3-5 mesi di scuola materna. Eravamo preoccupati perché non riusciva a trovare amici e a giocare con la maggior parte dei suoi coetanei a causa della lingua. Abbiamo iniziato a cercare modi per aiutarla a imparare a parlare.

È diventato chiaro che le app linguistiche per bambini non insegnano a parlare (e tutto è rimasto uguale nel tempo) e le app linguistiche per adulti come Duolingo non funzionano per i bambini a causa della UX. Quindi, abbiamo iniziato a seguire lezioni su piattaforme che mettono in contatto i bambini con insegnanti dal vivo tramite videoconferenza. Esempi sono Cambly, VipKid, Novakid, GoStudent, ecc. Osservando Sofia imparare virtualmente con tutor dal vivo, ho visto il vantaggio dell'attenzione 1:1 e della pratica di conversazione attiva, ma ho anche visto i difetti di questi programmi in generale.

Ad esempio, man mano che crescono, molte piattaforme di tutoraggio online e scuole online devono assumere persone senza background pedagogico, competenze nell’insegnamento ai bambini o persino un adeguato livello di conoscenza dell’inglese. Pertanto, per garantire una certa qualità dell’istruzione, le piattaforme online e le scuole stabiliscono rigorosamente il curriculum e i programmi delle lezioni, e gli insegnanti devono utilizzare esercizi preimpostati, inclusi frammenti audio e video. Quindi, sfortunatamente, su molte piattaforme i tutor funzionano sostanzialmente come robot.

Tuttavia, il tutoraggio online è stato l’unico modo per la maggior parte delle persone di imparare a PARLARE l’inglese, soprattutto nei paesi non anglofoni. Ma in parte a causa della carenza di insegnanti, è troppo costoso per la maggior parte delle famiglie. Imparare con insegnanti dal vivo è un servizio educativo premium che poche famiglie possono permettersi.

Il mio co-fondatore e io siamo giunti alla conclusione che il tutoraggio basato sull'intelligenza artificiale è l'unico modo scalabile per fornire tutoraggio 1:1 in lingua inglese a ogni bambino in tutto il mondo. Presto abbiamo imparato che è il migliore anche dal punto di vista educativo. Quando abbiamo considerato i primi prototipi di Buddy, ci siamo ispirati alla ricerca nel campo degli esseri umani virtuali nell'istruzione.

Gli studi accademici mostrano i vantaggi educativi e la superiorità degli agenti pedagogici animati rispetto agli strumenti e agli ambienti di apprendimento più tradizionali. Ad esempio, vedi Interazione faccia a faccia con agenti pedagogici, vent'anni dopo, un articolo del 2016 che offre una panoramica del settore e cita molto materiale pertinente. Ecco una citazione:

“In particolare, la meta-analisi ha rilevato che gli agenti migliorano l’apprendimento rispetto agli ambienti di apprendimento che non prevedono agenti. […] Forse la cosa più interessante è stata la scoperta che, nell’istruzione formale, gli agenti pedagogici sembrano essere più efficaci per gli studenti più giovani che per quelli più anziani. […] gli studi hanno scoperto, ad esempio, che gli studenti che interagiscono con gli agenti pedagogici mostrano risultati di apprendimento più forti quando 1) gli agenti pedagogici parlano anziché comunicare con il testo, 2) gli agenti pedagogici usano gesti simili a quelli umani, 3) gli agenti pedagogici comunicano in modo conversazionale anziché formalmente, e 4) gli agenti pedagogici usano un fraseggio educato piuttosto che diretto. 

Ciò ha rafforzato la nostra fiducia nell’approccio multimodale di tutoraggio basato sull’intelligenza artificiale. Abbiamo deciso che Buddy sarebbe stato un tutor AI multimodale, un agente pedagogico animato in grado di riconoscere la voce ed elaborare il linguaggio naturale. Fondamentalmente, un sistema di tutoraggio AI è costituito da tre tecnologie principali:

  1. Riconoscimento vocale automatico (ASR) e analisi ci permettono di elaborare e analizzare il discorso dello studente.
  2. Elaborazione del linguaggio naturale (PNL), comprensione del linguaggio naturale e gestione del dialogo che elabora il contenuto del discorso dello studente e produce la risposta successiva. La risposta è costituita da componenti sia verbali che non verbali.
  3. Personaggio virtuale animato incarnato che fornisce sia il feedback di ascolto che la riproduzione della risposta del sistema. Il personaggio è animato in modo procedurale: il sistema crea animazioni al volo dalla risposta della PNL.

Tutti e tre i componenti sono cruciali per il nostro approccio perché solo insieme ci consentono di creare un tutor coinvolgente e interattivo e di offrire un'esperienza educativa di successo.

Mia figlia Sofia e il figlio del mio co-fondatore, Arseny, sono diventati i primi utenti di Buddy. Sofia ha utilizzato le prime versioni di Buddy fino alla prima elementare.

Diversi anni dopo, la mia figlia più piccola Alisa ha iniziato a usare Buddy all'età di tre anni, quando andava all'asilo. Ora frequenta la scuola materna di transizione e gioca con Buddy quasi ogni giorno. Quando Alisa iniziò a studiare con Buddy, aveva diversi problemi di linguaggio, quindi Buddy per la maggior parte del tempo non la capiva. Ma dopo un paio di settimane di pratica, non solo il suo inglese ma anche il suo modo di parlare sono migliorati, mentre faceva del suo meglio per farsi capire da Buddy.

Perché i metodi tradizionali di insegnamento di una seconda lingua sono così inefficaci?

Oggi ci concentriamo sulla risoluzione di particolari problemi educativi legati alla parola. Non puoi imparare a parlare senza esercitarti nel parlare:

  • La maggior parte degli strumenti educativi tradizionali si concentra sull’insegnamento di altre abilità linguistiche come la lettura o la scrittura.
  • Le app linguistiche per bambini non insegnano abilità di conversazione.
  • Alcune app linguistiche per adulti oggi forniscono esercitazioni di conversazione utilizzando l'intelligenza artificiale, ma questi servizi non funzionano per i bambini a causa di UX, problemi di sicurezza e normative sulla privacy.
  • I tutor dal vivo sono troppo costosi per la maggior parte delle famiglie. Sfortunatamente, molti tutor non hanno una formazione pedagogica o non conoscono bene l'inglese.

Buddy è un tutor di intelligenza artificiale multimodale.

  • È superiore alle tradizionali app di apprendimento perché funziona come un insegnante dal vivo in molti modi. Permettetemi di citare uno dei nostri consulenti, il Dr. Alex Desatnik, PhD, University College London:

“Tutor virtuale basato sulla voce. Questo concetto può sembrare semplice, ma dietro c’è la scienza. Dal punto di vista della psicologia dell'apprendimento, il personaggio parlante virtuale è l'incarnazione dell'insegnante. Questo approccio crea un effetto chiamato fiducia epistemica, rafforzando la motivazione e l’impegno dello studente e migliorando i risultati dell’apprendimento”.

  • Il compagno ha alcuni vantaggi anche rispetto agli insegnanti umani. Buddy non giudica e per alcuni bambini è più facile iniziare a parlare con Buddy che con un insegnante. Ecco perché oggi molti tutor usano Buddy come un rompighiaccio che aiuta i bambini a superare la paura e il disagio e a iniziare a parlare la lingua.

Buddy lavora per aiutare gli insegnanti, non per sostituirli.

Penso che sia molto importante notare questo. Buddy può aiutare gli insegnanti ad automatizzare la parte banale del loro lavoro, fornendo pratica regolare. Vogliamo dare potere agli insegnanti della scuola. Buddy è come un team di tutor e assistenti dell'insegnante, che lavora individualmente con ogni bambino della classe e riferisce all'insegnante della classe.

Puoi parlare di come Buddy utilizza gli elementi di ludicizzazione per mantenere i bambini entusiasti dell'apprendimento?

Curiosità: l'app mobile di Buddy è stata scaricata 22 milioni di volte nel 2023 e oltre il 70% di questi download sono stati effettuati da bambini. Per i bambini, la nostra App è un gioco in cui giocano con Buddy, il loro amico virtuale parlante e un popolare Youtuber. I bambini scaricano l'App e convincono i genitori a pagare un abbonamento, spiegando che Buddy è un insegnante.

Per far funzionare questo approccio, stiamo progettando Buddy come un gioco con una storia e un universo. Lavoriamo con disegnatori e scrittori di personaggi di Hollywood per creare Buddy e la sua storia. Abbiamo un team di progettazione di giochi molto forte che lavora direttamente con i nostri educatori e trasforma programmi ed esercizi in minigiochi nel mondo di Buddy.

Quali sono le altre funzionalità principali che rendono Buddy così potente nell'insegnamento di una seconda lingua?

La nostra funzionalità principale è in realtà focalizzata su Buddy come tutor AI multimodale:

  • Il riconoscimento vocale
  • AI conversazionale
  • Comportamento visivo dell'avatar

Quali sono alcuni degli algoritmi di apprendimento automatico utilizzati da Buddy?

Stiamo sviluppando l'intero pacchetto di tecnologie, lavorando insieme per abilitare il nostro approccio multimodale di tutoraggio basato sull'intelligenza artificiale.

  • BSR (Buddy's Speech Recognition) è un motore di riconoscimento vocale proprietario specifico per lavorare con il parlato accentato dei bambini e rispettare normative come COPPA.
  • BLM (Modello linguistico di Buddy) - Motore di intelligenza artificiale conversazionale per bambini. Sicuro, veloce e libero di operare. Si concentra su funzionalità educative specifiche ed è molto meno versatile rispetto ai modelli linguistici di grandi dimensioni.
  • BABE (Motore comportamentale avatar di Buddy). Questa tecnologia genera il comportamento visivo del nostro personaggio in base al contesto della conversazione. Buddy capisce quando ha bisogno di sorridere, cambiare colore o mettersi uno stupido cappello.

Molti sistemi di riconoscimento vocale hanno problemi con gli accenti, soprattutto per i bambini piccoli, come fa Buddy a superare queste sfide?

Sviluppando BSR, la nostra tecnologia proprietaria di riconoscimento vocale.

Il nostro pubblico e il nostro mercato unici richiedevano lo sviluppo di una tecnologia proprietaria. Buddy deve riconoscere il parlato con forte accento dei giovani studenti di inglese come lingua straniera (EFL). Un altro fattore complicante è che gli studenti principianti iniziano imparando parole separate, spesso brevi, che sono molto difficili da riconoscere senza contesto. Infine, il mercato dei bambini è altamente regolamentato e il riconoscimento vocale è soggetto al Children Online Privacy Protection Act (COPPA) poiché le registrazioni vocali sono considerate Informazioni di identificazione personale (PII).

BSR gestisce il parlato dei bambini con accenti diversi, prodotto su una varietà di dispositivi mobili con microfoni di varie qualità acustiche e in ambienti di vita reale con molti tipi di rumore di fondo. Ed è conforme al COPPA in base alla progettazione.

Lavorando a livello globale, siamo riusciti ad accumulare un set di dati unico su cui addestrare il nostro modello. Oggi, la BSR supera le soluzioni commerciali standard nel riconoscere e comprendere il parlato accentato dei bambini.

Come pensate di espandere la penetrazione del mercato per raggiungere i genitori che potrebbero non avere familiarità con la tecnologia dell'intelligenza artificiale?

Buddy ha iniziato a vedere il successo prima che l'intelligenza artificiale diventasse una parola d'ordine e la maggior parte dei nostri utenti non sono i tipici primi ad adottare la tecnologia. Stiamo risolvendo con successo un importante problema educativo e si dà il caso che utilizziamo l’intelligenza artificiale per questo.

Tuttavia, una delle sfide che affrontiamo è fare in modo che i genitori trattino l'apprendimento con Buddy con la stessa serietà con cui lo fanno con un tutor dal vivo: non saltare le lezioni, rispettare un programma, ecc. L'attuale rivoluzione dell'intelligenza artificiale sembra aiutare in questo.

Direi che il prossimo grande passo per noi è iniziare a lavorare più a stretto contatto con insegnanti e scuole. Stiamo conducendo una partnership pilota con una scuola in Brasile e stiamo discutendo di partnership con una dozzina di altre istituzioni educative.

Qual è la tua visione per il futuro dei tutor di intelligenza artificiale e dell'istruzione in generale?

I tutor dell’intelligenza artificiale sono il modo migliore e l’unico scalabile per risolvere il problema educativo numero 1 dell’umanità: la carenza globale di insegnanti. Abbiamo bisogno di circa 69 milioni di nuovi insegnanti per rispondere solo ai bisogni di apprendimento di base. Per le materie che richiedono tutoraggio individuale, come l’apprendimento delle lingue, il problema è molto peggiore.

La rivoluzione dell’intelligenza artificiale ha accelerato lo sviluppo di tutor di intelligenza artificiale, anche se principalmente nel segmento degli adulti utilizzando soluzioni standardizzate, mentre l’apprendimento precoce rimane drammaticamente sottoservito. Siamo orgogliosi di essere pionieri del tutoraggio dell’intelligenza artificiale per i bambini piccoli.

Per quanto riguarda il nostro futuro, Buddy ha iniziato come tutor per l'apprendimento delle lingue, ma a lungo termine diventerà una piattaforma di tutoraggio basata sull'intelligenza artificiale che insegna un'ampia varietà di materie a bambini sotto i 12 anni. Abbiamo già iniziato a lanciare una prima versione del nostro primo non- corso di lingua – il curriculum di preparazione scolastica per i bambini statunitensi. Vediamo Buddy come l'assistente didattico del bambino, che cresce con un bambino dai 3 ai 4 anni e insegna più corsi per molti anni.

Grazie per l'ottima intervista, i lettori che desiderano saperne di più dovrebbero visitare Amico AI.

Socio fondatore di unite.AI e membro di Consiglio tecnologico di Forbes, Antonio è un futurista che è appassionato del futuro dell'intelligenza artificiale e della robotica.

È anche il Fondatore di Titoli.io, un sito web che si concentra sugli investimenti in tecnologie dirompenti.