Connect with us

Ivan Crewkov CEO & Co-Founder của Buddy AI – Loạt Phỏng Vấn

Phỏng vấn

Ivan Crewkov CEO & Co-Founder của Buddy AI – Loạt Phỏng Vấn

mm

Ivan Crewkov là CEO & Co-Founder của Buddy AI, giáo viên ảo trò chuyện đầu tiên trên thế giới cho trẻ em, với sứ mệnh đảm bảo tất cả học sinh có thể đủ khả năng chi trả cho việc học tiếng Anh 1:1. Sau khi chuyển đến Mỹ từ Siberia, Ivan chứng kiến con gái mình đang học mẫu giáo gặp khó khăn khi học tiếng Anh. Điều này đã truyền cảm hứng cho anh xây dựng Buddy, một nhân vật hư cấu mà trẻ em có thể thực sự trò chuyện thông qua sức mạnh của trí tuệ nhân tạo generative.

Kể từ khi ra mắt vào năm 2020, ứng dụng Buddy đã giành được nhiều giải thưởng và đứng đầu bảng xếp hạng trong danh mục Trẻ em và Giáo dục của App Store với hơn 36M lượt tải xuống trên toàn thế giới.

Vào năm 2014, bạn đã ra mắt Cubic.ai, một trong những loa thông minh và ứng dụng trợ lý giọng nói đầu tiên cho các ngôi nhà thông minh. Những kết luận chính mà bạn đã rút ra từ kinh nghiệm này là gì?

Tôi không chắc mình có thể nhận được tín nhiệm cho việc ra mắt Cubic.ai. Tôi đã gia nhập công ty một năm sau khi nó được thành lập và nhận được chức danh đồng sáng lập vì những đóng góp của mình.

Dưới đây là những kết luận chính:

  • Phần cứng rất khó, nhưng ai đó vẫn phải làm điều đó. Việc đảm bảo tài trợ vốn đầu tư mạo hiểm cho các công ty khởi nghiệp phần cứng là cực kỳ khó khăn. Điều duy nhất làm cho mọi thứ dễ dàng hơn một chút là tài trợ từ cộng đồng.
  • Không gian của các sản phẩm Voice-first rất rộng lớn và đa dạng. Những gì áp dụng cho các ngôi nhà thông minh không áp dụng cho việc học sớm, từ công nghệ đến thiết kế UX.

Bạn có thể chia sẻ câu chuyện về sự ra đời của Buddy và cách nó xuất phát từ việc gia đình bạn chuyển đến Mỹ từ Siberia?

Với Cubic.ai, tôi đã chuyển từ Siberia đến Mỹ vào năm 2014 và mang gia đình tôi theo. Con gái lớn của tôi Sofia bắt đầu học tiếng Anh như một ngôn ngữ thứ hai khi cô vào trường mẫu giáo ở Mountain View, California, ở tuổi 4. Sofia gặp khó khăn trong việc bắt đầu nói tiếng Anh trong 3 – 5 tháng đầu tiên ở trường mẫu giáo. Chúng tôi lo lắng vì cô không thể tìm được bạn bè và chơi với hầu hết các bạn cùng trang lứa vì ngôn ngữ. Chúng tôi bắt đầu tìm cách giúp cô học nói.

Điều đó trở nên rõ ràng rằng các ứng dụng ngôn ngữ cho trẻ em không dạy nói (và mọi thứ vẫn còn như cũ theo thời gian), và các ứng dụng ngôn ngữ cho người lớn như Duolingo không hoạt động cho trẻ em vì UX. Vì vậy, chúng tôi bắt đầu tham gia các bài học trên các nền tảng kết nối trẻ em với các giáo viên trực tiếp thông qua hội nghị truyền hình. Ví dụ như Cambly, VipKid, Novakid, GoStudent, v.v. Khi tôi quan sát Sofia học với các giáo viên trực tuyến, tôi thấy lợi ích của sự chú ý 1:1 và thực hành nói tích cực, nhưng cũng thấy những hạn chế của các chương trình này nói chung.

Ví dụ, khi họ mở rộng quy mô, nhiều Nền tảng Tutoring Trực tuyến và Trường Trực tuyến phải thuê những người không có nền tảng giáo dục, kỹ năng giảng dạy cho trẻ em hoặc thậm chí trình độ tiếng Anh phù hợp. Vì vậy, để đảm bảo chất lượng giáo dục nhất định, các nền tảng và trường học trực tuyến nghiêm ngặt kịch bản chương trình và kế hoạch bài học, và giáo viên phải sử dụng các bài tập đã được lập trình sẵn, bao gồm cả các mảnh âm thanh và video. Vì vậy, đáng tiếc, trên nhiều nền tảng, các giáo viên cơ bản làm việc như các bot.

Tuy nhiên, việc học trực tuyến đã là cách duy nhất để hầu hết mọi người học nói tiếng Anh, đặc biệt là ở các quốc gia không nói tiếng Anh. Nhưng một phần vì sự thiếu hụt giáo viên, nó quá đắt đối với hầu hết các gia đình. Học với các giáo viên trực tiếp là một dịch vụ giáo dục cao cấp mà ít gia đình có thể đủ khả năng chi trả.

Tôi và đồng sáng lập của tôi đã đến kết luận rằng việc học với AI là cách duy nhất có thể mở rộng để cung cấp hướng dẫn nói tiếng Anh 1:1 cho mọi trẻ em trên toàn thế giới. Sớm sau đó, chúng tôi đã học được rằng nó cũng là tốt nhất từ góc độ giáo dục. Khi chúng tôi đang xem xét các nguyên mẫu đầu tiên của Buddy, chúng tôi đã được truyền cảm hứng bởi nghiên cứu trong lĩnh vực Con người ảo trong Giáo dục.

Các nghiên cứu học thuật cho thấy các tác nhân giáo dục hoạt hình có lợi thế giáo dục và vượt trội so với các công cụ và môi trường học tập truyền thống. Ví dụ, hãy xem Tương tác Trực diện với Các Tác nhân Giáo dục, Hai Mươi Năm Sau, một bài viết năm 2016 tổng quan về lĩnh vực này và trích dẫn nhiều tài liệu liên quan. Dưới đây là một trích dẫn:

“Cụ thể, phân tích meta cho thấy rằng các tác nhân thực sự tăng cường việc học so với các môi trường học tập không có tác nhân. […] Có lẽ điều thú vị nhất là việc tìm thấy rằng, trong giáo dục chính thức, các tác nhân giáo dục dường như hiệu quả hơn đối với người học trẻ hơn là người học lớn tuổi. […] Các nghiên cứu đã tìm thấy, ví dụ, rằng học sinh tương tác với các tác nhân giáo dục thể hiện kết quả học tập mạnh mẽ hơn khi 1) các tác nhân giáo dục nói thay vì giao tiếp bằng văn bản, 2) các tác nhân giáo dục sử dụng cử chỉ giống con người, 3) các tác nhân giáo dục giao tiếp theo cách trò chuyện chứ không phải正式, và 4) các tác nhân giáo dục sử dụng cách nói lịch sự thay vì trực tiếp.”

Điều này đã củng cố niềm tin của chúng tôi vào cách tiếp cận hướng dẫn AI đa phương tiện. Chúng tôi đã quyết định rằng Buddy sẽ là một hướng dẫn AI đa phương tiện – một tác nhân giáo dục hoạt hình có khả năng nhận dạng giọng nói và xử lý ngôn ngữ tự nhiên. Ở cốt lõi của nó, một hệ thống hướng dẫn AI bao gồm ba công nghệ chính:

  1. Nhận dạng và phân tích giọng nói tự động (ASR) cho phép chúng tôi xử lý và phân tích giọng nói của học sinh.
  2. Xử lý ngôn ngữ tự nhiên (NLP), hiểu ngôn ngữ tự nhiên và quản lý đối thoại xử lý nội dung của giọng nói của học sinh và tạo ra phản hồi tiếp theo. Phản hồi bao gồm cả thành phần lời nói và không lời nói.
  3. Nhân vật ảo hoạt hình cung cấp cả phản hồi lắng nghe và phát lại phản hồi của hệ thống. Nhân vật được hoạt hình hóa theo thủ tục – hệ thống tạo ra hoạt hình trên cơ sở phản hồi NLP.

Tất cả三个 thành phần đều quan trọng đối với cách tiếp cận của chúng tôi vì chỉ khi kết hợp chúng mới cho phép chúng tôi xây dựng một hướng dẫn tương tác và thú vị và cung cấp một trải nghiệm giáo dục thành công.

Con gái của tôi Sofia và con trai của đồng sáng lập tôi Arseny đã trở thành những người dùng đầu tiên của Buddy. Sofia đã sử dụng các phiên bản đầu tiên của Buddy trong suốt lớp 1.

Một vài năm sau, con gái nhỏ của tôi Alisa bắt đầu sử dụng Buddy khi cô 3 tuổi khi vào trường mẫu giáo. Bây giờ, cô đang học lớp chuyển tiếp và chơi với Buddy gần như mọi ngày. Khi Alisa bắt đầu học với Buddy, cô có một số vấn đề về nói, vì vậy Buddy không hiểu cô hầu hết thời gian. Nhưng sau một vài tuần thực hành, không chỉ tiếng Anh của cô mà cả cách nói của cô đã cải thiện, vì cô cố gắng hết sức để làm cho Buddy hiểu cô.

Tại sao các phương pháp giảng dạy ngôn ngữ thứ hai truyền thống lại không hiệu quả?

Hôm nay, chúng tôi tập trung vào việc giải quyết các vấn đề giáo dục cụ thể liên quan đến nói:

  • Đa số các công cụ giáo dục truyền thống tập trung vào việc giảng dạy các kỹ năng ngôn ngữ khác như đọc hoặc viết.
  • Các ứng dụng ngôn ngữ cho trẻ em không dạy kỹ năng nói.
  • Một số ứng dụng ngôn ngữ cho người lớn ngày nay cung cấp thực hành nói bằng AI, nhưng các dịch vụ này không hoạt động cho trẻ em vì UX, lo ngại về an toàn và quy định về quyền riêng tư.
  • Giáo viên trực tiếp quá đắt đối với hầu hết các gia đình. Đáng tiếc, nhiều giáo viên không có đào tạo về giáo dục hoặc không thành thạo tiếng Anh.

Buddy là một hướng dẫn AI đa phương tiện.

  • Nó vượt trội so với các ứng dụng học tập truyền thống vì nó hoạt động như một giáo viên trực tiếp theo nhiều cách. Hãy để tôi trích dẫn một trong những cố vấn của chúng tôi, Tiến sĩ Alex Desatnik, PhD, Đại học London:

“Giáo viên ảo dựa trên giọng nói. Khái niệm này có thể nghe đơn giản, nhưng có khoa học đằng sau nó. Từ góc độ tâm lý học của việc học, nhân vật nói ảo là hiện thân của giáo viên. Cách tiếp cận này tạo ra một hiệu ứng gọi là niềm tin nhận thức, tăng cường động lực và tham gia của học sinh, và cải thiện kết quả học tập.”

  • Buddy có một số lợi thế thậm chí vượt trội so với các giáo viên con người. Buddy không phán xét, và đối với một số trẻ em, nó làm cho việc bắt đầu nói với Buddy dễ dàng hơn so với nói với một giáo viên. Đó là lý do tại sao ngày nay, nhiều giáo viên sử dụng Buddy như một công cụ phá băng giúp trẻ em vượt qua nỗi sợ hãi và khó chịu và bắt đầu nói ngôn ngữ.

Buddy hoạt động để giúp giáo viên, không phải thay thế họ.

Tôi nghĩ điều này rất quan trọng. Buddy có thể giúp giáo viên tự động hóa phần việc nhàm chán của họ – cung cấp thực hành thường xuyên. Chúng tôi muốn trao quyền cho giáo viên trường học. Buddy giống như một đội giáo viên và trợ lý giáo viên, làm việc riêng với mỗi trẻ em trong lớp và báo cáo cho giáo viên lớp.

Bạn có thể thảo luận về cách Buddy sử dụng các yếu tố của trò chơi để giữ cho trẻ em hứng thú với việc học?

Sự thật thú vị: Ứng dụng di động của Buddy đã được tải xuống 22 triệu lần vào năm 2023, và hơn 70% trong số này được thực hiện bởi trẻ em. Đối với trẻ em, ứng dụng của chúng tôi là một trò chơi nơi chúng chơi với Buddy, bạn ảo nói chuyện và một YouTuber phổ biến. Trẻ em tải xuống ứng dụng và thuyết phục phụ huynh trả tiền cho một đăng ký, giải thích rằng Buddy là một giáo viên.

Để làm cho cách tiếp cận này hoạt động, chúng tôi đang thiết kế Buddy như một trò chơi với một câu chuyện và một vũ trụ. Chúng tôi làm việc với các nhà thiết kế nhân vật và nhà văn của Hollywood để tạo ra Buddy và câu chuyện của anh ấy. Chúng tôi có một đội thiết kế trò chơi rất mạnh mẽ làm việc trực tiếp với các nhà giáo dục của chúng tôi và biến chương trình và bài tập thành các trò chơi nhỏ trong thế giới của Buddy.

Điều gì là một số chức năng cốt lõi khác làm cho Buddy mạnh mẽ trong việc giảng dạy ngôn ngữ thứ hai?

Chức năng cốt lõi của chúng tôi thực sự tập trung vào Buddy như một hướng dẫn AI đa phương tiện:

  • Nhận dạng giọng nói
  • Trò chuyện AI
  • Hành vi hình ảnh của nhân vật

Điều gì là một số thuật toán học máy được sử dụng tại Buddy?

Chúng tôi đang phát triển toàn bộ ngăn xếp công nghệ, làm việc cùng nhau để cho phép cách tiếp cận hướng dẫn AI đa phương tiện của chúng tôi.

  • BSR (Nhận dạng giọng nói của Buddy) là một công cụ nhận dạng giọng nói độc quyền đặc biệt để làm việc với giọng nói của trẻ em có dấu và tuân thủ các quy định như COPPA.
  • BLM (Mô hình ngôn ngữ của Buddy) — Công cụ AI Trò chuyện cho Trẻ em. An toàn, nhanh chóng và miễn phí để vận hành. Nó tập trung vào chức năng giáo dục cụ thể và ít linh hoạt hơn so với các mô hình ngôn ngữ lớn.
  • BABE (Công cụ Hành vi Hình ảnh của Buddy). Công nghệ này tạo ra hành vi hình ảnh của nhân vật dựa trên ngữ cảnh của cuộc trò chuyện. Buddy hiểu khi nào cần mỉm cười, thay đổi màu sắc hoặc đội một chiếc mũ ngớ ngẩn.

Nhiều hệ thống nhận dạng giọng nói gặp khó khăn với giọng nói, đặc biệt là đối với trẻ em, làm thế nào Buddy vượt qua những thách thức này?

Bằng cách phát triển BSR, công nghệ nhận dạng giọng nói độc quyền của chúng tôi.

Khán giả và thị trường độc đáo của chúng tôi yêu cầu sự phát triển của công nghệ độc quyền. Buddy phải nhận dạng giọng nói có dấu cao của trẻ em học tiếng Anh như một ngôn ngữ nước ngoài (EFL). Một yếu tố phức tạp khác là học sinh bắt đầu bằng cách học các từ riêng lẻ, thường là ngắn, rất khó nhận dạng mà không có ngữ cảnh. Cuối cùng, thị trường trẻ em được quản lý chặt chẽ, và nhận dạng giọng nói phải tuân thủ Đạo luật Bảo vệ Quyền riêng tư Trẻ em Trực tuyến (COPPA) vì bản ghi âm giọng nói được coi là Thông tin Cá nhân Có thể Xác định (PII).

BSR xử lý giọng nói của trẻ em với các giọng nói khác nhau, được tạo trên nhiều thiết bị di động với micro có chất lượng âm thanh khác nhau và trong các môi trường thực tế với nhiều loại tiếng ồn nền. Và nó tuân thủ COPPA theo thiết kế.

Khi làm việc trên toàn cầu, chúng tôi đã tích lũy được một tập dữ liệu độc đáo để đào tạo mô hình của chúng tôi. Ngày nay, BSR vượt trội so với các giải pháp thương mại sẵn có trong việc nhận dạng và hiểu giọng nói của trẻ em có dấu.

Làm thế nào bạn lên kế hoạch mở rộng thâm nhập thị trường để nhắm vào các bậc cha mẹ có thể không quen thuộc với công nghệ AI?

Buddy đã bắt đầu thấy thành công trước khi AI trở thành một từ khóa, và hầu hết người dùng của chúng tôi không phải là những người dùng công nghệ sớm. Chúng tôi đang giải quyết một vấn đề giáo dục quan trọng, và nó chỉ xảy ra rằng chúng tôi đang sử dụng AI cho nó.

Tuy nhiên, một trong những thách thức chúng tôi đối mặt là làm cho phụ huynh coi việc học với Buddy nghiêm túc như với một giáo viên trực tiếp – không bỏ lỡ các bài học, tuân thủ lịch trình, v.v. Cuộc cách mạng AI hiện tại dường như đang giúp đỡ.

Tôi sẽ nói rằng bước tiếp theo lớn cho chúng tôi là bắt đầu làm việc chặt chẽ hơn với các giáo viên và trường học. Chúng tôi đang chạy một chương trình thử nghiệm với một trường học ở Brazil và đang thảo luận về các đối tác với một tá tổ chức giáo dục khác.

Ứng dụng tương lai của bạn cho các hướng dẫn AI và giáo dục nói chung là gì?

Các hướng dẫn AI là cách tốt nhất và duy nhất có thể mở rộng để giải quyết vấn đề giáo dục số 1 của nhân loại – sự thiếu hụt giáo viên toàn cầu. Chúng tôi cần khoảng 69 triệu giáo viên mới để giải quyết chỉ các nhu cầu học tập cơ bản. Đối với các môn học yêu cầu hướng dẫn 1:1, như học ngôn ngữ, vấn đề còn tồi tệ hơn.

Cuộc cách mạng AI đã tăng tốc sự phát triển của các hướng dẫn AI, mặc dù chủ yếu là trong phân khúc người lớn bằng cách sử dụng các giải pháp sẵn có, trong khi việc học sớm vẫn còn bị thiếu hụt nghiêm trọng. Chúng tôi tự hào là những người tiên phong trong lĩnh vực hướng dẫn AI cho trẻ em.

Về tương lai của chúng tôi, Buddy đã bắt đầu như một hướng dẫn ngôn ngữ, nhưng trong dài hạn, nó sẽ trở thành một nền tảng hướng dẫn AI giảng dạy nhiều môn học khác nhau cho trẻ em dưới 12 tuổi. Chúng tôi đã bắt đầu tung ra một phiên bản đầu tiên của khóa học không phải ngôn ngữ đầu tiên – Chương trình Chuẩn bị Trường học cho trẻ em Mỹ. Chúng tôi xem Buddy như một trợ lý học tập của trẻ em, lớn lên cùng trẻ em từ 3 đến 4 tuổi và giảng dạy nhiều khóa học trong nhiều năm.

Cảm ơn bạn vì cuộc phỏng vấn tuyệt vời, những người đọc muốn tìm hiểu thêm nên truy cập Buddy AI.

Antoine là một nhà lãnh đạo có tầm nhìn và là đối tác sáng lập của Unite.AI, được thúc đẩy bởi một niềm đam mê không ngừng nghỉ để định hình và thúc đẩy tương lai của AI và robot. Là một doanh nhân liên tục, ông tin rằng AI sẽ gây ra sự gián đoạn cho xã hội giống như điện, và thường bị bắt gặp nói về tiềm năng của các công nghệ gây gián đoạn và AGI.
Như một futurist, ông dành để khám phá cách những đổi mới này sẽ định hình thế giới của chúng ta. Ngoài ra, ông là người sáng lập của Securities.io, một nền tảng tập trung vào đầu tư vào các công nghệ tiên tiến đang định nghĩa lại tương lai và thay đổi toàn bộ lĩnh vực.