Інтерв’ю

Джеймс Каплан, CEO та співзасновник MeetKai Metaverse – Інтерв’ю Серія

Published January 21, 2022

Updated April 28, 2026

Antoine Tardif, CEO & Founder of Unite.AI

Джеймс Каплан – це CEO та співзасновник MeetKai, компанії штучного інтелекту, VR та розмовного пошуку, що базується в Лос-Анджелесі, Каліфорнія, яка зараз лідирує в гонці штучного інтелекту зі ще не баченими особливостями. Її розмовний штучний інтелект може зрозуміти більш складну мову та надати персоналізовані результати в природній розмові про багато предметів у різних реальностях. Технологія MeetKai розгорнута по всьому світу через iOS, Google Play та AppGallery.

У вас була пристрасть до штучного інтелекту з раннього віку 6 років, як ви вперше познайомились з цією технологією?

Моє знайомство зі штучним інтелектом відбулось через відеоігри. Спочатку це було через спроби зрозуміти, як працює штучний інтелект у грі Oregon Trail – не дуже розумний, але все ж таки форма штучного інтелекту. Відтоді мій інтерес до штучного інтелекту зростав далі, коли я почав грати в MMORPG. Мені дуже подобалось грати в онлайн-ігри, але я ненавидів фармити предмети. Тому я почав писати боти.

Які були деякі з перших застосунків штучного інтелекту, які ви написали?

Писання ботів для MMO було справді моєю першою спробою розробити певну форму штучного інтелекту. Спочатку мої боти були досить простими та ближче до макросів, ніж штучний інтелект. Але коли я став старшим, а виявлення ботів у багатьох іграх стало кращим, це почало вимагати, щоб боти виглядали все більш і більш як гравець. Мені завжди подобалось писати боти – я навіть написав бота, щоб виграти конкурс Тейлор Свіфт, коли я був у школі (і вона навіть прийшла виконати!). Так само я написав перший бот для Pokémon Go і, на жаль, багатьох людей забанили, коли я втратив інтерес до ухилення від виявлення.

Ви запустили MeetKai у 2018 році після розчарування поточними голосовими помічниками штучного інтелекту. Чому більшість помічників штучного інтелекту пропонують посередній досвід?

Сердце проблеми полягає в тому, що більшість помічників штучного інтелекту залежать надто сильно від зовнішніх API для виконання. Навіть коли вони контролюють виконання, наприклад, Alexa для пошуку електронної комерції, вони страждають від тих самих проблем. Просто кажучи, як можна очікувати, що голосовий помічник буде розумним, коли все, що він робить, це перетворює мову на текст і кладе цей текст у текстовий пошуковий двигун? Ми почали MeetKai з ідеєю, що ми могли б надати “стрибок” помічника штучного інтелекту, контролюючи весь кінцевий процес обробки, який складає голосовий помічник. Ми розробили пошуковий двигун розмовної мови, а не ключових слів, щоб підтримувати більш складні запити та розмови. Інші помічники застряли в посередньому досвіді, оскільки вони не можуть побудувати багатотурну розмовну підтримку на основі таких обмежуючих факторів. Хоча наша мета – досягти цього, ми все ще перебуваємо на дуже ранній стадії масштабування нашої технології для виконання того самого числа доменів, що й існуючі гравці.

Які деякі з природної мови розуміння та природної мови обробки викликів за будівництво державної розмовної помічника досвід?

Одним з основних викликів наступного покоління NLU є рух за межі намірів та сутностей. Більшість NLU зосереджена на традиційному підході до розуміння мови. Кожен вхідний вираз класифікується на намір, а потім токени всередині позначаються як сутності за допомогою моделі послідовної маркування. Я міг перелічити десятки проблем з цим стандартним підходом. Однак найбільш критичні з них:

Класифікація намірів, яка є контекстно-вільною, не може обробляти багатотурну розмову. Більшість підходів лише турбуються про суровий текст, який був транскрибований. їм не важливо контекст – ні хто користувач, ні що йому подобається, лише те, про що він тільки що запитав. Це особливо важливо, коли користувач говорить щось коротке. Наприклад, якщо хтось говорить “космополіт”, це може означати як напій, так і журнал, і сильно залежить від людини.
Моделі розпізнавання сутностей роблять погану роботу з будь-чим, що не є категоріальною вартістю. Великі мовні моделі не можуть адаптуватися досить швидко до нових сутностей, які перебувають у дикій природі, оскільки вони не перебувають у наборі даних. Штучний інтелект повинен мати набагато більш складний спосіб розпізнавання сутностей, розглядаючи набагато глибший контекст. Наприклад, розташування користувача повинно сильно впливати на те, чи є щось назвою ресторану, чи чимось іншим.
Відносини між сутностями не розглядаються добре. Мій улюблений приклад – це те, як часто більшість пошукових систем не справляються з запереченням. Спробуйте пошукати фільм без романтики на інших голосових помічниках, і ви побачите, про що я говорю.

На даний момент більшість голосових помічників просто перекладають голос у текст і проводять пошук Google. Як MeetKai AI працює інакше?

Основна різниця між MeetKai та Google у пошуку полягає в тому, що ми використовуємо набагато багатше мовне розуміння моделі для пошуку самих предметів, а не лише веб-сторінок. Коли ви шукаєте “фільми Тома Круза без дії”, Google шукає сторінки, які мають цей набір токенів на сторінці (Том Круз, фільми, дія). У MeetKai ми правильно розуміємо, що Том Круз – актор, фільми – клас медіа, який вони шукають, а дія – нежадана жанр. З цим ми можемо проводити набагато більш розумний пошук.

Meetkai недавно запустив свій перший лайфстайл VR-світ: MeetKai Metaverse. Чи можете ви обговорити, що це за застосунок?

Більшість компаній у сфері метавсесвіту працюють над взаємодією людини з людиною. Окрім цього, контент також в основному або карикатурний, або є просто 360° відео. Наша мета з MeetKai Metaverse – зосередитися на зовсім іншому куті – людині та штучному інтелекті. Ми розробляємо метавсесвіт, де персонажі, з якими ви взаємодієте, усі підключені до нашого передового розмовного штучного інтелекту. Крім того, ми працюємо над процедурною генерацією середовища, щоб зробити його набагато більш реалістичним та зануреним порівняно з іншими компаніями в цьому просторі. Два початкових світу, доступні для дослідження в нашому метавсесвіті, призначені для двох початкових випадків використання: медитації та музеїв. У першому випадку ми оцифрували експерта Вінг Чун, і вперше ми створили штучний інтелект-персонаж, який здатний інструктувати користувачів, як використовувати революційні медитаційні техніки для входу в стан релаксації. У другому випадку ми створили постійно зростаючий художній музей і надали штучний інтелект-куратор, здатний відповідати на питання про мистецтво в просторі та надавати тури.

Які деякі приклади того, як штучний інтелект використовується в цьому Метавсесвіті?

Ми використовуємо штучний інтелект у трьох місцях:

Щоб надати розмовні можливості кожного персонажа в нашому метавсесвіті.
Щоб динамічно створювати контент, який надається користувачеві через голосове керівництво. Приклади цього включають сеанси медитації та тури художніх галерей у наших початкових двох досвідах.
Щоб створити 3D-простір процедурно, а не вимагати ручної розкладки.

Яка ваша бачення майбутнього голосових помічників?

Для того, щоб голосові помічники мали майбутнє, їм потрібно еволюціонувати в щось значно більше, ніж командна система. Це означає отримання глибокої експертизи та можливостей у багатьох конкретних доменах. Я думаю, що збір різних домен-специфічних голосових помічників буде ключем до будівництва всезнаючого мета-помічника. Це в різкій відмінності від спроб “зробити всеразу” тих, яких ми бачили з тих пір, як голосові помічники вперше увійшли в простір.

Чи є щось ще, що ви хотіли б поділитися про MeetKai або MeetKai Metaverse?

Ми все ще перебуваємо на дуже початку нашої дорожньої карти метавсесвіту. Наша кінцева мета полягає в тому, щоб ми могли реплікувати будь-який досвід, який ви маєте у реальному світі з метавсесвітом, а потім піти далі. Це означає, що ми хочемо ліквідувати витрати та часові обмеження, які обмежують ті самі досвіди в реальності. Метавсесвіт може дозволити нам жити значно багатшим життям, не замінюючи їх. У нас все ще є кілька технічних викликів, які потрібно вирішити, однак у нас є чіткий набір орієнтирів, які можна досягти, припускаючи, що апаратне забезпечення продовжить покращуватися. Ми працюємо в тісній співпраці з апаратними партнерами, щоб забезпечити, що простір VR рухається вперед швидко. Окрім VR, ми хочемо зробити наш досвід метавсесвіту можливим поза VR. Ми оголосимо більше інформації про це в наступних місяцях.

Дякую за велике інтерв’ю, я з нетерпінням чекаю вашого прогресу щодо вашої версії метавсесвіту. Читачам, які бажають дізнатися більше, слід відвідати MeetKai.

Antoine Tardif, CEO & Founder of Unite.AI

Антуан є видним лідером і засновником Unite.AI, який рухає невпинною пристрастю до формування та просування майбутнього штучного інтелекту та робототехніки. Як серійний підприємець, він вважає, що штучний інтелект буде таким же революційним для суспільства, як і електрика, і часто захоплюється потенціалом деструктивних технологій та AGI.

Як футуролог, він присвячений дослідженню того, як ці інновації сформують наш світ. Крім того, він є засновником Securities.io, платформи, орієнтованої на інвестування в передові технології, які переінакшують майбутнє та змінюють цілі сектори.

Unite.AI

Джеймс Каплан, CEO та співзасновник MeetKai Metaverse – Інтерв’ю Серія

You may like