Haastattelut

James Kaplan, CEO & Co-Founder of MeetKai Metaverse – Haastattelusarja

Published January 21, 2022

Updated April 28, 2026

Antoine Tardif, CEO & Founder of Unite.AI

James Kaplan on MeetKai:n toimitusjohtaja ja yksi perustajista, joka on tekoäly-, VR- ja keskusteluhakuyritys Los Angelesissa, Kaliforniassa, ja johtaa tällä hetkellä älypuhelimen ääniohjauksen kilpailua aikaisemmin näkemättömillä ominaisuuksilla. Sen keskustelutekoäly pystyy ymmärtämään monimutkaisempaa puhetta ja antamaan henkilökohtaisia tuloksia luonnollisessa keskustelussa monista aiheista eri todellisuuksissa. MeetKai:n teknologia on otettu käyttöön maailmanlaajuisesti iOS:n, Google Playn ja AppGalleryn kautta.

Sinulla oli intohimo älykkääseen tekniikkaan jo 6-vuotiaana, miten sinä tutustuit tähän teknologiaan?

Minun tutustuminen älykkäisiin tekniikoihin tuli videopelien kautta. Ensinnäkin se oli ymmärtämällä, miten älykkäät tekniikat toimivat pelissä Oregon Trail – ei niin älykäs, mutta silti älykkään tekniikan muoto. Siitä eteenpäin minun kiinnostukseni älykkäisiin tekniikoihin kasvoi, kun pääsin mukaan MMORPG-peleihin. Pidin pelaamisesta online-pelejä, mutta inhouin etsintää esineitä. Sen vuoksi aloin kirjoittaa bottien koodia.

Mitkä olivat ensimmäiset älykkäät sovellukset, joita sinä koodasit?

MMO-peleihin bottien kirjoittaminen oli todella ensimmäinen askel, jonka tein älykkään tekniikan kehittämiseksi. Aluksi botit olivat melko yksinkertaisia ja lähempänä makroja kuin älykkäitä tekniikoita. Mutta kun minä vanhenin ja botin havaitseminen parani monissa peleissä, tämä alkoi vaatia, että botit näyttävät enemmän kuin pelaajalta. Olen aina nauttinut bottien kirjoittamisesta – lopulta kirjoitin botin, joka voitti Taylor Swift -kilpailun, kun olin koulussa (ja hän tuli itse esittämään!). Samoin kirjoitin ensimmäisen Pokémon Go -botin ja katuin, kun menetin kiinnostukseni salakuuntelun välttämiseen.

Sinä perustit MeetKai:n vuonna 2018, kun olet pettynyt nykyisiin älykkäisiin ääniohjaimiin. Miksi useimmat älykkäät avustajat tarjoavat heikkoeluisen kokemuksen?

Ongelman ydin on, että useimmat älykkäät avustajat riippuvat liiaksi ulkoisista API:sta täyttämiseksi. Vaikka he hallitsevat täyttämistä, kuten Alexa e-commerce-haun kohdalla, he kärsivät samoista ongelmista. Yksinkertaisesti sanottuna, miten voit odottaa älykkään ääniohjaimen olevan älykäs, kun se vain muuttaa puhetta tekstimuotoon ja laittaa tekstin tekstipohjaiseen hakukoneeseen? Aloimme MeetKai:n ajatuksella, että voimme tarjota “hyppäävän” älykkään avustajan hallitsemalla koko loppupään prosessointiputkea, joka muodostaa ääniohjaimen. Kehittimme keskusteluhakukoneen sijaan avainsanapohjaisen hakukoneen tukemaan monimutkaisempia kysymyksiä ja keskusteluja. Muut avustajat ovat jumissa heikkoeluisilla kokemuksilla, koska he eivät voi rakentaa monen käännön keskustelutukea näiden rajoittavien tekijöiden päälle. Vaikka tavoitteemme on päästä sinne, olemme edelleen hyvin varhaisessa vaiheessa teknologiamme laajentamisessa samanlaisiin alueisiin kuin olemassa olevat toimijat.

Mitkä ovat joitain luonnollisen kielen ymmärtämisen ja luonnollisen kielen prosessoinnin haasteita rakentamassa älykkään ääniohjaimen kokemusta?

Yksi ensisijaisista haasteista seuraavan sukupolven NLU:ssa on siirtyä intenttien ja entiteettien ulkopuolelle. Useimmat NLU:t keskittyvät perinteiseen lähestymistapaan kielen ymmärtämiseen. Jokainen syötteen lause klassifioidaan intentiksi, ja sitten tokenit sisällä merkitään entiteeteiksi sekvenssimallin avulla. Voisin luetella kymmeniä ongelmia tämän standardilähestymistavan kanssa. Mutta kriittisimmät ovat:

Intentin luokittelu, joka on kontekstivapaa, epäonnistuu monikäänteen keskustelun käsittelyssä. Useimmat lähestymistavat huolehtivat vain siitä, mitä käyttäjä on juuri kysynyt. He eivät välitä kontekstista – kuka käyttäjä on, mitä käyttäjä tykkää, vain siitä, mitä he juuri kysyivät. Tämä on erityisen tärkeää, kun käyttäjä sanoo jotain lyhyttä. Esimerkiksi, jos joku sanoo cosmopolitan, se voi tarkoittaa juomaa tai lehteä ja riippuu paljon henkilöstä.
Entiteettien tunnistusmallit tekevät huonon työn kaikessa, mitä ei ole kategorioiden arvo. Suuret kielimallit eivät pysty sopeutumaan nopeasti uusiin entiteetteihin, jotka ovat luonnonvaraisissa olosuhteissa, koska ne eivät ole datassa. Älykkäiden tekniikoiden on oltava paljon monimutkaisempi tapa tunnistaa entiteettejä ottaen huomioon paljon syvempi konteksti. Esimerkiksi käyttäjän sijainti tulisi vaikuttaa voimakkaasti siihen, onko jokin ravintola vai jotain muuta.
Entiteettien suhteita ei huomioida hyvin. Lempi-esimerkkini on, kuinka usein useimmat hakukoneet epäonnistuvat, kun on kyse negaatiosta. Yritä etsiä elokuvaa ilman romantiikkaa muilla ääniohjaimilla, ja näet, mitä tarkoitan.

Tällä hetkellä useimmat ääniohjaimet kääntävät äänen tekstimuotoon ja suorittavat Google-haun. Miten MeetKai AI toimii eri tavalla kuin tämä?

Pääasiallinen ero MeetKai:n ja Google:n välillä, kun on kyse hausta, on, että käytämme paljon rikkaampaa kielen ymmärtämismallia etsimään itse asiassa etsittäviä asioita eikä vain verkkosivuja. Kun etsit “Tom Cruise -elokuvia ilman toimintaa”, Google etsii sivuja, joilla on tämä joukko tokenia (Tom Cruise, elokuvat, toiminta). MeetKai:ssa ymmärrämme oikein, että Tom Cruise on näyttelijä, elokuvat ovat median luokkaa, jonka etsimme, ja toiminta on ei-toivottu genre. Tällä voimme suorittaa älykkäämpiä hakutoimia.

MeetKai julkaisi hiljattain ensimmäisen elämäntapaansa VR-maailman: MeetKai Metaverse. Voitko keskustella tästä sovelluksesta?

Useimmat yritykset metaversum-tilassa työskentelevät henkilökohtaisen vuorovaikutuksen parissa. Sen lisäksi sisältö on suurelta osin joko piirrosmaista tai on vain 360°-video. Tavoitteemme MeetKai Metaverse on keskittyä aivan toiseen kulmaan – henkilö-älykkäisiin tekniikoihin. Kehittämme metaversumia, jossa hahmot, joita olet vuorovaikutuksessa, ovat kaikki voimassa olevia älykkäiden tekniikoiden kautta. Lisäksi työskentelemme ympäristön proseduraalisella generoinnilla, jotta se olisi paljon realistisemman näköinen ja immersiivisempi verrattuna muihin yrityksiin tässä tilassa. Kaksi alkuperäistä maailmaa, joita voidaan tutkia metaversumissamme, ovat kahdelle alkuperäiselle käyttötarkoitukselle: meditaatiolle ja museoille. Ensimmäisessä olemme digitalisoinneet Wing Chun -asiantuntijan, ja ensimmäisen kerran loimme älykkään hahmon, joka pystyy opastamaan käyttäjiä vallankumouksellisilla meditaatiotekniikoilla rentoutumistilaan. Jälkimmäisessä olemme luoneet kasvavan taidemuseon ja tarjonneet älykkään kuraattorin, joka pystyy vastaamaan kysymyksiin taiteesta tilassa ja antamaan kierroksia.

Mitkä ovat esimerkkejä siitä, miten älykkäät tekniikat käytetään tässä Metaversumissa?

Käytämme älykkäitä tekniikoita kolmessa paikassa:

Voimakkaasti keskustelukykyjen kehittämiseksi jokaiselle hahmolle metaversumissamme.
Dynaamiseen sisällön luomiseen, joka on käyttäjille saatavilla ääniohjauksen kautta. Esimerkkejä tästä ovat meditaatiokeskukset ja taidemuseon kierrokset alkuperäisissä kokemuksissamme.
3D-tilan proseduraaliseen luomiseen ilman käsin asettelua.

Mikä on visiosi ääniohjaimien tulevaisuudesta?

Ääniohjaimien tulevaisuuden kannalta ne tarvitsevat kehittyä joksikin paljon enemmän kuin komentopohjaisiksi järjestelmiksi. Tämä tarkoittaa saavuttamista syvää asiantuntemusta ja kykyjä monissa erityisissä aloissa. Uskon, että eri alojen mukautettujen ääniohjaimien kokoaminen on avain rakentaa kaiken älykkään meta-apuohjain. Tämä on vastakohtainen yrityksille “tehdä kaikki kerran” joita olemme nähneet ääniohjaimien astuessa tilaan.

Onko mitään muuta, mitä haluaisit jakaa MeetKai:sta tai MeetKai Metaversesta?

Olemme edelleen hyvin alussa metaversum-suunnitelman parissa. Lopullinen tavoitteemme on, että haluamme pystyä replikoimaan minkä tahansa kokemuksen, jonka sinulla on todellisessa maailmassa, metaversumissa, ja mennä senkin yli. Tämä tarkoittaa, että haluamme poistaa kustannus- ja aikarajoitukset, jotka rajoittavat samoja kokemuksia todellisuudessa. Metaversumi voi antaa meille mahdollisuuden elää rikkaampaa elämää, ei korvata sitä. Meillä on useita teknisiä haasteita, jotka on vielä ratkaistava, mutta meillä on selkeä joukko saavutettavia merkkipaaluja olettaen, että laitteisto jatkaa parantumista. Työskentelemme läheisesti laitteistoyritysten kanssa varmistaaksemme, että VR-tila etenee nopeasti. VR:n ulkopuolella haluamme tehdä metaversumi-kokemuksen mahdolliseksi. Ilmoitamme lisää tietoa tästä kuukausien sisällä.

Kiitos haastattelusta, odotan innostuneena seuraavansa etenemistänne Metaversumi-versiossa. Lukijat, jotka haluavat oppia lisää, voivat vierailla MeetKai:ssa.

Antoine Tardif, CEO & Founder of Unite.AI

Antoine on visionäärinen johtaja ja Unite.AI:n perustajakumppani, jota ohjaa horjumaton intohimo muokata ja edistää tulevaisuuden tekoälyä ja robottiikkaa. Sarjayrittäjänä hän uskoo, että tekoäly tulee olemaan yhtä mullistava yhteiskunnalle kuin sähkö, ja hänestä usein kuuluu ylistyksiä mullistavien teknologioiden ja AGI:n mahdollisuuksista.
Hänen ollessaan futuristi, hän on omistautunut tutkimiseen, miten nämä innovaatiot muokkaavat maailmaamme. Lisäksi hän on Securities.io:n perustaja, joka on alusta, joka keskittyy sijoittamiseen uraauurtaviin teknologioihin, jotka määrittelevät uudelleen tulevaisuuden ja muokkaavat koko sektoreita.

Unite.AI

James Kaplan, CEO & Co-Founder of MeetKai Metaverse – Haastattelusarja

You may like