Intervjuer
James Kaplan, CEO & Co-Founder of MeetKai Metaverse – Intervju-serie

James Kaplan, er CEO & Co-Founder of MeetKai et selskap som jobber med kunstig intelligens, VR og konversasjonsbasert søk, med hovedkontor i Los Angeles, California, og som for øyeblikket leder AI-talekappløpet med aldri før sett funksjoner. Deres konversasjons-AI kan forstå mer komplekse uttrykk og gi personlige resultater i en naturlig samtale om mange emner, i forskjellige realiteter. MeetKais teknologi er distribuert globalt gjennom iOS, Google Play og AppGallery.
Du hadde en lidenskap for AI allerede i en alder av 6 år, hvordan ble du først introdusert for denne teknologien?
Min introduksjon til AI kom fra videospill. Først var det fra å prøve å forstå hvordan AI fungerte i spillet Oregon Trail – ikke særlig intelligent, men likevel en form for AI. Derfra vokste min interesse for AI videre da jeg begynte å spille MMORPG. Jeg likte virkelig å spille online-spill, men jeg hatet å jobbe for gjenstander. Derfor begynte jeg å skrive bots.
Hva var noen av de første AI-applikasjonene du kodet?
Å skrive bots for MMORPG var virkelig min første innføring i å utvikle en bestemt form for AI. I begynnelsen var mine bots ganske enkle og nærmere macros enn kunstig intelligens. Men da jeg ble eldre og da bot-deteksjon ble bedre i mange spill, begynte dette å kreve at botene måtte se mer og mer ut som en spiller. Jeg har alltid likt å skrive bots – jeg endte med å skrive en bot for å vinne en Taylor Swift-konkurranse mens jeg var på skolen (og hun kom faktisk til å opptre!). Likedan skrev jeg den første Pokémon Go-bot og fikk mange mennesker bannlyst når jeg mistet interessen for å unngå å bli oppdaget.
Du lanserte MeetKai i 2018 etter å ha blitt frustrert over nåværende AI-lydtjenere. Hvorfor tilbyr de fleste AI-tjenestene en mangelfull opplevelse?
Kjernen i problemet er at de fleste AI-tjenestene er for avhengige av eksterne API-er for oppfyllelse. Selv når de kontrollerer oppfyllelsen, som Alexa for e-handels-søk, lider de under de samme problemene. Enkelt uttrykt, hvordan kan du forvente at en lydtjeneste skal være smart når alt den gjør er å omdanne tale til tekst og sette denne teksten inn i en tekstbasert søkemotor? Vi startet MeetKai med ideen om at vi kunne tilby en “leapfrog”-AI-tjeneste ved å kontrollere hele sluttpunkt-til-sluttpunkt-prosessen som utgjør en lydtjeneste. Vi utviklet en konversasjonsbasert søkemotor i stedet for en nøkkelordbasert for å støtte mer kompliserte spørringer og samtaler. Andre tjenester er fastlåst med mangelfulle opplevelser fordi de ikke kan bygge multi-turn samtale-støtte på toppen av slike begrensede faktorer. Mens vårt mål er å nå der, er vi fortsatt på et meget tidlig stadium av å skalle ut vår teknologi for å oppfylle samme antall domener som eksisterende spillere.
Hva er noen av de naturlige språkforståelses- og naturlige språkbehandlings-utfordringene bak å bygge en toppmoderne lydtjeneste-opplevelse?
En av de primære utfordringene med neste-generasjons NLU er å gå utenfor intensjoner og enheter. De fleste NLU er fokusert på å ha en svært tradisjonell tilnærming til språkforståelse. Hver inndata-uttalelse klassifiseres i intensjon, og deretter merkes tokenene inn i enheter ved hjelp av en sekvensmerkingmodell. Jeg kunne oppliste dusiner med problemer med denne standardtilnærmingen. Imidlertid er de viktigste:
- En kontekstfri intensjonsklassifisering som ikke kan håndtere en multi-turn samtale. De fleste tilnærmingene bryr seg bare om den rå teksten som ble transkribert. De bryr seg ikke om kontekst – ikke hvem brukeren er, ikke hva brukeren liker, bare hva de nettopp spurte om. Dette er spesielt viktig når brukeren sier noe kort og godt. For eksempel, hvis noen sier “kosmopolitisk”, kan det bety enten drikken eller magasinet og er sterkt avhengig av personen.
- Enhet-gjenkjenningsmodeller gjør en dårlig jobb med alt som ikke er en kategorisk verdi. Store språkmodeller kan ikke tilpasse seg raskt nok til nye enheter som er i villmarken fordi de ikke er i datasettet. AI må ha en mye mer sofistikert måte å gjenkjenne enheter ved å vurdere en mye dypere kontekst. For eksempel, bør en brukers plassering sterkt påvirke om noe er et restaurantnavn eller noe annet.
- Enhet-relasjoner er ikke godt vurdert. Mitt favoritteksempel er hvor ofte de fleste søkemotorer feiler når det gjelder negasjon. Prøv å søke etter en film uten romantikk på andre lydtjenester, og du vil se hva jeg mener.
I øyeblikket oversetter de fleste lydtjenestene bare tale til tekst og gjennomfører en Google-søk. Hvordan fungerer MeetKai AI annerledes enn dette?
Den primære forskjellen mellom MeetKai og Google når det gjelder søk er at vi bruker en mye rikere språkforståelsesmodell for å søke etter elementer selv i stedet for bare nettsider. Når du søker “Tom Cruise-filmer uten action”, ser Google etter sider som har denne settet med token som vises på siden (Tom Cruise, filmer, action). Hos MeetKai forstår vi korrekt at Tom Cruise er en skuespiller, filmer er klassen av media de søker etter, og at action er det uønskede sjangeren. Med dette kan vi gjennomføre mye smartere søk.
Meetkai lanserte nylig sin første livsstils-VR-verden: MeetKai Metaverse. Kan du diskutere hva denne applikasjonen er spesifikt?
De fleste selskapene i metaverse-rommet jobber med person-til-person-interaksjon. Ut over dette er innholdet også stort sett enten tegneserie-aktig eller bare en 360°-video. Vårt mål med MeetKai Metaverse er å fokusere på en helt annen vinkel – person-til-AI. Vi utvikler en metaverse hvor karakterene du interagerer med er alle drevet av vår kunstige intelligens. Videre jobber vi med å generere prosedyre-miljøet for å gjøre det mer realistisk og immersivt sammenlignet med andre selskaper i rommet. De to første verdener som er tilgjengelige for å utforske i vår metaverse er for to første brukstilfeller: meditasjon og museer. I den første har vi digitalisert en Wing Chun-ekspert, og for første gang skapte vi en AI-karakter som kan instruere brukerne om hvordan bruke revolusjonære meditasjonsteknikker for å komme inn i en tilstand av avslapning. I den andre har vi skapt et alltid voksende kunstmuseum og gitt en AI-drevet kurator som kan svare på spørsmål om kunsten i rommet og gi turer.
Hva er noen eksempler på hvordan AI brukes i denne Metaverse?
Vi bruker AI på tre måter:
- For å aktivere de konversasjonsbaserte evnene til hver karakter i vår metaverse.
- For å dynamisk skape innholdet som er tilgjengelig for brukeren gjennom taleveiledning. Eksempler på dette inkluderer meditasjonsøkter og kunstgalleri-turer i våre to første opplevelser.
- For å skape 3D-rommet prosedyrisk i stedet for å kreve en håndlagt utforming.
Hva er din visjon for fremtiden til lydtjenestene?
For at lydtjenestene skal ha en fremtid, må de utvikle seg til noe mye mer enn et kommandobasert system. Dette betyr å få dypt ekspertise og evner i mange spesifikke domener. Jeg tror at å samle forskjellige domene-spesifikke lydtjenester vil være nøkkel til å bygge ut en all-intelligent meta-tjeneste. Dette er i skarp kontrast til forsøkene på “å gjøre det hele på en gang” som vi har sett siden lydtjenestene først kom inn i rommet.
Er det noe annet du ville like å dele om MeetKai eller MeetKai Metaverse?
Vi er fortsatt på et meget tidlig stadium av vår metaverse-veikart. Vårt endelige mål er at vi ønsker å kunne replikere enhver opplevelse du har i den virkelige verden med metaverse, og deretter gå utenfor det. Dette betyr at vi ønsker å eliminere kostnaden og tid-krevende faktorer som begrenser de samme opplevelsen i virkeligheten. Metaverse kan tillate oss å leve rikere liv, ikke erstatte dem. Vi har flere tekniske utfordringer som fortsatt må løses, men vi har en klar sett med milepæler som er oppnåelige under forutsetning av at hardware fortsetter å forbedre seg. Vi jobber tett med hardware-partnere for å sikre at VR-rommet beveger seg raskt fremover. Ut over bare VR ønsker vi å gjøre vår metaverse-opplevelse mulig utenfor VR. Vi vil annonse mere informasjon om dette i de kommende månedene.
Takk for det flotte intervjuet, jeg ser frem til å følge din fremgang på din versjon av metaverse. Lesere som ønsker å lære mer bør besøke MeetKai.












