Connect with us

James Kaplan, CEO & Co-Founder von MeetKai Metaverse – Interview-Reihe

Interviews

James Kaplan, CEO & Co-Founder von MeetKai Metaverse – Interview-Reihe

mm

James Kaplan, ist der CEO & Co-Founder von MeetKai einem Unternehmen für künstliche Intelligenz, VR und konversationelle Suche mit Sitz in Los Angeles, Kalifornien, das derzeit die AI-Sprachtechnologie mit noch nie gesehenen Funktionen anführt. Seine konversationelle KI kann komplexere Sprache verstehen und personalisierte Ergebnisse in einem natürlichen Gespräch über viele Themen in verschiedenen Realitäten liefern. MeetKais Technologie wird weltweit über iOS, Google Play und AppGallery bereitgestellt.

Sie hatten bereits im Alter von 6 Jahren eine Leidenschaft für KI, wie kamen Sie erstmals mit dieser Technologie in Berührung?

Meine Einführung in die KI kam durch Videospiele. Zuerst war es das Verständnis, wie die KI im Spiel Oregon Trail funktionierte – nicht besonders intelligent, aber dennoch eine Form von KI. Von dort aus wuchs mein Interesse an der KI, als ich in MMORPGs einstieg. Ich mochte es, Online-Spiele zu spielen, aber ich hasste es, nach Gegenständen zu suchen. Deshalb begann ich, Bots zu schreiben.

Was waren einige der ersten KI-Anwendungen, die Sie programmiert haben?

Das Schreiben von Bots für MMORPGs war wirklich mein erster Versuch, eine spezifische Form von KI zu entwickeln. Am Anfang waren meine Bots ziemlich einfach und näher an Makros als an künstlicher Intelligenz. Aber als ich älter wurde und die Bot-Erkennung in vielen Spielen besser wurde, erforderte dies, dass die Bots immer mehr wie ein Spieler aussahen. Ich habe es immer genossen, Bots zu schreiben – ich schrieb sogar einen Bot, um einen Taylor-Swift-Wettbewerb zu gewinnen, während ich noch in der Schule war (und sie kam tatsächlich, um aufzutreten!). Ebenso schrieb ich den ersten Pokémon-Go-Bot und bedauere es, dass viele Leute gebannt wurden, als ich das Interesse an der Vermeidung der Erkennung verlor.

Sie gründeten MeetKai 2018, nachdem Sie mit den aktuellen AI-Sprachassistenten unzufrieden waren. Warum bieten die meisten AI-Assistenten eine enttäuschende Erfahrung?

Das Kernproblem ist, dass die meisten AI-Assistenten viel zu sehr auf externe APIs für die Erfüllung angewiesen sind. Selbst wenn sie die Erfüllung kontrollieren, wie z.B. Alexa für die e-commerce-Suche, leiden sie unter den gleichen Problemen. Wie kann man erwarten, dass ein Sprachassistent intelligent ist, wenn er nur Sprache in Text umwandelt und diesen Text in eine textbasierte Suchmaschine einfügt? Wir starteten MeetKai mit der Idee, dass wir einen “Sprung” AI-Assistenten bereitstellen könnten, indem wir die gesamte End-to-End-Verarbeitungspipeline kontrollieren, die einen Sprachassistenten ausmacht. Wir entwickelten eine konversationelle Suchmaschine anstelle einer keyword-basierten, um komplexere Anfragen und Gespräche zu unterstützen. Andere Assistenten sind mit enttäuschenden Erfahrungen gestrickt, weil sie keine Unterstützung für mehrere Gesprächsrunden aufbauen können, die auf solchen begrenzenden Faktoren basieren. Unser Ziel ist es, dorthin zu gelangen, aber wir sind noch sehr am Anfang, unsere Technologie auszubauen, um die gleiche Anzahl von Domänen wie bestehende Spieler zu erfüllen.

Was sind einige der Herausforderungen bei der natürlichen Sprachverarbeitung und der natürlichen Sprachverständigung bei der Erstellung einer state-of-the-art-Voice-Assistent-Erfahrung?

Eine der primären Herausforderungen bei der nächsten Generation von NLU ist es, über Absichten und Entitäten hinauszugehen. Die meisten NLU konzentrieren sich auf einen sehr traditionellen Ansatz zur Sprachverständigung. Jede Eingabeäußerung wird in eine Absicht klassifiziert und dann die Token innerhalb in Entitäten mit einem Sequenzlabel-Modell beschriftet. Ich könnte Dutzende von Problemen mit diesem Standardansatz aufzählen. Die wichtigsten sind jedoch:

  1. Eine kontextfreie Absichtsklassifizierung kann keine mehrstufige Konversation handhaben. Die meisten Ansätze kümmern sich nur um den rohen Text, der transkribiert wurde. Sie kümmern sich nicht um den Kontext – nicht um den Benutzer, nicht um das, was der Benutzer mag, nur um das, was er gerade gefragt hat. Dies ist besonders wichtig, wenn der Benutzer etwas sehr Knappes sagt. Wenn jemand zum Beispiel “Cosmopolitan” sagt, kann es sich um das Getränk oder das Magazin handeln und hängt stark von der Person ab.
  2. Entitäts-Erkennungsmodelle machen eine schlechte Arbeit bei allem, was kein kategorieller Wert ist. Große Sprachmodelle können sich nicht schnell genug an neue Entitäten anpassen, die in der Wildnis sind, weil sie nicht im Datensatz sind. KI benötigt einen viel sophistizierteren Weg, um Entitäten zu erkennen, indem sie einen viel tieferen Kontext berücksichtigt. Zum Beispiel sollte die Lage des Benutzers stark beeinflussen, ob etwas ein Restaurantname oder etwas anderes ist.
  3. Entitätsbeziehungen werden nicht gut berücksichtigt. Mein Lieblingsbeispiel ist, wie oft die meisten Suchmaschinen bei der Verneinung versagen. Versuchen Sie, auf anderen Sprachassistenten nach einem Film ohne Romantik zu suchen, und Sie werden sehen, was ich meine.

Aktuell übersetzen die meisten Sprachassistenten einfach Sprache in Text und führen eine Google-Suche durch. Wie funktioniert MeetKai AI anders als dies?

Der primäre Unterschied zwischen MeetKai und Google bei der Suche besteht darin, dass wir ein viel reicheres Sprachverständigungsmodell verwenden, um nach Elementen selbst zu suchen und nicht nur nach Webseiten. Wenn Sie “Tom Cruise-Filme ohne Action” suchen, sucht Google nach Seiten, auf denen diese Tokenfolge erscheint (Tom Cruise, Filme, Action). Bei MeetKai verstehen wir richtig, dass Tom Cruise ein Schauspieler ist, Filme die Klasse von Medien sind, nach denen gesucht wird, und dass Action das unerwünschte Genre ist. Mit diesem Verständnis können wir viel intelligentere Suchen durchführen.

Meetkai hat kürzlich seine erste Lifestyle-VR-Welt veröffentlicht: MeetKai Metaverse. Können Sie über diese Anwendung sprechen?

Die meisten Unternehmen im Metaverse-Bereich arbeiten an der Interaktion zwischen Personen. Darüber hinaus ist der Inhalt größtenteils entweder cartoonartig oder nur ein 360-Grad-Video. Unser Ziel mit dem MeetKai Metaverse ist es, einen ganz anderen Ansatz zu verfolgen – Person<>KI. Wir entwickeln ein Metaverse, in dem die Charaktere, mit denen Sie interagieren, alle von unserer bahnbrechenden konversationellen KI angetrieben werden. Darüber hinaus arbeiten wir an der Verfahrensgenerierung der Umgebung, um sie im Vergleich zu anderen Unternehmen im Bereich realistischer und immersiver zu machen. Die beiden anfänglich verfügbaren Welten in unserem Metaverse sind für zwei anfängliche Anwendungsfälle verfügbar: Meditation und Museen. Im ersten Fall haben wir einen Wing-Chun-Experten digitalisiert und zum ersten Mal einen KI-Charakter erstellt, der den Benutzer über revolutionäre Meditationstechniken anweisen kann, um in einen Zustand der Entspannung zu gelangen. Im zweiten Fall haben wir ein immer wachsendes Kunstmuseum erstellt und einen KI-gesteuerten Kurator bereitgestellt, der Fragen über die Kunst im Raum beantworten und Führungen anbieten kann.

Was sind einige Beispiele dafür, wie KI in diesem Metaverse eingesetzt wird?

Wir verwenden KI an drei Stellen:

  1. Um die konversationellen Fähigkeiten jedes Charakters in unserem Metaverse zu ermöglichen.
  2. Um den Inhalt dynamisch zu erstellen, der dem Benutzer über Sprachführung zur Verfügung gestellt wird. Beispiele hierfür sind Meditationssitzungen und Kunstmuseum-Führungen in unseren beiden anfänglichen Erfahrungen.
  3. Um den 3D-Raum verfahrensgesteuert zu erstellen, anstatt eine manuelle Layout-Anpassung zu erfordern.

Was ist Ihre Vision für die Zukunft von Sprachassistenten?

Damit Sprachassistenten eine Zukunft haben, müssen sie sich zu etwas viel mehr als einem kommandobasierten System entwickeln. Das bedeutet, dass sie tiefere Expertise und Fähigkeiten in vielen spezifischen Domänen benötigen. Ich denke, dass die Zusammenstellung verschiedener domänen-spezifischer Sprachassistenten der Schlüssel zum Aufbau eines all-intelligenten Meta-Assistenten sein wird. Dies steht im Gegensatz zu den Versuchen, “alles auf einmal” zu tun, die wir seit dem Erscheinen von Sprachassistenten im Raum gesehen haben.

Gibt es noch etwas, das Sie über MeetKai oder das MeetKai Metaverse teilen möchten?

Wir sind noch am Anfang unserer Metaverse-Roadmap. Unser endgültiges Ziel ist es, dass wir jede Erfahrung, die Sie in der realen Welt haben, im Metaverse nachbilden können und dann darüber hinausgehen. Das bedeutet, dass wir die kostengünstigen und zeitaufwändigen Faktoren eliminieren möchten, die diese Erfahrungen in der Realität einschränken. Das Metaverse kann uns ermöglichen, reichere Leben zu leben, nicht sie zu ersetzen. Wir haben noch einige technische Herausforderungen, die gelöst werden müssen, aber wir haben eine klare Reihe von Meilensteinen, die erreichbar sind, wenn die Hardware weiter verbessert wird. Wir arbeiten eng mit Hardware-Partnern zusammen, um sicherzustellen, dass der VR-Raum schnell voranschreitet. Neben VR möchten wir es ermöglichen, dass die Metaverse-Erfahrung auch außerhalb von VR möglich ist. Wir werden in den kommenden Monaten weitere Informationen dazu bekannt geben.

Vielen Dank für das großartige Interview, ich freue mich darauf, Ihre Fortschritte bei Ihrer Version des Metaverse zu verfolgen. Leser, die mehr erfahren möchten, sollten MeetKai besuchen.

Antoine ist ein visionärer Führer und Gründungspartner von Unite.AI, getrieben von einer unerschütterlichen Leidenschaft für die Gestaltung und Förderung der Zukunft von KI und Robotik. Ein Serienunternehmer, glaubt er, dass KI so disruptiv für die Gesellschaft sein wird wie Elektrizität, und wird oft dabei ertappt, wie er über das Potenzial disruptiver Technologien und AGI schwärmt.

Als futurist ist er darauf fokussiert, zu erforschen, wie diese Innovationen unsere Welt formen werden. Zusätzlich ist er der Gründer von Securities.io, einer Plattform, die sich auf Investitionen in hochmoderne Technologien konzentriert, die die Zukunft neu definieren und ganze Branchen umgestalten.