Συνεντεύξεις
James Kaplan, CEO & Co-Founder of MeetKai Metaverse – Συνέντευξη Σειράς

Ο James Kaplan, είναι ο CEO & Co-Founder της MeetKai μια εταιρεία τεχνητής νοημοσύνης, εικονικής πραγματικότητας και συνομιλητικής αναζήτησης με έδρα το Λος Άντζελες, στην Καλιφόρνια, η οποία αυτή τη στιγμή ηγείται στον αγώνα της τεχνητής νοημοσύνης με χαρακτηριστικά που δεν έχουν ποτέ見θεί. Η συνομιλητική της τεχνητή νοημοσύνη μπορεί να καταλάβει πιο σύνθετη ομιλία και να δώσει προσωποποιημένα αποτελέσματα σε μια φυσική συνομιλία για πολλά θέματα, σε διαφορετικές πραγματικότητες. Η τεχνολογία της MeetKai έχει αναπτυχθεί παγκοσμίως μέσω των iOS, Google Play και AppGallery.
Έχετε μια страсть για την τεχνητή νοημοσύνη από την ηλικία των 6 ετών, πώς σας εισήχθη αρχικά σε αυτή τη τεχνολογία;
Η εισαγωγή μου στην τεχνητή νοημοσύνη ήρθε από τα βιντεοπαιχνίδια. Πρώτα, ήταν από την προσπάθεια να καταλάβω πώς λειτουργούσε η τεχνητή νοημοσύνη στο παιχνίδι Oregon Trail — όχι τόσο έξυπνη, αλλά ακόμη μια μορφή τεχνητής νοημοσύνης. Από εκεί, το ενδιαφέρον μου για την τεχνητή νοημοσύνη αυξήθηκε περισσότερο καθώς έπαιζα online παιχνίδια. Μου άρεσε πραγματικά να παίζω online παιχνίδια, αλλά μισούσα το grinding για αντικείμενα. Έτσι, άρχισα να γράφω bots.
Ποια ήταν κάποια από τις πρώτες εφαρμογές της τεχνητής νοημοσύνης που προγραμματίσατε;
Το γράψιμο bots για MMORPGs ήταν πραγματικά η πρώτη μου προσέγγιση στην ανάπτυξη μιας συγκεκριμένης μορφής τεχνητής νοημοσύνης. Στο ξεκίνημα, τα bots μου ήταν khá απλά και πιο κοντά σε macros παρά τεχνητή νοημοσύνη. Αλλά καθώς μεγάλωνα και η ανίχνευση bots σε πολλά παιχνίδια έγινε καλύτερη, αυτό άρχισε να απαιτεί να έχουν τα bots την εμφάνιση ενός παίκτη. Μου άρεσε πάντα να γράφω bots — τελικά γράψαμε ένα bot για να κερδίσω einen διαγωνισμό Taylor Swift ενώ ήταν στο σχολείο (και πραγματικά ήρθε να εκτελέσει!). Επίσης, γράψαμε το πρώτο bot του Pokémon Go και με λύπη μου, πολλοί άνθρωποι απαγορεύτηκαν όταν έχασα το ενδιαφέρον για την αποφυγή ανίχνευσης.
Εκκινήσατε την MeetKai το 2018 μετά από μια απογοήτευση με τους τρέχοντες βοηθούς φωνής της τεχνητής νοημοσύνης. Γιατί οι περισσότεροι βοηθοί της τεχνητής νοημοσύνης προσφέρουν μια experience που λείπει;
Το κεντρικό ζήτημα είναι ότι οι περισσότεροι βοηθοί της τεχνητής νοημοσύνης εξαρτώνται πολύ από εξωτερικές APIs για την εκπλήρωση. Ακόμη και όταν ελέγχουν την εκπλήρωση, όπως η Alexa για την αναζήτηση ηλεκτρονικού εμπορίου, υποφέρουν από τα ίδια προβλήματα. Πώς μπορείτε να περιμένετε ένας βοηθός φωνής να είναι έξυπνος όταν όλα που κάνει είναι να μετατρέψει την ομιλία σε κείμενο και να τοποθετήσει το κείμενο σε μια αναζήτηση βασισμένη σε κείμενο; Ξεκινήσαμε την MeetKai με την ιδέα ότι μπορούσαμε να προσφέρουμε einen “leapfrog” βοηθό της τεχνητής νοημοσύνης ελέγχοντας ολόκληρη τη διαδικασία επεξεργασίας που αποτελεί einen βοηθό φωνής. Ανέπτυξαμε μια αναζήτηση συνομιλητικής μορφής αντί για μια βασισμένη σε λέξεις-κλειδιά για να υποστηρίξουμε πιο σύνθετες ερωτήσεις και συνομιλίες. Οι άλλοι βοηθοί είναι εγκλωβισμένοι με μια experience που λείπει γιατί δεν μπορούν να κατασκευάσουν μια υποστήριξη πολλαπλών συναλλαγών σε μια τέτοια περιοριστική παράμετρο. Ενώ ο στόχος μας είναι να φτάσουμε εκεί, είμαστε ακόμη πολύ στην αρχή της κλίμακας της τεχνολογίας μας για να ικανοποιήσουμε τον ίδιο αριθμό домένιων με τους υφιστάμενους παίκτες.
Τι είναι κάποια από τα φυσικά προβλήματα κατανοήσης και επεξεργασίας της φυσικής γλώσσας πίσω από την κατασκευή μιας experience βοηθού φωνής της τεχνητής νοημοσύνης;
Ένα από τα основικά προβλήματα με την επόμενη γενιά της φυσικής γλώσσας είναι να μετακινηθεί πέρα από τις προθέσεις και τις οντότητες. Η περισσότερη φυσική γλώσσα επικεντρώνεται σε μια παραδοσιακή προσέγγιση στην κατανόηση της γλώσσας. Κάθε είσοδος ομιλία ταξινομείται σε πρόθεση, και στη συνέχεια τα tokens μέσα σε αυτήν ταξινομούνται σε οντότητες χρησιμοποιώντας ένα μοντέλο σήμανσης σειράς. Μπορώ να αναφέρω δεκάδες προβλήματα με αυτήν την τυπική προσέγγιση. Ωστόσο, τα πιο κρίσιμα είναι:
- Μια ταξινόμηση πρόθεσης που είναι ανεξάρτητη από το контέκστ απέτυχε να χειριστεί μια πολλαπλή συνομιλία. Οι περισσότερες προσεγγίσεις ενδιαφέρονται μόνο για το raw κείμενο που μεταγράφηκε. Δεν ενδιαφέρονται για το контέκστ — όχι ποιος είναι ο χρήστης, όχι τι του αρέσει, μόνο τι μόλις ρώτησε. Αυτό είναι ιδιαίτερα σημαντικό όταν ο χρήστης λέει κάτι σύντομο. Για παράδειγμα, αν κάποιος λέει cosmopolitan, μπορεί να σημαίνει το ποτό ή το περιοδικό και εξαρτάται πολύ από το άτομο.
- Τα μοντέλα αναγνώρισης οντοτήτων κάνουν μια κακή δουλειά σε οτιδήποτε δεν είναι μια κατηγορική τιμή. Τα μεγάλα μοντέλα γλώσσας δεν μπορούν να προσαρμοστούν αρκετά γρήγορα σε νέες οντότητες που βρίσκονται στο wild γιατί δεν είναι στο σύνολο δεδομένων. Η τεχνητή νοημοσύνη πρέπει να έχει einen πολύ πιο sophistikado τρόπο να αναγνωρίζει οντότητες λαμβάνοντας υπόψη einen πολύ βαθύτερο контέκστ. Για παράδειγμα, η τοποθεσία του χρήστη πρέπει να επηρεάσει mạnh mẽ αν κάτι είναι ένα όνομα εστιατορίου ή κάτι άλλο.
- Οι σχέσεις οντοτήτων δεν λαμβάνονται υπόψη. Το αγαπημένο μου παράδειγμα είναι πόσο συχνά οι περισσότερες μηχανές αναζήτησης αποτυγχάνουν όταν πρόκειται για άρνηση. Δοκιμάστε να αναζητήσετε μια ταινία χωρίς ρομαντισμό σε άλλους βοηθούς φωνής και θα δείτε τι εννοώ.
Τώρα, οι περισσότεροι βοηθοί φωνής μεταφράζουν απλά την φωνή σε κείμενο και εκτελούν μια αναζήτηση Google. Πώς λειτουργεί η MeetKai AI διαφορετικά από αυτό;
Η основική διαφορά μεταξύ MeetKai και Google όταν πρόκειται για αναζήτηση είναι ότι χρησιμοποιούμε einen πολύ πιο πλούσιο μοντέλο κατανόησης γλώσσας για να αναζητήσουμε αντικείμενα euxαυτά παρά απλά σελίδες ιστού. Όταν αναζητάτε “Ταινίες του Tom Cruise χωρίς δράση”, το Google αναζητά σελίδες που έχουν αυτήν τη σειρά από tokens να εμφανίζονται στη σελίδα (Tom Cruise, ταινίες, δράση). Στη MeetKai, καταλαβαίνουμε σωστά ότι ο Tom Cruise είναι ένας ηθοποιός, οι ταινίες είναι η κατηγορία των μέσων που αναζητάτε, και ότι η δράση είναι το μη επιθυμητό είδος. Με αυτό, μπορούμε να εκτελέσουμε πολύ più έξυπνες αναζητήσεις.
Η MeetKai πρόσφατα εκκίνησε τον πρώτο κόσμο εικονικής πραγματικότητας: MeetKai Metaverse. Μπορείτε να συζητήσετε τι είναι αυτή η εφαρμογή;
Οι περισσότερες εταιρείες στο χώρο του metaverse εργάζονται στην αλληλεπίδραση άτομο-άτομο. Πέρα από αυτό, το περιεχόμενο είναι επίσης σε μεγάλο βαθμό είτε καρτούν είτε είναι απλά ένα βίντεο 360°. Ο στόχος μας με το MeetKai Metaverse είναι να επικεντρωθούμε σε einen εντελώς διαφορετικό γωνία — άτομο-τεχνητή νοημοσύνη. Αναπτύσσουμε einen metaverse όπου τα χαρακτήρα με τους οποίους αλληλεπιδράτε είναι όλα ενεργοποιημένα από την τεχνητή μας νοημοσύνη. Επιπλέον, εργαζόμαστε για την εκτέλεση μιας διαδικασίας δημιουργίας του περιβάλλοντος για να το κάνουμε πολύ πιο ρεαλιστικό και εύERSION όταν συγκρίνεται με άλλες εταιρείες στο χώρο. Οι δύο αρχικές κόσμοι που είναι διαθέσιμοι για εξερεύνηση στο metaverse μας είναι για δύο αρχικές περιπτώσεις χρήσης: διαλογισμός και μουσεία. Στο πρώτο, abbiamo ψηφιοποιήσει einen ειδικό του Wing Chun, και για πρώτη φορά, δημιουργήσαμε einen χαρακτήρα τεχνητής νοημοσύνης που είναι σε θέση να διδάξει τους χρήστες πώς να χρησιμοποιήσουν επαναστατικές τεχνικές διαλογισμού για να εισέλθουν σε einen κατάσταση χαλάρωσης. Στο δεύτερο, abbiamo δημιουργήσαμε einen不断 growing μουσείο τέχνης και παρείχαμε einen curator που είναι ενεργοποιημένος από την τεχνητή μας νοημοσύνη και είναι σε θέση να απαντήσει σε ερωτήσεις σχετικά με την τέχνη στο χώρο και να παρέχει ξεναγήσεις.
Τι είναι κάποια παραδείγματα του πώς η τεχνητή νοημοσύνη χρησιμοποιείται σε αυτό το Metaverse;
Χρησιμοποιούμε την τεχνητή νοημοσύνη σε τρία σημεία:
- Για να ενεργοποιήσουμε τις συνομιλητικές ικανότητες κάθε χαρακτήρα στο metaverse μας.
- Για να δημιουργήσουμε δυναμικά το περιεχόμενο που είναι διαθέσιμο στον χρήστη μέσω φωνητικών οδηγιών. Παραδείγματα αυτού περιλαμβάνουν συνεδρίες διαλογισμού και ξεναγήσεις σε галερί τέχνης στις αρχικές μας δύο εμπειρίες.
- Για να δημιουργήσουμε τον 3D χώρο μας με μια διαδικασία rather niż απαιτώντας eine χειροκίνητη διάταξη.
Τι είναι η όρασή σας για το μέλλον των βοηθών φωνής;
Για τους βοηθούς φωνής να έχουν einen μέλλον, πρέπει να εξελιχθούν σε κάτι πολύ περισσότερο από einen σύστημα βασισμένο σε εντολές. Αυτό σημαίνει να αποκτήσουν βαθιά εμπειρογνωσία και ικανότητες σε πολλά συγκεκριμένα домένια. Νομίζω ότι η συναρμολόγηση διαφορετικών βοηθών φωνής που είναι ειδικοί σε διαφορετικά домένια θα είναι ο κλειδί για την κατασκευή eines πλήρως έξυπνου meta-βοηθού. Αυτό είναι σε diametrical αντίθεση με τις προσπάθειες να “το κάνουν όλα μαζί” που έχουμε δει από τότε που οι βοηθοί φωνής εισήλθαν στον χώρο.
Υπάρχει κάτι άλλο που θα ήθελε να μοιραστεί σχετικά με την MeetKai ή το MeetKai Metaverse;
Είμαστε ακόμη στην αρχή του δρόμου μας για το metaverse. Ο τελικός μας στόχος είναι ότι θέλουμε να μπορέσουμε να αναπαράγουμε οποιαδήποτε εμπειρία που έχετε στην πραγματική ζωή με το metaverse, και στη συνέχεια να πάνε πέρα από αυτό. Αυτό σημαίνει ότι θέλουμε να εξαλείψουμε τους παράγοντες κόστους και χρόνου που περιορίζουν τις ίδιες εμπειρίες στην πραγματικότητα. Το metaverse μπορεί να μας επιτρέψει να ζήσουμε πολύ πιο πλούσιες ζωές, όχι να τις αντικαταστήσουμε. Έχουμε beberapa τεχνικά προβλήματα που πρέπει ακόμη να λυθούν, ωστόσο, έχουμε einen σαφή σετ από ορόσημα που είναι επιτεύξιμα με την υπόθεση ότι η τεχνολογία εξοπλισμού συνεχίζει να βελτιώνεται. Εργαζόμαστε στενά με εταίρους εξοπλισμού για να διασφαλίσουμε ότι ο χώρος της εικονικής πραγματικότητας προχωράει γρήγορα. Πέρα από την εικονική πραγματικότητα, θέλουμε να κάνουμε την εμπειρία του metaverse μας δυνατή εκτός της εικονικής πραγματικότητας. Θα ανακοινώσουμε περισσότερες πληροφορίες σχετικά με αυτό τις επόμενες μήνες.
Ευχαριστώ για τη μεγάλη συνέντευξη, αναμένω να ακολουθήσω την πρόοδό σας στην εκδοχή σας του metaverse. Οι αναγνώστες που επιθυμούν να μάθουν περισσότερα πρέπει να επισκεφθούν MeetKai.












