Vernetzen Sie sich mit uns

Interviews

Dr. Lingjia Tang, CTO und Mitbegründer von Clinc – Interviewreihe

mm

Dr. Lingjia Tang, CTO und Mitbegründer von Klinik, ist Professor für Informatik an der University of Michigan. Dr. Tangs Forschung zum Aufbau einer groß angelegten Produktionsinfrastruktur für intelligente Anwendungen genießt in der akademischen Gemeinschaft weithin Anerkennung und Respekt. Lingjia arbeitete nicht nur bei Microsoft und Google, sondern promovierte auch in Informatik an der University of Virginia. Lingjia hat kürzlich renommierte Auszeichnungen erhalten, darunter die ISCA Hall of Fame, den Facebook Research Award und den Google Research Award.

Was hat Sie ursprünglich an KI interessiert? Wann haben Sie zum ersten Mal gemerkt, dass Sie ein KI-Unternehmen gründen möchten?

Mitte der 2000er Jahre forschte ich an Großsystemen, die verschiedene Anwendungen unterstützen, und daran, wie wir Server als Softwaresystem gestalten können, um diese Anwendungen effizienter auszuführen. Damals wechselten wir von der Arbeit mit traditionellen Webanwendungen zu stärker auf maschinelles Lernen basierenden Funktionen. Damals begann ich, mich mit den Algorithmen im Zusammenhang mit KI zu beschäftigen und wollte die Funktionsweise von KI-Anwendungen grundlegend verstehen. Bald darauf beschloss das Forschungsteam, mit dem ich zusammenarbeitete, eine neue Richtung einzuschlagen und im Grunde eigene KI-Anwendungen als Benchmarks zu entwickeln. Dies führte dazu, dass wir unsere ersten Forschungsarbeiten veröffentlichten und unser erstes Produkt, Sirius, entwickelten – einen offenen, durchgängigen persönlichen Sprach- und Bildassistenten.

Als Open-Source-Software ermöglichte Sirius den Menschen, selbst virtuelle Konversationsassistenten zu erstellen. Zu dieser Zeit war dies eine sehr begrenzte Möglichkeit für die breite Öffentlichkeit und wurde eigentlich nur von den großen Unternehmen wie Google und Apple kontrolliert. Als wir die Software veröffentlichten, stellten wir jedoch fest, dass wir eine kritische Lücke füllten, und stellten fest, dass sie in der ersten Woche Zehntausende Downloads verzeichnete! Das war der Wendepunkt, an dem wir wussten, dass es eine große Marktnachfrage nach dieser Art von Software gab.

Im Jahr 2015 haben wir Clinc mit der Einstellung ins Leben gerufen, dass wir jedem – jedem Entwickler, jedem Unternehmen, jeder Person –, der einen virtuellen Assistenten bauen möchte, Zugang zu Fachwissen, Werkzeugen und Innovationen bieten können, um dies zu tun .

Clinc bietet Konversations-KI-Lösungen, ohne auf Schlüsselwörter oder Skripte angewiesen zu sein. Könnten Sie bitte näher darauf eingehen, wie dies erreicht wird? Welche Herausforderungen mussten bei der Verarbeitung natürlicher Sprache (NLP) bewältigt werden?

Was Clinc wirklich von anderen Konversations-KI-Plattformen auf dem Markt unterscheidet, sind die zugrunde liegenden KI-Algorithmen, die ein „Mensch-im-Raum“-Erlebnis ermöglichen, das chaotische und nicht geschriebene Sprache versteht. Dies ermöglicht Korrekturen, um Fehler in menschlichen Gesprächen rückgängig zu machen und zu „heilen“, und ermöglicht komplexe Gesprächsabläufe – Gespräche, die ein echter Mensch verstehen könnte. Im Gegensatz zu einem Sprach-zu-Text-Wortvergleichsalgorithmus analysiert Clinc Dutzende Faktoren aus der Eingabe des Benutzers, darunter Wortlaut, Stimmung, Absicht, Tonfall, Tageszeit, Standort und Beziehungen, und verwendet diese Faktoren, um eine Antwort zu liefern stellt eine Zusammenstellung von Wissen dar, das aus seinem trainierten Gehirn extrahiert wurde. Wenn ich zum Beispiel meinen virtuellen Assistenten frage: „Wie viel Geld habe ich für einen Burger ausgegeben?“ Es muss verstehen, dass ich nach Geld und Ausgaben frage, dass ich speziell nach einem Hamburger frage und dass ein Hamburger eine Art Lebensmittel ist und mit meinen letzten Ausgaben in einem Restaurant in Einklang gebracht werden sollte.

Es ist nicht einfach, dieses Verständnisniveau zu erreichen. Im Allgemeinen würden wir Konversations-KI in zwei Komponenten unterteilen: Natural Language Understanding (NLU) und Dialogmanagement. Die Herausforderung, die wir bewältigen mussten, bestand also darin, herauszufinden, wie wir ein System aufbauen können, das wichtige Informationen präzise extrahieren und vorhersehen kann, was der Benutzer fragt.

Wir sind in der Lage, dies durch anspruchsvolles, kontextbezogenes Top-Down-NLU zu erreichen, das darauf trainiert ist, intuitiv zu sein, um mit dem natürlichen Gesprächsfluss Schritt zu halten und Slang und Kontext zu verstehen. Dies steht im Vergleich zu Lösungen der Konkurrenz, die einen von oben nach unten gerichteten, regelbasierten Ansatz zur Verarbeitung natürlicher Sprache (NLP) verfolgen, der keine Konversationsheilung ermöglicht. Das heißt, wenn der Kunde einen Fehler macht, kehren die Lösungen der Konkurrenz wieder zum Ausgangspunkt zurück , was Zeit verschwendet und den Benutzer nur frustriert. Wir nutzen auch Crowdsourcing, um unsere Sprachdaten zu extrahieren und so einen umfangreicheren, vielfältigeren Datensatz zu erstellen, der sofort zum Trainieren von KI-Modellen verwendet werden kann.

Könnten Sie besprechen, wie Deep Learning mit dem Clinc AI-System eingesetzt wird?

Clinc verwendet einen hybriden Ansatz für Deep Learning, bei dem wir bis zu einem gewissen Grad das traditionelle Old-School-Modell nutzen und bei Bedarf Deep Learning nutzen. Konkret nutzen wir Deep Learning, um Wörter und Sprachen zu verstehen und den Dialogfluss zu bestimmen. Im Allgemeinen ist unser gesamter Dialog eine Kombination aus Deep Learning und symbolischer KI. Wir verwenden Deep Learning noch nicht zur Sprachgenerierung, da der virtuelle Assistent bei unseren Kunden, die hauptsächlich aus der Bankenbranche kommen, viele Vorschriften befolgen muss, die vorschreiben, was er seinen Kunden sagen darf und was nicht . Daher besteht immer noch große Unsicherheit darüber, ob Deep Learning in der Lage sein wird, diese festgelegten sprachlichen Einschränkungen zu befolgen.

Im Moment glaube ich nicht, dass die Konversations-KI-Community vollständig bereit ist, Deep Learning vollständig einzuführen, während die akademische Community zu 100 % dabei ist, aber ich freue mich darauf, zu sehen, was die neuen Modelle leisten können.

Wie läuft der Prozess für ein Unternehmen ab, das die Reaktionen der KI anpassen möchte, um eine bestimmte Zielgruppe anzusprechen? Können Sie einige Beispiele nennen, wie Clinc derzeit von Kunden genutzt wird?

Wir ermöglichen unseren Kunden, entweder eine Plattform zu lizenzieren, auf der sie nach Belieben aufbauen können, oder unseren vollständig entwickelten und geschulten Chatbot Finie zu nutzen, ihn anzupassen und in ihre Apps oder Messaging-Dienste zu integrieren. Finie kann sich um Angelegenheiten im Zusammenhang mit Guthaben, Transaktionen, Ausgabenhistorie, dem Auffinden eines Geldautomaten, einer Überweisung und vielem mehr kümmern.

Mein Lieblingsbeispiel dafür, wie ein Kunde die KI von Clinc angepasst hat, um eine bestimmte Zielgruppe anzusprechen, ist İşbank. Als größte Privatbank der Türkei wandten sie sich bereits 2018 an uns, um ihren digitalen Bankassistenten Maxi zu entwickeln. Um Maxi eine einzigartige Persönlichkeit zu verleihen, führte die İşbank 14 Fokusgruppen durch, um zu ermitteln, welche Eigenschaften und Fähigkeiten Bankkunden in einer virtuellen Bank wünschten Assistent. Außerdem engagierten sie eine Synchronsprecherin, die Sätze im Zusammenhang mit Bankaufgaben auf Türkisch vortrug. Das Conversational-Banking-Team der İşbank kam zu diesen Sätzen, indem es darüber nachdachte, wie echte Menschen ihre Bedürfnisse formulieren würden. Auf unsere Empfehlung hin bezahlte das Team Teilnehmer auf Crowdsourcing-Marktplätzen wie Amazon Mechanical Turk dafür, dass sie ihnen verschiedene Möglichkeiten zur Verfügung stellten, dieselben Fragen zu äußern, beispielsweise die Bitte, ihre Guthaben einzusehen („Wie hoch ist mein Guthaben“, „Wie viel Geld habe ich?“) auf meinem Konto“, „Zeige mir das Geld auf meinem Konto“) oder bezahle eine Rechnung („meine Rechnung bezahlen“, „Rechnungszahlungen“).

Dieses Beispiel zeigt wirklich, wie sehr die İşbank daran interessiert ist, einen digitalen Bankassistenten anzubieten, der ihren Kunden eine bessere Navigation auf ihren Konten ermöglicht. Mit Clinc hat die İşbank Maxi auf Türkisch für mehr als 7.5 Millionen Menschen eingeführt. Seit seiner Einführung hat İşbank eine breite Akzeptanz bei mehr als 5.5 Millionen Nutzern erfahren, mit durchschnittlich 9.8 Interaktionen pro Nutzer. Als in den letzten Monaten die Zahl der COVID-19-Fälle in der Türkei zunahm, schulte die İşbank Maxi schnell darin, auf Anfragen im Zusammenhang mit COVID-19 zu reagieren. Seit März 2020 hat Maxi mehr als 1.2 Millionen Kundenanfragen im Zusammenhang mit COVID-19 beantwortet, was einer Steigerung der Nutzung um mehr als 62 % entspricht.

Was würden Sie Frauen raten, die daran interessiert sind, mehr über KI zu erfahren, sich aber nur ungern engagieren, weil es ein männerdominiertes Fachgebiet ist?

Ich glaube nicht, dass es einen Grund gibt, warum KI als männerdominiertes Feld gilt. Ich denke, es gibt viele Pionierinnen in diesem Bereich, die wirklich erfolgreich sind und etwas bewirken. Ich denke, KI in Verbindung mit Sozialpolitik ist ein einzigartiger Bereich, der das Potenzial hat, den Alltag der Menschen stark zu beeinflussen. Hier wären vielfältigere Erkenntnisse wirklich von Vorteil, insbesondere da es viele Diskussionen über rassistische und geschlechtsspezifische Vorurteile in der KI gibt. Ich bin überzeugt, dass eine breit gefächerte Community von KI-Entwicklern weiterhin einen überproportionalen Einfluss auf Gesellschaft und Politik haben wird.

Den Frauen da draußen, die daran interessiert sind, in den KI-Bereich einzusteigen, kann ich es wärmstens empfehlen, insbesondere wenn Sie daran interessiert sind, etwas zu bewirken. KI hat im Laufe der Jahre so viel Wachstum und Innovation erlebt und es ist wirklich eine aufregende Zeit, ein Teil davon zu sein.

Gibt es noch etwas, das Sie über Clinc mitteilen möchten?

Clinc macht gerade enorme Fortschritte. Ich persönlich habe gerade meine neue Rolle als CTO von Clinc übernommen und freue mich sehr darauf, mich darauf zu konzentrieren, wie wir die Zusammenarbeit mit Entwicklern und Datenwissenschaftlern weiter ausbauen können, um die Reichweite unserer Technologie zu steigern. Mit Blick auf die Zukunft sehe ich eine Verschiebung der Nachfrage nach KI-gestützten Anwendungen, sodass auch Menschen ohne jahrelange Erfahrung in Datenwissenschaft und maschinellem Lernen diese nutzen können. Man braucht beispielsweise keinen Grafikdesign-Abschluss, um Photoshop verwenden zu können. Ich denke, KI entwickelt sich in eine Richtung, in der Entwickler ohne KI- oder maschinelles Lerntraining Ergebnisse erzielen und hochwertige Anwendungen erstellen können. Insgesamt möchten wir betonen, dass wir uns nicht nur dem Endbenutzer, sondern auch den Entwicklern aller Ebenen widmen, die Interesse an unserer Lösung zeigen.

Vielen Dank für das tolle Interview, ich freue mich darauf, Ihre Fortschritte zu verfolgen. Wer mehr erfahren möchte, sollte vorbeikommen Klinik.

Antoine ist ein visionärer Leiter und Gründungspartner von Unite.AI, angetrieben von einer unerschütterlichen Leidenschaft für die Gestaltung und Förderung der Zukunft von KI und Robotik. Als Serienunternehmer glaubt er, dass KI für die Gesellschaft ebenso umwälzend sein wird wie Elektrizität, und schwärmt oft vom Potenzial disruptiver Technologien und AGI.

Als Futuristwidmet er sich der Erforschung, wie diese Innovationen unsere Welt prägen werden. Darüber hinaus ist er der Gründer von Wertpapiere.io, eine Plattform, deren Schwerpunkt auf Investitionen in Spitzentechnologien liegt, die die Zukunft neu definieren und ganze Branchen umgestalten.