Interviews
Joy Mustafi, Chief Data Scientist von Aviso, Inc – Interviewreihe

Als einer von eingestuft Indiens Joy Mustafi wurde vom Analytics India Magazine zu den zehn besten Datenwissenschaftlern gekürt und hat die datenwissenschaftliche Forschung bei Technologiegiganten wie Salesforce, Microsoft und IBM geleitet, 10 Patente gewonnen und über 50 Veröffentlichungen zum Thema KI verfasst.
Er war ein Jahrzehnt lang bei IBM als Datenwissenschaftler tätig und war an verschiedenen Business-Intelligence-Lösungen beteiligt, darunter IBM Watson. Er arbeitete als Principal Applied Scientist bei Microsoft und war verantwortlich für die KI-Forschung. Zuletzt war Mustafi leitender Forscher für die Einstein-Plattform von Salesforce.
Mustafi ist außerdem Gründer und Präsident von MUSS recherchiert werden, eine gemeinnützige Organisation, die Spitzenleistungen in den Bereichen Datenwissenschaft, kognitives Computing, künstliche Intelligenz, maschinelles Lernen und fortschrittliche Analytik zum Wohle der Gesellschaft fördert.
Kürzlich kam Mustafi zu Redwood City Aviso, Inc Als Chief Data Scientist wird er seine jahrzehntelange Erfahrung nutzen, um Aviso-Kunden dabei zu helfen, Geschäftsabschlüsse zu beschleunigen und Umsatzmöglichkeiten zu erweitern.
Was hat Sie ursprünglich an KI interessiert?
Ich liebe Mathematik sehr und das Gleiche gilt für das Programmieren. Ich habe meinen Abschluss in Statistik gemacht und eine Postgraduiertenarbeit in Computeranwendungen absolviert. Als ich meine KI-Forschungsreise im Jahr 2002 am Indian Statistical Institute in Kalkutta begann, nutzte ich die Programmiersprache C, um ein künstliches neuronales Netzwerksystem für die handschriftliche Zahlenerkennung zu entwickeln. Das waren mehr als 2500 Codezeilen, die alle von Grund auf neu geschrieben wurden, ohne eingebaute Bibliotheken außer der Standardeingabe/-ausgabe. Es bestand aus Datenbereinigung und Vorverarbeitung, Feature-Engineering und einem Backpropagation-Algorithmus mit einem mehrschichtigen Perzeptron. Der gesamte Prozess war eine Kombination aller Fächer, die ich studiert habe. Damals war KI in der Unternehmenswelt noch nicht so beliebt und nur wenige akademische Organisationen betrieben fortgeschrittene Forschung auf diesem Gebiet. Und übrigens, KI war damals nichts Neues! Das Gebiet der KI-Forschung reicht bis ins Jahr 1956 zurück, als Prof. John McCarthy und andere das Gebiet bei einem mittlerweile legendären Workshop am Dartmouth College eröffneten.
Sie haben mit einigen der fortschrittlichsten Unternehmen im Bereich KI wie IBM Watson und Microsoft zusammengearbeitet. Was war das interessanteste Projekt, an dem Sie gearbeitet haben?
Ich möchte das erste Patent erwähnen, das mir während meiner Arbeit bei IBM verliehen wurde: eine Methode zur Lösung von Textproblemen in natürlicher Sprache, die bei IBM Watson ein offenes Problem war. Das von mir entwickelte System kann ein in natürlicher Sprache formuliertes arithmetisches oder algebraisches Problem verstehen und in Echtzeit eine Lösung als Antwort in natürlicher Sprache bereitstellen. Dazu musste das System die folgenden Schlüsselschritte bewältigen: Einholen der Eingabeproblemaussagen und der zu beantwortenden Frage; Konvertieren Sie die Eingabesätze in eine Folge von Sätzen, die aus mathematischer Sicht wohlgeformt sind. die wohlgeformten Sätze in mathematische Gleichungen umwandeln; den Gleichungssatz lösen; und erzählen Sie das mathematische Ergebnis in natürlicher Sprache.
Es gibt auch mein bestes Projekt für Microsoft – Softie! Ich habe einen physischen Roboter erfunden und gebaut, der mit verschiedenen Arten austauschbarer Eingabegeräte und Sensoren ausgestattet ist, um Informationen von Menschen zu empfangen. Eine standardisierte Kommunikationsmethode mit dem Computer ermöglichte es dem Benutzer, praktische Anpassungen vorzunehmen und je nach Kontext umfassendere Interaktionen zu ermöglichen. Wir konnten ein robustes System mit Funktionen wie Tastatur, Zeigegerät, Touchscreen, Computer Vision, Spracherkennung usw. implementieren. Wir bildeten ein Team aus verschiedenen Geschäftsbereichen und ermutigten sie, Forschungsanwendungen zur künstlichen Intelligenz und verwandten Bereichen zu erkunden.
Sie sind außerdem Gründer und Präsident von MUST Research, einer gemeinnützigen Organisation, die nach dem Society and Trust Act von Indien registriert ist. Können Sie uns etwas über diese gemeinnützige Organisation erzählen?
MUSS recherchiert werden widmet sich der Förderung von Exzellenz und Kompetenz in den Bereichen Datenwissenschaft, kognitives Computing, künstliche Intelligenz, maschinelles Lernen und fortgeschrittene Analytik zum Wohle der Gesellschaft. MUST zielt darauf ab, ein Ökosystem aufzubauen, das die Interaktion zwischen Wissenschaft und Unternehmen ermöglicht, ihnen hilft, Probleme zu lösen und sie auf die neuesten Entwicklungen im kognitiven Zeitalter aufmerksam zu machen, um Lösungen bereitzustellen, Anleitung oder Schulung anzubieten, Vorträge, Seminare und Workshops zu organisieren und daran zusammenzuarbeiten wissenschaftliche Programme und gesellschaftliche Missionen. Das spannendste Merkmal von MUST ist die Grundlagenforschung zu Spitzentechnologien wie künstliche Intelligenz, maschinelles Lernen, Verarbeitung natürlicher Sprache, Textanalyse, Bildverarbeitung, Computer Vision, Audiosignalverarbeitung, Sprachtechnologie, eingebettete Systeme, Robotik usw.
Was hat Sie dazu inspiriert, MUST Research zu starten?
Aufgrund meiner Liebe zu Science-Fiction-Filmen und Mathematik denke ich oft darüber nach, wie Technologie die Welt verändern kann, und ich habe seit 1993, als ich in der 9. Klasse war, darüber nachgedacht, eine Gruppe gleichgesinnter Experten für fortschrittliche Technologien zu gründen . Als ich meinen ersten Job bekam, dauerte es zehn Jahre, ein Treffen einzuberufen – und weitere zehn Jahre, um eine Gruppe geeigneter Experten zu finden und eine gemeinnützige Gesellschaft zu gründen. Mittlerweile haben wir in MUST in ganz Indien jedoch rund 10 Datenwissenschaftler, die leidenschaftlich zur Erforschung neuer Technologien beitragen.
In den letzten Jahren hat die Branche erhebliche Fortschritte in den Bereichen Deep Learning, Reinforcement Learning, Verarbeitung natürlicher Sprache usw. erzielt. Welchen Bereich des maschinellen Lernens halten Sie derzeit für den spannendsten?
Alle Algorithmen des maschinellen Lernens sind spannend, sobald sie als Produkt oder Dienstleistung implementiert werden, die von Unternehmen oder Einzelpersonen in der realen Welt genutzt werden kann. Die Deep-Learning-Ära hat jedoch Vor- und Nachteile – manchmal hilft sie beim automatischen Feature-Engineering, kann aber gleichzeitig wie eine Blackbox funktionieren und bei geeigneten Datensätzen oder Algorithmen zu einem Garbage-in-Garbage-out-Szenario führen werden nicht verwendet. Einige der neuesten Technologien sind zudem ressourcenintensiv und erfordern große Mengen an Rechenleistung, Zeit und Daten. Das Wichtigste, woran man denken sollte, ist, dass Deep Learning eine Teilmenge des maschinellen Lernens (ML) ist, das wiederum eine Teilmenge der künstlichen Intelligenz (KI) ist, und KI eine Teilmenge der Datenwissenschaft ist – also ist alles miteinander verbunden. Und es geht nicht um Python, R oder Scala – ich habe meine KI-Reise in C begonnen, und man kann sogar KI-Programme in Assembler-Code schreiben. Der Aufbau erfolgreicher KI-Systeme hängt in erster Linie davon ab, das Geschäfts- oder Forschungsumfeld zu verstehen und dann die Punkte zwischen Aktionen und Daten zu verknüpfen, um ein System aufzubauen, das verschiedenen Menschen in verschiedenen Bereichen wirklich hilft. Unabhängig davon, ob Sie mit der Verarbeitung natürlicher Sprache, Computer Vision, Videoanalyse, Sprachtechnologie oder Robotik arbeiten, ist der beste Weg, mit dem einfachsten möglichen Ansatz zu beginnen und dann schrittweise komplexere Methoden anzuwenden, während Sie mit Ihrem System experimentieren und es verfeinern .
Sie sind ein häufiger Gastredner an führenden Universitäten in Indien. Welche Frage hören Sie oft von Studierenden und wie beantworten Sie sie am besten?
Die einzige Frage, die ich am häufigsten höre, ist: „Wie kann ich Datenwissenschaftler werden?“ Ich sage jungen Leuten immer, dass es durchaus möglich ist, und versuche, sie dazu zu bringen, ihre Liebe zur Mathematik, Statistik oder Informatik zu nutzen, um reale Geschäftsprobleme zu lösen. Die Leute fragen auch, wie sie MUST beitreten können, und auch hier ist die Antwort einfach: „Erstellen Sie Ihr Profil mit mehreren Projekten und konzentrieren Sie sich darauf, über den Tellerrand hinauszuschauen.“ Wenn Sie Datenwissenschaftler werden möchten, müssen Sie auch beweisen, dass Sie innovativ sein können. Ohne Innovation können wir uns nicht Wissenschaftler nennen. Natürlich hilft es auch, Patente zu erhalten oder Ihre Forschungsergebnisse in renommierten Fachzeitschriften und Konferenzen zu veröffentlichen!
Sie sind kürzlich als Chefwissenschaftler zum in Redwood City ansässigen Unternehmen Aviso gekommen, um Ihre KI/ML-Expertise einzusetzen. Können Sie uns etwas über Aviso und Ihre Rolle in diesem Unternehmen erzählen?
Bekanntmachung nutzt KI und maschinelles Lernen, um Vertriebsmitarbeiter zu unterstützen und den Geschäftsabschlussprozess zu vereinfachen. Das ist eine faszinierende Herausforderung, und meine Hauptaufgabe besteht darin, das Wachstum des Unternehmens zu fördern und durch intensive Forschung die Voraussetzungen für den Erfolg unserer Kunden zu schaffen. Ich nutze mein Wissen und meine Erfahrung in den Bereichen künstliche Intelligenz und Innovation, um unsere Kernprodukte und Forschungsprojekte weiterzuentwickeln:
Adaptiv: Sie müssen lernen, wenn sich Informationen ändern und sich Ziele und Anforderungen weiterentwickeln. Sie müssen Unklarheiten auflösen und Unvorhersehbarkeit tolerieren. Sie müssen so konstruiert sein, dass sie dynamische Daten in Echtzeit verarbeiten können.
Interactive: Sie müssen problemlos mit Benutzern interagieren, damit diese ihre Bedürfnisse bequem definieren können. Sie müssen mit anderen Prozessoren, Geräten, Diensten sowie mit Menschen interagieren.
Iterativ und zustandsbehaftet: Sie müssen bei der Definition eines Problems helfen, indem sie Fragen stellen oder zusätzliche Quellenangaben finden, wenn eine Problemstellung mehrdeutig oder unvollständig ist. Sie müssen sich an frühere Interaktionen in einem Prozess erinnern und Informationen zurückgeben, die für die spezifische Anwendung zu diesem Zeitpunkt geeignet sind.
Kontext: Sie müssen Kontextelemente wie Bedeutung, Syntax, Zeit, Ort, entsprechende Domäne, Vorschriften, Benutzerprofil, Prozess, Aufgabe und Ziel verstehen, identifizieren und extrahieren. Sie müssen auf mehrere Informationsquellen zurückgreifen, darunter sowohl strukturierte als auch unstrukturierte digitale Informationen.
Was hat Sie an dieser Position bei Aviso gereizt?
Aviso arbeitet daran, aufgeblähte Legacy-CRM-Systeme durch reibungslose, KI-gestützte Tools zu ersetzen, die umsetzbare Erkenntnisse liefern und das volle Potenzial von Vertriebsteams ausschöpfen können. Unser Produkt ist ein intelligentes System, das die Schwachstellen von Vertriebsmitarbeitern versteht, die zeitaufwändige Dateneingabe überflüssig macht und Führungskräften die Vorschläge und Anleitungen gibt, die sie für einen effektiven Geschäftsabschluss benötigen. Ich war von dem starken Führungsteam und der starken Kundenbasis angezogen, aber auch von Avisos Engagement, anspruchsvolle KI-Tools zur Lösung realer Herausforderungen einzusetzen. Der Verkauf ist ein wesentlicher Bestandteil jedes Unternehmens, und Aviso hilft dabei, indem es die Leistungsfähigkeit der künstlichen Intelligenz nutzt. Volltreffer! Was will man mehr?
Gibt es zum Schluss noch etwas, das Sie zum Thema KI mitteilen möchten?
Künstliche Intelligenz macht eine neue Klasse von Problemen berechenbar. Um auf das fließende Verständnis der Benutzer für ihre Probleme zu reagieren, bietet das kognitive Computersystem nicht nur eine Synthese von Informationsquellen, sondern auch von Einflüssen, Kontexten und Erkenntnissen. Diese Systeme unterscheiden sich von aktuellen Computeranwendungen dadurch, dass sie über das Tabellieren und Berechnen auf der Grundlage vorkonfigurierter Regeln und Programme hinausgehen. Sie können auf der Grundlage allgemeiner Ziele Schlussfolgerungen ziehen und diese sogar begründen. In diesem Sinne ist Cognitive Computing eine neue Art des Rechnens mit dem Ziel, genauere Modelle dafür zu entwickeln, wie das menschliche Gehirn oder der Geist Reize wahrnimmt, begründet und darauf reagiert. Dabei handelt es sich um einen Studienbereich, der untersucht, wie man Computer und Computersoftware entwickelt, die zu intelligentem Verhalten fähig sind. Dieses Feld ist interdisziplinär: Künstliche Intelligenz ist ein Ort, an dem eine Reihe von Wissenschaften und Berufen zusammenlaufen, darunter Informatik, Elektronik, Mathematik, Statistik, Psychologie, Linguistik, Philosophie, Neurowissenschaften und Biologie. Das macht es so spannend!
