Künstliche Intelligenz
Dr. Neil Yager, Co-Founder und Chief Scientist von Phrasee – Interview-Serie

Dr. Neil Yager ist der Chief Scientist von Phrasee, und der Architekt der Phrasee-Methode, einem künstlichen Intelligenz-gestützten Copywriting-Tool, das geholfen hat, Marketing-Copy für einige der weltweit bekanntesten Marken zu optimieren, darunter eBay, Groupon und Virgin – sowie viele weitere, von Australien bis Amerika, in über 20 Sprachen, von Englisch bis Japanisch.
Dr. Yager hat über ein Dutzend akademische Veröffentlichungen geschrieben, ein Buch über Data-Mining verfasst und hält mehrere Patente. Als einer der weltweit führenden Experten für die Kommerzialisierung von künstlicher Intelligenz hält er einen PhD in Informatik von der University of New South Wales in Australien.
Sie sind ein 20-jähriger Veteran der Tech-Industrie, welche AI-bezogenen Rollen hatten Sie zuvor?
Ich bin seit meinem PhD in den mittleren 2000er Jahren in AI-bezogener Arbeit involviert. Allerdings hat sich das Feld seitdem mehrmals umgebrannt. Zum Beispiel habe ich vor 15 Jahren “statistische Mustererkennung” studiert. Ein paar Jahre später war dies als “Machine Learning” bekannt, was ein viel ansprechenderer Name ist. Vor kurzem ist Machine Learning (und “Deep Learning” im Besonderen) synonym mit “künstlicher Intelligenz” im Allgemeinen geworden. Ich habe gemischte Gefühle darüber. Einerseits hat mich meine Arbeit bei Phrasee gelehrt, wie wichtig Branding ist. Andererseits bringt der Begriff “künstliche Intelligenz” Gepäck mit sich und kann zu Missverständnissen über die Technologie führen. Ich frage mich, wo wir wären, wenn wir alle noch “statistische Mustererkennung” nennen würden.
Die meisten meiner vorherigen Arbeiten waren in den Bereichen Signalverarbeitung und Computer-Vision. Ich hatte vor Phrasee nicht viel Erfahrung mit natürlicher Sprachverarbeitung. Ich habe seitdem gelernt, dass Sprache wahrscheinlich das schwierigste Problem in der künstlichen Intelligenz ist.
Im Jahr 2008 haben Sie ein Buch mit dem Titel ‘Biometric System und Datenanalyse: Design, Bewertung und Data-Mining‘ co-verfasst, das Aspekte der Statistik und des Machine Learning verbindet, um einen umfassenden Leitfaden für die Bewertung, Interpretation und das Verständnis von biometrischen Daten zu bieten. Glauben Sie, dass sich dieses Feld seit der Veröffentlichung des Buches entwickelt hat? Können Sie beschreiben, wie?
Deep Learning hat die Bereiche Computer-Vision, Sprachverarbeitung und Machine Learning seitdem ich das Buch geschrieben habe, revolutioniert. Es wäre nicht möglich, das Buch heute ohne ein Kapitel über Deep Learning zu schreiben.
Die Deep-Learning-Revolution begann wirklich 2012, als ein Deep-Learning-Modell einen Wettbewerb namens ImageNet gewann. ImageNet ist ein visuelles Objekterkennungs-Datensatz, bei dem der Computer bestimmt, was in einem Bild ist (z.B. “Hund” oder “Ballon”). Für Jahrzehnte hatten Forscher schrittweise Fortschritte auf Benchmark-Datensätzen wie diesem erzielt. Jedes Teilgebiet operierte unabhängig und verließ sich stark auf domänen-spezifisches Fachwissen. Fast über Nacht wurden alle Modelle, die über viele Jahre sorgfältig aufgebaut worden waren, veraltet. Deep-Learning-Algorithmen, die von Außenstehenden entworfen wurden, gewannen Wettbewerbe mit erheblichen Margen. Dies transformierte die KI-Industrie.
Das Feld bewegt sich immer noch schnell und hat sich sogar seit der Gründung von Phrasee vor einigen Jahren weiterentwickelt. Zum Beispiel existierten die Deep-Learning-Tools, auf die wir jetzt angewiesen sind, nicht, als wir das Unternehmen gründeten. Der Innovationsprozess bringt seine eigenen Herausforderungen mit sich.
Können Sie uns mitteilen, was Phrasee für Unternehmen leisten kann?
Phrasee löst zwei Probleme für Unternehmen. Erstens gibt es das Problem des Schreibens von Marketing-Texten. Es gibt mehr Werbekanäle als je zuvor (z.B. E-Mail, AdWords, Social-Media, Print, Podcasts usw.). Es ist schwierig, Texte für all diese Kanäle zu schreiben, die von hoher Qualität sind und dem Markenstil und Ton entsprechen. Phrasee löst das Skalierungsproblem, indem es Texte automatisch generiert. Zweitens ist es wichtig, dass alle verwendete Sprache effektiv ist. Phrasee generiert nicht nur Sprache, sondern verwendet auch Machine Learning, um die Auswirkungen der Botschaften vorherzusagen und entsprechend zu optimieren.
Was hat Sie zur Idee inspiriert, Natural Language Processing (NLP) und Deep Learning zu nutzen, um die Kraft von Werbetexten zu verbessern?
Die Verwendung von KI, um die Auswirkungen von digitalen Marketing-Kampagnen zu maximieren, ist keine neue Idee. Es gibt Teams von Menschen mit PhDs in Physik, die für die Optimierung von Werbung rekrutiert wurden. Allerdings konzentrieren sich diese Teams in den meisten Fällen auf Dinge wie Zielgruppensegmentierung, Personalisierung, Lieferzeit, Werbeplatzierung, Schriftarten usw. Als wir Ideen für Phrasee ausgetauscht haben, bemerkten wir, dass fast alles über Werbung optimiert wird, außer der tatsächlichen Sprache, die verwendet wird! Wir identifizierten dies als eine Lücke im Markt und eine enorme Chance.
Phrasee kann Marketing-Texte in über 20 Sprachen verbessern, einschließlich Japanisch. Können Sie einige der einzigartigen NLP-Probleme besprechen, die bei Fremdsprachen auftreten?
Der neueste Zusatz zu unserem Satz unterstützter Sprachen ist Russisch. Dies ist eine slawische Sprache und unterscheidet sich erheblich von anderen indogermanischen Sprachen. In diesem Fall mussten wir neue Regeln in unser Sprachgenerierungssystem einbauen, damit die Ausgabe flüssig und grammatikalisch korrekt ist. Dies ist nicht nur ein Sprachproblem, sondern auch ein Software-Entwicklungsproblem. Wenn die Ausgabe unseres Systems in der Muttersprache des Entwicklers ist, ist es relativ einfach, Fehler zu erkennen und zu überprüfen, ob alles korrekt funktioniert. Wenn wir jedoch an Russisch oder Japanisch arbeiten, könnten wir Unsinn ausgeben und haben keine Ahnung. Es ist wichtig, einen Muttersprachler eng in den QA-Prozess einzubinden.
Die Herausforderung besteht nicht nur bei Fremdsprachen. Es gibt auch interessante regionale Unterschiede. Zum Beispiel hat Englisch Rechtschreibvarianten für die USA, Großbritannien, Australien, Kanada usw. Es gibt auch grammatische Unterschiede. Im britischen Englisch “schaut man”, während im amerikanischen Englisch “man einen Blick wirft”. Die Bedeutung von Wörtern kann auch von Ort zu Ort variieren. Ein “Gummi” ist ein Radiergummi im Vereinigten Königreich, aber ein Kondom in Nordamerika! Damit NLG-Systeme für Geschäftsanwendungen verwendet werden können, müssen sie all diese Feinheiten beherrschen.
Können Sie auch einige Details darüber teilen, wie Deep Learning in Phrasee verwendet wird?
Es gibt zwei Haupt-KI-Komponenten in Phrasees Technologie. Die erste ist Natural Language Generation (NLG), die tatsächlich Sprache erzeugt. Die zweite ist Deep Learning, und der Fokus liegt hier auf Leistung. Leistung kann je nach Kontext unterschiedliche Dinge bedeuten. Zum Beispiel ist das Ziel einer E-Mail-Betreffzeile, den Empfänger dazu zu bringen, die E-Mail zu öffnen und den Inhalt zu sehen. Bei Facebook könnte das Ziel darin bestehen, Likes oder Shares zu maximieren. Wenn große Mengen an historischen Daten vorliegen, kann man feine Trends und Muster finden, die einem Menschen nie auffallen würden. Dies ist ein Standard-Machine-Learning-Problem.
Deep Learning bietet einige Vorteile gegenüber dem traditionellen Machine-Learning-Ansatz. Bei traditionellem Machine Learning liegt der Fokus stark auf “Feature-Engineering”. Das bedeutet, dass der Entwickler entscheiden muss, was er für die wichtigsten Merkmale der Sprache hält. Zum Beispiel Wörter, Länge, Emoji-Verwendung usw. Das Problem ist, dass dies durch die Fähigkeiten und die Vorstellungskraft des Ingenieurs begrenzt ist. Bei Deep Learning wird der rohe Text in das Modell eingegeben, und es baut seine eigene maschinelle Repräsentation der Sprache auf (dies wird als End-to-End-Lernen bezeichnet). Daher ist es frei von menschlichen Vorurteilen und es ist ein leistungsfähiger Ansatz. Allerdings kann es schwierig sein, zu verstehen, warum das Modell sich so verhält, wie es tut. “Erklärbarkeit” ist ein aktives Forschungsgebiet in der Deep-Learning-Community. Es gibt jedoch einen grundlegenden Kompromiss zwischen der Komplexität eines Systems und unserer Fähigkeit, es zu verstehen. Die menschliche Sprache ist chaotisch, daher sind erfolgreiche NLP-Lösungen typischerweise sehr komplex.
Eine der Funktionalitäten von Phrasee ist die Fähigkeit, in einem einzigartigen Ton einer Marke zu schreiben. Können Sie erläutern, wie dies durchgeführt wird?
Wenn wir einen neuen Kunden aufnehmen, sammeln wir zunächst Informationen über den Kommunikationsstil der Marke. Dazu gehören alle formalen Markenrichtlinien, historische Marketing-Kampagnen und eine Reihe von Fragebögen, die wir zu diesem Zweck entwickelt haben. All diese Informationen werden von einem internen Team von Sprachtechnikern verwendet, um ein kundenspezifisches “Sprachmodell” zu erstellen. Unsere Sprachmodelle sind generativ, was bedeutet, dass sie nie zuvor gesehene Sprache im einzigartigen Stil des Kunden erzeugen können.
Sprachmodelle können jederzeit aktualisiert werden. Zum Beispiel sind wir derzeit im Zentrum der COVID-19-Krise. Unser Sprachteam überprüft unsere Modelle, um sicherzustellen, dass unangemessene Sprache nicht erstellt werden kann. Ein Ausdruck wie “Diese Deals sind viral!” wäre vor einigen Monaten harmlos gewesen, ist aber offensichtlich unangemessen inmitten einer globalen Pandemie. Dies zeigt die Flexibilität unseres Systems.
Welche Art von Daten benötigt ein Unternehmen, das mit Phrasee beginnen möchte?
Um ehrlich zu sein, benötigt man nicht viel Daten, um mit uns zu beginnen. Der erste Schritt ist, ein geeignetes Projektgebiet zu identifizieren. Zum Beispiel könnte dies die Betreffzeilen für wöchentliche Promotion-E-Mails sein. Ideal wäre dies ein relativ großes Publikum und regelmäßige Kommunikation. Sobald das Projekt identifiziert ist, benötigen wir Informationen über das beabsichtigte Thema und den Markenton, um das Sprachmodell zu erstellen. Phrasee benötigt Leistungsdaten auf kontinuierlicher Basis. Da unsere Lösung Machine Learning verwendet, ist es wichtig, dass wir Schlüsselkennzahlen überwachen und verfolgen. Diese Informationen werden in unser System eingespeist, damit es kontinuierlich für Engagement optimieren kann.
Gibt es noch etwas, das Sie über Phrasee teilen möchten?
Als Parry, Victoria und ich vor fünf Jahren Phrasee gegründet haben, waren wir sicher, dass es nur eine Frage der Zeit wäre, bis viele andere Startups mit ähnlichen Produkten auftauchen würden. Unser Plan war, den Wettbewerb zu überholen und immer einen Schritt voraus zu sein. Wir waren jedoch überrascht von der geringen Anzahl von Teilnehmern in diesem Bereich. Wo ist jeder andere? Ich denke, es gibt einige Gründe dafür, aber einer der Hauptgründe ist, dass Sprache so ein schwieriges Problem ist. Ich vermute, dass andere versucht haben, ähnliche Produkte zu erstellen, aber früh in der Entwicklungsphase gescheitert sind. Dies ist ein Zeugnis für die Einzigartigkeit unserer Technologie.
Vielen Dank für das informative Interview über Natural Language Processing, Natural Language Generation und Deep Learning. Um mehr zu erfahren, können Besucher Phrasee besuchen.












