Künstliche Intelligenz

Googles neuer Meena-Chatbot kann sinnvolle, spezifische Gespräche über fast alles führen

mm

So beeindruckend und nützlich virtuelle Assistenten wie Siri, Alexa und Google Assistant auch sind, sind ihre konversationellen Fähigkeiten in der Regel auf das Empfangen bestimmter Befehle und das Liefern vordefinierter Antworten beschränkt. Unternehmen wie Google und Amazon haben Methoden der AI-Schulung und -Entwicklung verfolgt, um AI-Chatbots robuster und flexibler zu machen, damit sie Gespräche mit Benutzern auf eine viel natürlichere Weise führen können. Wie von DigitalTrends berichtet, hat Google kürzlich eine Studie veröffentlicht, die die Fähigkeiten seines neuen Chatbots, genannt “Meena”, demonstriert. Laut einem Blog-Beitrag der Forscher kann Meena Gespräche mit seinen Benutzern über fast jedes Thema führen.

Meena ist ein offener Chatbot, was bedeutet, dass er auf den Kontext des Gesprächs reagiert und sich an die Eingaben anpasst, um natürlichere Antworten zu liefern. Die meisten anderen Chatbots sind geschlossen, was bedeutet, dass ihre Antworten thematisch um bestimmte Ideen und begrenzt auf die Erledigung bestimmter Aufgaben sind.

Laut Googles Bericht war Meenas Flexibilität das Ergebnis eines riesigen Trainingsdatensatzes. Meena wurde auf etwa 40 Milliarden Wörtern trainiert, die aus sozialen Medien-Gesprächen stammten und auf die relevantesten und repräsentativsten Wörter gefiltert wurden. Google versuchte, einige der Probleme zu lösen, die in den meisten Sprachassistenten gefunden werden, wie die Fähigkeit, Themen und Befehle zu handhaben, die sich über mehrere Gesprächsrunden erstrecken, wobei der Benutzer nach der Antwort des Bots zusätzliche Eingaben liefert. Dies bedeutet, dass viele Chatbots nicht in der Lage sind, den Benutzer um Klarstellung zu bitten und wenn es eine Anfrage gibt, die nicht interpretiert werden kann, oft einfach auf Web-Ergebnisse zurückgreifen.

Um mit diesem speziellen Problem umzugehen, ermöglichten Googles Forscher es ihren Algorithmen, den Kontext des Gesprächs zu verfolgen, was bedeutet, dass es spezifische Antworten generieren kann. Das Modell verwendete einen Encoder, der verarbeitet, was bereits im Gespräch gesagt wurde, und einen Decoder, der eine Antwort basierend auf dem Kontext erstellt. Das Modell wurde auf spezifischen und unspezifischen Daten trainiert. Spezifische Daten sind Wörter, die eng mit der vorherigen Aussage verbunden sind. Wie der Google-Beitrag erklärte:

„Wenn A sagt: ‚Ich liebe Tennis‘ und B antwortet: ‚Das ist schön‘, dann sollte die Äußerung als ‚nicht spezifisch‘ markiert werden. Diese Antwort könnte in Dutzenden von verschiedenen Kontexten verwendet werden. Aber wenn B antwortet: ‚Mir auch, ich kann nicht genug von Roger Federer bekommen!‘, dann wird es als ‚spezifisch‘ markiert, da es eng mit dem besprochenen Thema verbunden ist.

Die Daten, die zum Trainieren des Modells verwendet wurden, bestanden aus sieben „Runden“ im Gespräch. Während des Trainings hatte das Modell 2,6 Milliarden Parameter, die 341 GB Textdaten auf Muster untersuchten, ein Datensatz, der etwa 8,5-mal größer war als der Datensatz, der zum Trainieren des GPT-2-Modells von OpenAI verwendet wurde.

Google berichtete, wie Meena bei der Sensibleness and Specificity Average (SSA)-Metrik abschnitt. Die SSA ist eine Metrik, die von Google-Forschern entwickelt wurde und darauf abzielt, die Fähigkeit einer konversationellen Entität zu quantifizieren, relevante und spezifische Antworten als Gespräch fortschreitet.

SSA-Scores werden berechnet, indem ein Modell gegen eine feste Anzahl von Prompts getestet wird und die Anzahl der sinnvollen Antworten, die das Modell liefern kann, verfolgt wird. Der Score des Modells wird basierend auf dem Prozentsatz der sinnvollen/spezifischen Antworten berechnet, die das Modell liefern konnte. Generische Antworten werden bestraft. Laut Google erreicht eine durchschnittliche Person einen Score von etwa 86 % bei der SSA, während Meena einen Score von 79 % erreichte. Ein weiteres bekanntes AI-Modell, ein Agent, der von Pandora Bots erstellt wurde, gewann den Loebner-Preis für die Erreichung einer sophisticateden, menschenähnlichen Kommunikation. Der Pandora-Bots-Agent erreichte etwa 56 % bei der SSA-Test.

Microsoft und Amazon versuchen auch, flexiblere und natürlichere Chatbots zu erstellen. Microsoft hat versucht, multiturn-Gespräche in Chatbots zu erstellen, indem es Semantic Machines, ein AI-Startup, erworben hat, um Cortana zu verbessern. Amazon hat kürzlich den Alexa-Preis-Wettbewerb durchgeführt, bei dem Teilnehmer aufgefordert wurden, einen Bot zu entwerfen, der etwa 20 Minuten lang konversieren kann.

Blogger und Programmierer mit Spezialisierungen in Machine Learning und Deep Learning Themen. Daniel hofft, anderen zu helfen, die Macht von KI für das soziale Wohl zu nutzen.