Connect with us

Новая чат-бота Google Meena может вести осмысленные и конкретные разговоры почти на любую тему

Искусственный интеллект

Новая чат-бота Google Meena может вести осмысленные и конкретные разговоры почти на любую тему

mm

На сколько впечатляющими и полезными могут быть виртуальные помощники, такие как Siri, Alexa и Google Assistant, их способности к разговору обычно ограничены получением определенных команд и доставкой предопределенных ответов. Компании, такие как Google и Amazon, занимаются методами обучения и разработки ИИ, которые могут сделать чат-боты ИИ более прочными и гибкими, способными вести разговоры с пользователями более естественным образом. Как сообщает DigitalTrends, Google недавно опубликовала статью, демонстрирующую возможности своей новой чат-боты, получившей название «Meena». Согласно блог-посту исследователей, Meena может вести разговор с пользователями几乎 на любую тему.

Meena – это чат-бот с открытым доменом, то есть она реагирует на контекст разговора и адаптируется к входным данным, чтобы предоставлять более естественные ответы. Большинство других чат-ботов являются закрытыми, то есть их ответы тематически связаны с определенными идеями и ограничены выполнением конкретных задач.

Согласно отчету Google, гибкость Meena стала результатом огромной обучающей базы данных. Meena была обучена на примерно 40 миллиардах слов, взятых из социальных сетей и отфильтрованных для получения наиболее релевантных и представительных слов. Google стремилась решить некоторые проблемы, найденные в большинстве голосовых помощников, такие как способность обрабатывать темы и команды, которые разворачиваются в течение нескольких оборотов в разговоре, когда пользователь предоставляет дополнительные входные данные после ответа бота. Это означает, что многие чат-боты не могут запросить у пользователя уточнения и когда возникает запрос, который не может быть интерпретирован, они часто просто переходят к результатам поиска.

Чтобы решить эту конкретную проблему, исследователи Google позволили своим алгоритмам отслеживать контекст разговора, что означает, что они могут генерировать конкретные ответы. Модель использовала кодировщик, который обрабатывает то, что уже было сказано в разговоре, и декодировщик, который создает ответ на основе контекста. Модель была обучена на конкретных и не конкретных данных. Конкретные данные – это слова, которые тесно связаны с предыдущим заявлением. Как объяснил пост Google:

«Например, если А говорит: «Я люблю теннис», и Б отвечает: «Это хорошо», то высказывание должно быть отмечено как «не конкретное». Этот ответ можно использовать в десятках разных контекстов. Но если Б отвечает: «Мне тоже, я не могу насытиться Роджером Федерером!», то это отмечено как «конкретное», поскольку оно тесно связано с тем, что обсуждается.

Данные, использованные для обучения модели, состояли из семи «поворотов» в разговоре. Во время обучения модель имела 2,6 миллиарда параметров, которые анализировали 341 ГБ текстовых данных для поиска закономерностей, базы данных примерно в 8,5 раза больше, чем база данных, использованная для обучения модели GPT-2 созданной OpenAI.

Google сообщила, как Meena справилась с метрикой Sensibleness and Specificity Average (SSA). SSA – это метрика, разработанная исследователями Google, и она предназначена для количественной оценки способности разговорного агента отвечать конкретными, релевантными ответами по мере продолжения разговора.

Оценки SSA рассчитываются путем тестирования модели на фиксированном количестве подсказок, и количество осмысленных ответов, которые дает модель, отслеживается. Оценка модели основана на проценте осмысленных/конкретных ответов, которые модель смогла дать по отношению к подсказкам. Общие ответы штрафуются. Согласно Google, средний человек набирает около 86% по SSA, в то время как Meena смогла набрать 79%. Другая известная модель ИИ, агент, созданный Pandora Bots, выиграл приз Лёбнера в знак признания того, что их боты ИИ достигли сложного, похожего на человеческий, общения. Агент Pandora Bots достиг примерно 56% в тесте SSA.

Microsoft и Amazon также пытаются создать более гибкие и естественные чат-боты. Microsoft пытается создать многоповоротный диалог в чат-ботах в течение двух лет, приобретая Semantic Machines, стартап ИИ, для улучшения Cortana. Amazon недавно провела вызов Alexa Prize, который побуждал участников разработать бота, способного вести разговор примерно 20 минут.

Блогер и программист с специализацией в Machine Learning и Deep Learning темах. Daniel надеется помочь другим использовать силу ИИ для социального блага.