Штучний інтелект
Новий чат-бот Google Meena може підтримувати розумні та конкретні розмови майже про будь-що

Як би вражаючими та корисними не були віртуальні помічники, такі як Siri, Alexa та Google Assistant, їхні розмовні навички зазвичай обмежені прийняттям певних команд і надання попередньо визначених відповідей. Компанії, такі як Google та Amazon, розробляють методи навчання та вдосконалення штучного інтелекту, щоб зробити чат-боти більш надійними та гнучкими, щоб вони могли підтримувати розмови з користувачами більш природним чином. Як повідомляє DigitalTrends, Google недавно опублікував статтю, яка демонструє можливості свого нового чат-бота, який називається “Meena”. За повідомленням блогу дослідників, Meena може підтримувати розмову з користувачами майже про будь-що.
Meena є відкритим чат-ботом, тобто він реагує на контекст розмови та адаптується до вхідних даних, щоб надавати більш природні відповіді. Більшість інших чат-ботів є закритими, тобто їхні відповіді тематично обмежені певними ідеями та призначені для виконання конкретних завдань.
За повідомленням Google, гнучкість Meena була результатом величезної навчальної бази даних. Meena була навчена на близько 40 мільярдах слів, взятих із розмов у соціальних мережах та відфільтрованих для отримання найбільш актуальних та репрезентативних слів. Google намагалася вирішити деякі проблеми, які існують у більшості голосових помічників, таких як можливість обробляти теми та команди, які розгортаються протягом кількох кроків у розмові, коли користувач надає додаткові вхідні дані після того, як бот відповів на один вхід. Це означає, що більшість чат-ботів не можуть запитати у користувача уточнення та коли виникає запит, який не може бути інтерпретований, вони часто просто переходять до результатів пошуку.
Щоб вирішити цю конкретну проблему, дослідники Google змогли налаштувати свої алгоритми для відстеження контексту розмови, тобто вони можуть генерувати конкретні відповіді. Модель використовувала кодувальник, який обробляє те, що вже було сказано у розмові, та декодувальник, який створює відповідь на основі контексту. Модель була навчена на конкретних та неконкретних даних. Конкретні дані – це слова, які тісно пов’язані з попереднім твердженням. Як пояснюється у повідомленні Google:
“Наприклад, якщо А каже: “Мені подобається теніс”, а Б відповідає: “Це добре”, то висловлення повинно бути позначено як “не конкретне”. Ця відповідь могла б бути використана в десятках різних контекстів. Але якщо Б відповідає: “Мені теж, я не можу насытитися Роджером Федерером!”, то це позначається як “конкретне”, оскільки це тісно пов’язано з тим, що обговорюється.
Дані, які були використані для навчання моделі, складалися з семи “кроків” у розмові. Під час навчання модель мала 2,6 мільярда параметрів, які аналізували 341 ГБ текстових даних для пошуків закономірностей, бази даних, яка у 8,5 рази більша за базу даних, використану для навчання моделі GPT-2 створеної OpenAI.
Google повідомила про те, як Meena показала себе у метриці Sensibleness and Specificity Average (SSA). SSA – це метрика, розроблена дослідниками Google, і вона призначена для кількісної оцінки здатності розмовної сутності відповідати конкретними, актуальними відповідями під час розмови.
Оцінки SSA розраховуються шляхом тестування моделі на фіксованому числі запитів, і кількість розумних відповідей, які модель надає, відстежується. Оцінка моделі виводиться на основі відсотка розумних/конкретних відповідей, які модель змогла надати щодо запитів. Загальні відповіді штрафуються. За повідомленням Google, середня людина набирає близько 86% у оцінці SSA, тоді як Meena змогла набрати 79%. Інша відома модель штучного інтелекту, створена Pandora Bots, виграла премію Лебнера за те, що їхні чат-боти досягли складної, подібної до людської, комунікації. Агент Pandora Bots набрав приблизно 56% у тесті SSA.
Microsoft та Amazon також намагаються створити більш гнучкі та природні чат-боти. Microsoft протягом двох років намагається створити багатоступеневі діалоги в чат-ботах, придбавши Semantic Machines, стартап штучного інтелекту, для вдосконалення Cortana. Amazon недавно провела челендж Alexa Prize, який закликав учасників розробити бота, який міг би підтримувати розмову протягом приблизно 20 хвилин.












