Штучний інтелект
Доктор Лінджія Танг, технічний директор і співзасновник, Clinc – Серія інтерв’ю

Доктор Лінджія Танг, технічний директор і співзасновник Clinc, є професором комп’ютерних наук університету Мічигану. Дослідження доктора Танга щодо створення великомасштабної інфраструктури виробництва для інтелектуальних застосунків широко визнані і поважаються в академічному співтоваристві. Окрім роботи в Microsoft і Google, Лінджія отримала ступінь доктора філософії з комп’ютерних наук у університеті Вірджинії. Лінджія нещодавно отримала престижні нагороди, включаючи ISCA Hall of Fame, Facebook Research Awards і Google research Award.
Що спочатку привернуло вашу увагу до штучного інтелекту? Коли ви вперше виявили, що хочете створити бізнес, пов’язаний з штучним інтелектом?
У середині 2000-х років я проводила дослідження щодо великомасштабних систем, які підтримують різні застосунки, і того, як ми можемо розробити сервери як програмну систему для більш ефективного виконання цих застосунків. На той час ми перейшли від традиційних веб-застосунків до застосунків, керованих машинним навчанням. Саме тоді я почала звертати увагу на алгоритми, пов’язані з штучним інтелектом, і стала цікавитися фундаментальним розумінням того, як працюють застосунки штучного інтелекту. Незабаром після цього дослідницька команда, з якою я працювала, вирішила змінити напрямок і створити自己的 застосунки штучного інтелекту як бенчмарки для вивчення, що призвело до публікації наших перших дослідницьких робіт і розробки нашого першого продукту, Sirius – відкритого кінцевого голосового і візуального персонального помічника.
Як відкритий програмний продукт, Sirius дозволяв людям створювати віртуальних помічників для розмов на власному рівні. На той час це була дуже обмежена можливість для загальної громадськості і була фактично під контролем великих компаній, таких як Google і Apple. Однак ми побачили, що ми заповнюємо критичний розрив, коли випустили програмне забезпечення і побачили, що воно мало десятки тисяч завантажень за перший тиждень! Це був переломний момент, коли ми зрозуміли, що існує великий попит на таке програмне забезпечення.
У 2015 році ми запустили Clinc з думкою, що ми зможемо надати кожному – кожному розробнику, компанії, людині – хто хоче створити віртуального помічника з доступом до експертизи, інструментів і інновацій для цього.
Clinc пропонує рішення з розмовного штучного інтелекту без використання ключових слів або сценаріїв. Чи можете ви розповісти про те, як це досягається? Які деякі з природно-мовних обробних завдань, які мали бути подолані?
Що дійсно відрізняє Clinc від інших платформ розмовного штучного інтелекту на ринку, це його основні алгоритми штучного інтелекту, які забезпечують досвід “людини в кімнаті”, який розуміє нечітку і несценарну мову. Це дозволяє виправляти помилки, повертатися назад і “лікувати” помилки, зроблені в людській розмові, і дозволяє складні розмовні потоки – розмови, які справжня людина могла б зрозуміти. На відміну від алгоритму зіставлення слів мовлення-до-тексту, Clinc аналізує десятки факторів з вводу користувача, включаючи формулювання, настрій, намір, тон голосу, час доби, місце розташування і відносини, і використовує ці фактори для надання відповіді, яка представляє собою композит знань, витягнутих з його навченого мозку. Наприклад, якщо я запитую свого віртуального помічника: “Скільки грошей я витратив на гамбургер?”, йому потрібно зрозуміти, що я запитую про гроші і витрати, що я запитую конкретно про гамбургер і що гамбургер є типом їжі і повинен бути зіставлений з моїми недавніми витратами в ресторані.
Досягнення цього рівня розуміння не є легким. Загалом, ми б розбили розмовний штучний інтелект на два компоненти: природно-мовне розуміння (NLU) і управління діалогом. Отже, завдання, яке нам потрібно було подолати, полягало в тому, щоб створити систему, яка може точно витягувати ключові частини інформації і передбачати, про що запитує користувач.
Ми можемо зробити це завдяки складному, контекстному, зверху-вниз NLU, який навчений бути інтуїтивним за своєю природою, щоб відповідати природному потоку розмови, розуміти сленг і контекст. Це на відміну від конкурентних рішень, які мають зверху-вниз, заснований на правилах підхід до природно-мовної обробки (NLP), який не дозволяє розмовного лікування, тобто якщо клієнт робить помилку, конкурентні рішення змушують їх повернутися до початку, марнуючи час і тільки розчаровуючи користувача. Ми також використовуємо краудсорсинг для витягування наших мовних даних для створення більш багатого, різноманітного набору даних, який можна негайно використовувати для навчання моделей штучного інтелекту.
Чи можете ви обговорити, як глибоке навчання використовується в системі Clinc AI?
Clinc використовує гібридний підхід до глибокого навчання, де ми використовуємо традиційну стару школу моделі до певної міри і використовуємо глибоке навчання, де це потрібно. Конкретно, ми використовуємо глибоке навчання для розуміння слів і мов для визначення потоку діалогу. Загалом, наш весь діалог є комбінацією глибокого навчання і символічного штучного інтелекту. Ми не використовуємо глибоке навчання для генерації мови ще, оскільки, коли мова йде про наших клієнтів, які в основному знаходяться в банківській галузі, існують багато регуляцій, яким віртуальний помічник повинен слідувати, які диктують, що вони можуть і не можуть говорити своїм клієнтам. Отже, все ще існує багато невизначеності щодо того, чи зможе глибоке навчання слідувати цим встановленим мовним обмеженням.
На даний момент я не думаю, що спільнота розмовного штучного інтелекту повністю готова повністю прийняти глибоке навчання, тоді як академічне співтовариство на 100% все в цьому. Але я з нетерпінням чекаю, щоб побачити, що можуть зробити нові моделі.
Який процес для компанії, яка бажає налаштувати відповіді штучного інтелекту для націлювання на конкретну аудиторію? Чи можете ви надати приклади того, як Clinc зараз використовується клієнтами?
Ми дозволяємо клієнтам ліцензувати платформу, яку вони можуть побудувати як їм заманеться, або взяти наш повністю побудований і навчений чат-бот, Finie, і налаштувати його та інтегрувати його в їх додатки або сервіси повідомлень. Finie може обробляти питання, пов’язані з балансами, транзакціями, історією витрат, пошуком банкомату, переказом коштів та іншим.
Мій улюблений приклад того, як клієнт налаштував штучний інтелект Clinc для націлювання на конкретну аудиторію, – це İşbank. Як найбільший приватний банк Туреччини, вони звернулися до нас для розробки свого цифрового банківського помічника, Maxi, у 2018 році. Щоб наповнити Maxi унікальною особистістю, İşbank провів 14 фокус-груп для визначення тих рис і навичок, яких клієнти банку хочуть у віртуальному помічнику. Вони також найняли актрису озвучування, щоб прочитати речення турецькою мовою, пов’язані з банківськими завданнями. Команда розмовного банку İşbank прийшла з цими реченнями, розглянувши, як реальні люди могли б сформулювати свої потреби. За нашою рекомендацією, команда заплатила учасникам на ринку краудсорсингу, chẳng hạn як Amazon Mechanical Turk, щоб надати різні способи вираження тих самих питань, chẳng hạn як запит про перегляд їх балансу (“який mijn баланс”, “скільки грошей у мене на рахунку”, “покажіть мені гроші на моєму рахунку”) або оплату рахунку (“оплатіть мій рахунок”, “оплата рахунку”).
Цей приклад дійсно показує, наскільки İşbank інвестує в пропозицію цифрового банківського помічника для допомоги клієнтам у навігації їх рахунків. З Clinc, İşbank запустив Maxi для більш ніж 7,5 мільйонів людей, турецькою мовою. З моменту запуску İşbank побачив широке прийняття більш ніж 5,5 мільйонами користувачами, з середнім показником 9,8 взаємодій на користувача. У останні місяці, коли випадки COVID-19 зросли в Туреччині, İşbank швидко навчив Maxi відповідати на запитання, пов’язані з COVID-19. З березня 2020 року Maxi відповів на понад 1,2 мільйона запитань клієнтів, пов’язаних з COVID-19, що становить понад 62% зростання використання.
Що ви сказали б жінкам, які цікавляться вивченням штучного інтелекту, але які вагаються вступити в цю галузь через те, що вона домінує чоловіків?
З самого початку я не думаю, що є причина, чому штучний інтелект вважається галуззю, домінуючою чоловіків. Я думаю, що є багато жінок-піонерів у штучному інтелекті, які роблять дуже добре і мають вплив. Я думаю, що штучний інтелект, поєднаний з соціальною політикою, є унікальною областю, яка має потенціал мати великий вплив на повсякденне життя людей. Це саме те місце, де я думаю, що більш різноманітні погляди по всьому фронту дійсно принесуть користь, особливо оскільки існує багато розмов про упередженість штучного інтелекту, пов’язану з расою і статтю. Я вірю, що наявність обмеженого співтовариства розробників штучного інтелекту продовжить мати непропорційний вплив на суспільство і політику.
Для жінок, які цікавляться вступом у галузь штучного інтелекту, я високо рекомендую це, особливо якщо ви цікавитесь тим, щоб мати вплив. Штучний інтелект мав так багато зростання і інновацій за роки, і це дійсно цікавий час для того, щоб бути частиною цього.
Чи є щось інше, що ви хотіли б поділитися про Clinc?
Clinc робить величезні кроки зараз. Особисто я тільки що перейшла на нову роль технічного директора Clinc і я дуже рада зосередитися на тому, як ми можемо далі працювати з розробниками і вченими-даними для зростання охоплення нашої технології. Коли я дивлюся в майбутнє, я бачу, що попит на застосунки, підтримувані штучним інтелектом, зсувається в бік того, щоб дозволити людям, які не мають років досвіду в галузі науки про дані і машинного навчання, використовувати його теж. Наприклад, вам не потрібно мати ступінь графічного дизайну, щоб використовувати Photoshop. Я думаю, що штучний інтелект рухається в цьому напрямку, де розробники без досвіду штучного інтелекту і машинного навчання зможуть досягти результатів і створювати високоякісні застосунки. Загалом, ми хочемо повторити, що ми не тільки присвячені кінцевому користувачеві, але також розробникам, незалежно від рівня, які проявляють інтерес до нашого рішення.
Дякую за велике інтерв’ю, я з нетерпінням чекаю подальших ваших кроків. Хто бажає дізнатися більше, повинен відвідати Clinc.












