Connect with us

Др. Ніл Ягер, співзасновник і головний вчений Phrasee – Серія інтерв’ю

Штучний інтелект

Др. Ніл Ягер, співзасновник і головний вчений Phrasee – Серія інтерв’ю

mm

Др. Ніл Ягер є головним вченим Phrasee, і архітектором методу Phrasee, інструменту копірайтингу, що використовує штучний інтелект, який допоміг оптимізувати маркетинговий контент для деяких з найвідоміших брендів світу, включаючи eBay, Groupon і Virgin – плюс багато інших, від Австралії до Америки, більш ніж 20 мовами, від англійської до японської.

Др. Ягер написав понад десяток академічних публікацій, автор книги про аналіз даних, і володіє кількома патентами. Як один з світових лідерів у комерціалізації штучного інтелекту, він має ступінь доктора філософії з комп’ютерних наук Університету Нового Південного Уельсу в Австралії.

Ви – 20-річний ветеран галузі технологій, які були деякі з ваших попередніх ролей, пов’язаних з штучним інтелектом?

Я займаюсь роботою, пов’язаною з штучним інтелектом, з моменту отримання ступеня доктора філософії в середині 2000-х років. Однак галузь пройшла через кілька ребрендінгів з тих пір. Наприклад, 15 років тому я вивчав “статистичне розпізнавання закономірностей”. Через кілька років це стало відомо як “машинне навчання”, яке є набагато більш привабливою назвою. Нещодавно машинне навчання (і “глибоке навчання” зокрема) стало синонімом “штучного інтелекту” загалом. У мене є змішані почуття щодо цього. З одного боку, моя робота з Phrasee навчила мене важливості брендингу. З іншого боку, термін “штучний інтелект” несе з собою багаж і може привести до неправильних уявлень про технологію. Я дивуюсь, де б ми були, якщо б ми все ще називали це “статистичним розпізнаванням закономірностей”.

Більшість моєї попередньої роботи була в галузі обробки сигналів і комп’ютерного зору. У мене не було великого досвіду роботи з обробкою природної мови до Phrasee. Я згодом дізнався, що мова, ймовірно, є найважчою проблемою в штучному інтелекті.

 

У 2008 році ви співавтор книги під назвою ‘Біометрична система і аналіз даних: проектування, оцінка і аналіз даних‘, яка поєднує аспекти статистики і машинного навчання для надання комплексного керівництва з оцінки, інтерпретації і розуміння біометричних даних. Поза більшими обчислювальними ресурсами, чи вважаєте ви, що ця галузь еволюціонувала з моменту публікації цієї книги? Чи можете ви описати, як?

Глибоке навчання революціонізувало галузі комп’ютерного зору, обробки мови і машинного навчання з моменту написання мною цієї книги. Було б неможливо написати цю книгу сьогодні без розділу про глибоке навчання.

Революція глибокого навчання справді почалася в 2012 році, коли модель глибокого навчання виграла змагання під назвою ImageNet. ImageNet – це візуальна база даних розпізнавання об’єктів, де комп’ютер визначає, що знаходиться на зображенні (наприклад, “собака” або “балон”). Десятиліттями дослідники робили поступові успіхи на таких базах даних. Кожна підгалузь працювала незалежно і сильно залежала від експертизи в певній галузі. Майже за одну ніч всі моделі, які були побудовані за роки, стали застарілими. Моделі глибокого навчання, розроблені сторонніми розробниками, вигравали змагання з великими перевагами. Це перетворило галузь штучного інтелекту.

Галузь все ще швидко рухається і еволюціонувала навіть з моменту заснування Phrasee кілька років тому. Наприклад, інструменти глибокого навчання, на яких ми зараз залежимо, не існували на момент заснування компанії. Темп інновацій приносить свої власні виклики.

 

Чи можете ви поділитися з нами тим, що Phrasee може зробити для бізнесу?

Phrasee вирішує дві проблеми для бізнесу. По-перше, існує проблема написання маркетингового контенту. Тепер існує більше рекламних каналів, ніж будь-коли раніше (наприклад, електронна пошта, AdWords, соціальні мережі, друк, подкасти тощо). Відповідно складно написати контент для всіх цих каналів, який буде високої якості і відповідатиме стилю і тону бренду. Phrasee вирішує проблему масштабу шляхом автоматичної генерації контенту. По-друге, важливо, щоб вся мова, яку використовується, була ефективною. Не тільки Phrasee генерує мову, але також використовує машинне навчання для передбачення впливу повідомлення і оптимізації відповідно.

 

Що привабило вас до ідеї використання обробки природної мови і глибокого навчання для підвищення ефективності рекламного контенту?

Використання штучного інтелекту для максимізації впливу цифрових маркетингових кампаній не є новою ідеєю. Існують команди людей з докторськими ступенями з фізики, які були завербовані для роботи над оптимізацією реклами. Однак у більшості випадків вони зосереджують свої зусилля на таких речах, як сегментація аудиторії, персоналізація, час доставки, розміщення реклами, шрифти тощо. Коли ми вперше обговорювали ідеї для Phrasee, ми помітили, що майже все в рекламі оптимізується, крім мови, яка використовується! Ми визначили це як пробіл на ринку і величезну можливість.

 

Phrasee може покращити маркетинговий контент більш ніж 20 мовами, включаючи японську. Чи можете ви обговорити деякі унікальні проблеми обробки природної мови, з якими стикається іноземна мова?

Найостаннішим доповненням до нашого набору підтримуваних мов є російська. Це слов’янська мова, і вона досить відрізняється від інших індо-європейських мов. У цьому випадку було необхідно побудувати нові правила в нашу систему генерації мови, щоб вихід був вільним і граматично правильним. Це не тільки мова проблема. Це також проблема розробки програмного забезпечення. Коли вихід нашої системи знаходиться в рідній мові розробника, відносно легко помітити помилки і перевірити, що все працює правильно. Однак, коли ми працюємо з російською або японською, ми могли б виводити безсенс і не мали б жодного уявлення. Важливо мати рідного мовця, тісно залученого до процесу забезпечення якості.

Виклик не тільки в іноземних мовах. Є деякі цікаві регіональні відмінності також. Наприклад, англійська мова має варіанти орфографії для США, Великої Британії, Австралії, Канади тощо. Крім того, існують граматичні відмінності. У британській англійській ви “подивіться”, тоді як в американській англійській ви “подивіться”. Значення слів також може відрізнятися з місця на місце. “Резинка” – це стиральна гума у Великій Британії, але презерватив у Північній Америці! Щоб системи генерації мови могли бути використані для бізнес-застосунків, їм потрібно обробляти всі ці нюанси.

 

Чи можете ви також поділитися деякими деталями про те, як глибоке навчання використовується в Phrasee?

Є 2 основні компоненти штучного інтелекту в технології Phrasee. Перший – генерація природної мови (NLG), яка фактично виробляє мову. Другий – глибоке навчання, і тут увага зосереджена на ефективності. Ефективність може означати різні речі залежно від контексту. Наприклад, мета електронного листа з рекламою – привабити одержувача відкрити лист і побачити вміст всередині. Для Facebook мета може полягати в максимізації лайків або поділень. При великих обсягах історичних даних можливо знайти тонкі тенденції і закономірності, які ніколи б не були помічені людиною. Це стандартна проблема машинного навчання.

Глибоке навчання пропонує кілька переваг над традиційним підходом машинного навчання. З традиційним машинним навчанням існує сильна увага на “інженерії функцій”. Це означає, що розробнику потрібно вирішити, які, на його думку, є найбільш важливими функції мови. наприклад, слова, довжина, використання емоджі тощо. Проблема полягає в тому, що це обмежено навичками і уявою інженера. Однак з глибоким навчанням сирій текст вводиться в модель, і вона будує свою власну машинну репрезентацію мови (це називається навчання з кінця в кінець). Тому воно вільне від упереджень людини і це потужний підхід. Однак недолік полягає в тому, що воно може бути важко зрозуміти, чому модель поводиться певним чином. “Роз’яснення” – це активна область дослідження в спільноті глибокого навчання. Однак існує фундаментальний компроміс між складністю системи і нашою здатністю її зрозуміти. Людська мова нечиста, тому успішні рішення NLP зазвичай мають високий рівень складності.

 

Одна з функцій Phrasee – можливість писати в унікальному тоні бренду, чи можете ви роз’яснити, як це здійснюється?

Коли ми підписуємо нового клієнта, перша річ, яку ми робимо, – збираємо інформацію про стиль спілкування бренду. Це включає будь-які офіційні керівництва бренду, історичні маркетингові кампанії і серію питань, які ми розробили для цієї мети. Вся ця інформація використовується нашою внутрішньою командою мовних техніків для побудови клієнт-специфічної “моделі мови”. Наші моделі мови є генеративними, тобто вони можуть виробляти раніше невидану мову в унікальному стилі клієнта.

Моделі мови можна оновлювати в будь-який час. Наприклад, зараз ми находимося на піку кризи COVID-19. Наша мова команда переглядає наші моделі, щоб переконатися, що неприйнятна мова не може бути створена. Фраза типу “Ці пропозиції стають вірусними!” могла бути безневинною кілька місяців тому, але явно недоречна в умовах глобальної пандемії. Це демонструє гнучкість нашої системи.

 

Який тип даних потрібен компанії, яка хоче почати роботу з Phrasee?

Щиро кажучи, не потрібно багато даних, щоб почати роботу з нами. Перший крок – визначити підходящу область проекту. Наприклад, це можуть бути теми електронних листів з рекламою. Ідеально, якщо це буде мати відносно велику аудиторію і комунікації будуть регулярними. Як тільки проект визначено, нам потрібно інформація про призначену тему і голос бренду, щоб побудувати модель мови. Phrasee потребує результатів ефективності на постійній основі. Оскільки наше рішення використовує машинне навчання, важливо вимірювати і відстежувати ключові метрики з часом. Ця інформація вводиться назад в нашу систему, щоб вона могла постійно оптимізуватися для взаємодії.

 

Чи є щось ще, що ви хотіли б поділитися про Phrasee?

Коли Паррі, Вікторія і я заснували Phrasee п’ять років тому, ми були впевнені, що це тільки питання часу, поки багато інших стартапів з’являться з подібними продуктами. Наш план полягав у тому, щоб випередити конкуренцію і залишитися на крок вперед. Однак ми були здивовані відсутністю учасників на цьому ринку. Де всі інші? Я думаю, що є кілька причин для цього, але одна з головних полягає в тому, що мова така складна проблема. Я підозрюю, що інші спробували створити подібні продукти, але зазнали невдачі на ранніх стадіях досліджень і розробок. Це свідчить про унікальність нашої технології.

Дякуємо за інформативне інтерв’ю про обробку природної мови, генерацію природної мови і глибоке навчання. Щоб дізнатися більше, відвідувачі можуть відвідати Phrasee.

Антуан є видним лідером і засновником Unite.AI, який рухає невпинною пристрастю до формування та просування майбутнього штучного інтелекту та робототехніки. Як серійний підприємець, він вважає, що штучний інтелект буде таким же революційним для суспільства, як і електрика, і часто захоплюється потенціалом деструктивних технологій та AGI.

Як футуролог, він присвячений дослідженню того, як ці інновації сформують наш світ. Крім того, він є засновником Securities.io, платформи, орієнтованої на інвестування в передові технології, які переінакшують майбутнє та змінюють цілі сектори.