Искусственный интеллект

Доктор Нил Ягер, сооснователь и главный ученый Phrasee – Интервью

mm

Доктор Нил Ягер является главным ученым Phrasee, и архитектором метода Phrasee, инструмента копирайтинга на основе ИИ, который помог оптимизировать маркетинговый контент для некоторых из самых известных брендов мира, включая eBay, Groupon и Virgin – плюс многие другие, от Австралии до Америки, на более чем 20 языках, от английского до японского.

Доктор Ягер написал более десятка академических публикаций, автор книги о добыче данных, и владеет несколькими патентами. Как один из ведущих экспертов в мире по коммерциализации искусственного интеллекта, он имеет степень доктора философии в области компьютерных наук Университета Нового Южного Уэльса в Австралии.

Вы – ветеран индустрии технологий с 20-летним стажем, какие были некоторые из ваших предыдущих ролей, связанных с ИИ?

Я занимаюсь работой, связанной с ИИ, с момента получения степени доктора философии в середине 2000-х годов. Однако поле прошло через несколько ребрендингов с тех пор. Например, 15 лет назад я изучал “статистическое распознавание образов”. Через несколько лет это стало более известно как “машинное обучение”, что является более привлекательным названием. Более недавно машинное обучение (и “глубокое обучение” в частности) стало синонимом “искусственного интеллекта” в целом. У меня смешанные чувства по этому поводу. С одной стороны, моя работа с Phrasee научила меня важности брендинга. С другой стороны, термин “искусственный интеллект” несет в себе багаж и может привести к заблуждениям о технологии. Я задаюсь вопросом, где бы мы были, если бы мы все еще называли это “статистическим распознаванием образов”.

Большая часть моей предыдущей работы была в области обработки сигналов и компьютерного зрения. У меня не было большого опыта в области обработки естественного языка до Phrasee. Я с тех пор узнал, что язык, вероятно, является самой сложной проблемой в ИИ.

 

В 2008 году вы стали соавтором книги под названием ‘Биометрическая система и анализ данных: проектирование, оценка и добыча данных‘, которая объединяет аспекты статистики и машинного обучения, чтобы предоставить комплексное руководство по оценке, интерпретации и пониманию биометрических данных. Помимо более мощных вычислительных ресурсов, считаете ли вы, что это поле эволюционировало с момента публикации этой книги? Можете ли вы описать, как?

Глубокое обучение потрясло области компьютерного зрения, обработки языка и машинного обучения с момента написания мной этой книги. Не было бы возможно написать эту книгу сегодня без раздела о глубоком обучении.

Революция глубокого обучения действительно началась в 2012 году, когда модель глубокого обучения выиграла конкурс под названием ImageNet. ImageNet – это набор данных для распознавания визуальных объектов, где компьютер определяет, что находится на изображении (например, “собака” или “шар”). На протяжении десятилетий исследователи добились постепенных успехов на эталонных наборах данных, подобных этому. Каждая подобласть работала независимо и сильно полагалась на экспертизу в конкретной области. Почти за одну ночь все модели, которые были тщательно построены за многие годы, стали устаревшими. Алгоритмы глубокого обучения, разработанные посторонними, выигрывали конкурсы с значительным отрывом. Это преобразило индустрию ИИ.

Поле все еще развивается быстро и эволюционировало даже с момента основания Phrasee несколько лет назад. Например, инструменты глубокого обучения, которые мы сейчас используем, не существовали, когда мы основали компанию. Темп инноваций несет в себе свои собственные проблемы.

 

Можете ли вы поделиться с нами тем, что Phrasee может сделать для бизнеса?

Phrasee решает две проблемы для бизнеса. Во-первых, существует проблема написания маркетингового контента. Сейчас существует больше рекламных каналов, чем когда-либо прежде (например, электронная почта, AdWords, социальные сети, печать, подкасты и т. д.). Трудно написать контент для всех этих каналов, который будет высокого качества и соответствует стилю и тону бренда. Phrasee решает проблему масштаба, автоматически генерируя контент. Во-вторых, важно, чтобы весь язык, используемый в контенте, был эффективным. Не только Phrasee генерирует язык, но также использует машинное обучение, чтобы предсказать влияние сообщения и оптимизировать его соответственно.

 

Что привлекло вас к идее использования обработки естественного языка и глубокого обучения для улучшения силы рекламного контента?

Использование ИИ для максимизации влияния цифровых маркетинговых кампаний не является новой идеей. Существуют команды людей с докторскими степенями по физике, которые были привлечены для работы над оптимизацией рекламы. Однако в большинстве случаев они фокусируются на таких вещах, как сегментация аудитории, персонализация, время доставки, размещение рекламы, шрифты и т. д. Когда мы впервые обсуждали идеи для Phrasee, мы заметили, что почти все в рекламе оптимизируется, кроме самого языка, используемого в рекламе! Мы определили это как пробел на рынке и огромную возможность.

 

Phrasee может улучшить маркетинговый контент на более чем 20 языках, включая японский. Можете ли вы обсудить некоторые уникальные проблемы обработки естественного языка, с которыми вы столкнулись при работе с иностранными языками?

Самым недавним дополнением к нашему набору поддерживаемых языков является русский. Это славянский язык, и он довольно отличается от других индоевропейских языков. В этом случае нам пришлось построить новые правила в нашу систему генерации языка, чтобы выходные данные были свободными и грамматически правильными. Это не только проблема языка. Это также проблема разработки программного обеспечения. Когда выходные данные нашей системы находятся на родном языке разработчика, относительно легко заметить ошибки и проверить, что все работает правильно. Однако, когда мы работаем с русским или японским языком, мы могли бы выдавать бессмыслицу и не иметь об этом представления. Важно иметь носителя языка, тесно участвующего в процессе контроля качества.

Проблема не только в иностранных языках. Существуют также интересные региональные различия. Например, английский язык имеет вариации правописания для США, Великобритании, Австралии, Канады и т. д. Кроме того, существуют грамматические различия. В британском английском вы “берете взгляд”, а в американском английском вы “смотрите”. Значение слов также может варьироваться от места к месту. “Резинка” – это ластик в Великобритании, но презерватив в Северной Америке! Чтобы системы генерации языка могли быть использованы для бизнес-приложений, они должны обрабатывать все эти нюансы.

 

Можете ли вы также поделиться некоторыми деталями о том, как глубокое обучение используется в Phrasee?

Существуют 2 основных компонента ИИ в технологии Phrasee. Первый – это генерация естественного языка, которая фактически производит язык. Второй – это глубокое обучение, и здесь фокусируется на производительности. Производительность может означать разные вещи в зависимости от контекста. Например, цель заголовка электронного письма – заманить получателя открыть письмо и увидеть содержимое внутри. Для Facebook цель может заключаться в максимизации лайков или репостов. Учитывая большие объемы исторических данных, возможно найти тонкие тенденции и закономерности, которые никогда не будут замечены человеком. Это стандартная проблема машинного обучения.

Глубокое обучение предлагает несколько преимуществ перед традиционным подходом машинного обучения. С традиционным машинным обучением существует сильный фокус на “инженерии функций”. Это означает, что разработчику необходимо решить, какие, по его мнению, являются наиболее важными функциями языка. Например, слова, длина, использование эмодзи и т. д. Проблема заключается в том, что это ограничено навыками и воображением инженера. Однако с глубоким обучением сырой текст подается в модель, и она строит свое собственное представление языка (это известно как обучение “конец в конец”). Следовательно, оно свободно от человеческих предубеждений, и это мощный подход. Однако недостатком является то, что может быть трудно понять, почему модель ведет себя именно так. “Объяснимость” – это активная область исследований в сообществе глубокого обучения. Однако существует фундаментальный компромисс между сложностью системы и нашей способностью понять ее. Человеческий язык запутан, поэтому успешные решения NLP обычно имеют высокую степень сложности.

 

Одной из функций Phrasee является возможность писать в уникальном тоне бренда, можете ли вы подробнее рассказать о том, как это выполняется?

Когда мы подписываем нового клиента, первое, что мы делаем, – это собираем информацию о стиле общения бренда. Это включает в себя любые формальные рекомендации бренда, исторические маркетинговые кампании и серию вопросников, которые мы разработали для этой цели. Все эта информация используется нашей внутренней командой языковых техников для построения специфической модели языка для клиента. Наши модели языка являются генеративными, то есть они могут производить ранее не виденный язык в уникальном стиле клиента.

Модели языка могут быть обновлены в любое время. Например, в данный момент мы находимся на пике кризиса COVID-19. Наша языковая команда проверяет наши модели, чтобы убедиться, что неуместный язык не может быть создан. Фраза типа “Эти предложения распространяются как пожар!” могла быть безобидной несколько месяцев назад, но явно неуместна в разгар глобальной пандемии. Это демонстрирует гибкость нашей системы.

 

Какие данные необходимы компании, которая хочет начать работать с Phrasee?

Честно говоря, для начала работы с нами не требуется много данных. Первый шаг – определить подходящую область проекта. Например, это может быть темы письма для еженедельных промо-писем. Идеально, если это будет иметь относительно большую аудиторию и регулярные коммуникации. Как только проект определен, нам нужно информация о предполагаемой теме и голосе бренда, чтобы построить модель языка. Phrasee нуждается в результатах производительности на постоянной основе. Поскольку наше решение использует машинное обучение, важно измерять и отслеживать ключевые метрики с течением времени. Эта информация подается обратно в нашу систему, чтобы она могла постоянно оптимизироваться для вовлеченности.

 

Есть ли что-то еще, что вы хотели бы поделиться о Phrasee?

Когда Парри, Виктория и я основали Phrasee пять лет назад, мы были уверены, что это будет только вопрос времени, прежде чем много других стартапов появятся с подобными продуктами. Наш план был – опередить конкурентов и оставаться на шаг впереди. Однако мы были удивлены отсутствием участников на этом рынке. Где все остальные? Я думаю, что есть несколько причин для этого, но одна из основных – то, что язык является такой сложной проблемой. Я подозреваю, что другие пытались создать подобные продукты, но потерпели неудачу на ранних стадиях исследований и разработок. Это свидетельствует о том, насколько уникальна наша технология.

Спасибо за информативное интервью о обработке естественного языка, генерации естественного языка и глубоком обучении. Чтобы узнать больше, посетители могут посетить Phrasee.

Антуан - видный лидер и сооснователь Unite.AI, движимый непоколебимой страстью к формированию и продвижению будущего ИИ и робототехники. Как серийный предприниматель, он считает, что ИИ будет столь же разрушительным для общества, как электричество, и часто увлекается потенциалом разрушительных технологий и ИИ.

Как футуролог, он посвящен изучению того, как эти инновации изменят наш мир. Кроме того, он является основателем Securities.io, платформы, ориентированной на инвестиции в передовые технологии, которые переопределяют будущее и меняют целые сектора.