Искусственный интеллект
Марк Слоан, сооснователь и CEO Scout – Интервью-серия

Марк Слоан – сооснователь и CEO Scout, первого веб-браузера-чатбота, цифрового помощника для выполнения любых задач в Интернете. Scout предлагает полезные вещи, которые он может сделать для вас на основе того, что вы делаете в Интернете.
Что изначально привлекло вас к ИИ?
Мой первый опыт работы с ИИ был во время года перерыва, который я провел, работая в команде исследований обработки естественного языка в GCHQ во время моей бакалаврской степени. Я увидел лично, какое влияние машинное обучение может оказать на реальные проблемы и какую разницу оно может сделать.
Это переключило выключатель в моем уме о том, как компьютеры можно использовать для решения проблем: программная инженерия учит вас создавать программы, которые принимают данные и производят результаты, но машинное обучение позволяет вам взять данные и описать результаты, которые вы хотите произвести программу. Это означает, что вы можете использовать одну и ту же структуру для решения тысяч разных проблем. Для меня это казалось намного более эффективным, чем написание программы для каждой проблемы.
Я уже изучал проблемы оптимизации в математике вместе с информатикой, поэтому, когда я вернулся в университет, я сосредоточился на ИИ и завершил свою диссертацию на тему обработки речи, прежде чем подать заявку на получение докторской степени в области информационного поиска в УКЛ.
Вы исследовали подкрепляющее обучение в веб-поиске под руководством Дэвида Сильвера, основателя AlphaGo. Не могли бы вы обсудить некоторые из этих исследований?
Моя докторская диссертация была на тему применения подкрепляющего обучения к задачам ранжирования в информационном поиске, области, которую я помог создать, называемой Динамическим информационным поиском. Меня руководили профессор Джун Ванг и профессор Дэвид Сильвер, оба эксперты в области агентного подкрепляющего обучения.
Наши исследования изучали, как поисковые системы могут учиться на поведении пользователей, чтобы улучшать результаты поиска автономно со временем. Используя подход Многорукого бандита, наша система пыталась разные рейтинги поиска и собирала поведение кликов, чтобы определить, были ли они эффективными или нет. Она также могла адаптироваться к отдельным пользователям со временем и была особенно эффективна при обработке неоднозначных поисковых запросов. В то время Дэвид глубоко занимался проблемой Го, и он помог мне определить подходящую структуру подкрепляющего обучения для этой конкретной проблемы.
Какие из предпринимательских уроков вы выучили, работая с Дэвидом Сильвером?
Исследования в УКЛ часто имеют предпринимательский характер. Дэвид ранее основал Elixir Studios с Демисом Хассабисом, а затем, конечно, присоединился к DeepMind, чтобы работать над Alpha Go. Но другие члены нашей исследовательской группы Media Futures также основали ряд стартапов: Джун основал Mediagamma (применение RL к онлайн-рекламным расходам), Саймон Чан начал prediction.io (приобретен компанией SalesForce), а Джагадиш Горла основал Jaggu (сервис рекомендаций для электронной коммерции). Наша команда часто обсуждала коммерческое влияние наших исследований, и, возможно, потому, что УКЛ находится в Лондоне, это естественная отправная точка для создания бизнеса.
Вы недавно запустили Scout, первый веб-браузер-чатбот. Какова была идея запуска Scout?
Идея естественно эволюционировала из моих исследований докторской диссертации. Я сразу же после окончания докторской степени присоединился к Entrepreneur First, где начал думать о том, как я могу превратить свои исследования в продукт.
До этого я завершил стажировку в Microsoft Research, где применил свои исследования к Bing. В то время я узнал из своих исследований, что поиск информации может быть предсказан на основе онлайн-поведения пользователей. Но я стал разочаровываться в том, что единственный реальный способ выдать эти предсказания в поисковой системе был сделать лучше автопредложение. Итак, я начал думать о том, как весь онлайн-опыт пользователя можно улучшить, используя эти предсказания, а не только опыт поиска.
Это мышление привело меня и моего нового сооснователя в Entrepreneur First к созданию браузерного расширения, которое наблюдает за поведением пользователя, предсказывает, какую информацию пользователь, скорее всего, понадобится в Интернете, и извлекает ее для него. После нескольких лет экспериментов и прототипов это эволюционировало в интерфейс чатбота, где браузер “общается” с вами о том, что вы делаете в Интернете, и пытается помочь вам на пути.
С какими веб-браузерами будет совместим Scout?
Мы сейчас фокусируемся на Chrome из-за его популярности и зрелой архитектуры расширений, но у нас есть рабочие прототипы на Firefox и Safari, и даже мобильное приложение.
Функциональность помощника Scout по покупкам звучит так, как будто она может сэкономить пользователям время и деньги. Предполагая, что кто-то исследует продукт на Amazon, что происходит в backend, и как Scout взаимодействует с пользователем?
Идея заключается в том, что как только вы установите Scout, вы просто продолжаете использовать Интернет как обычно. Если вы покупаете, вы можете посетить Amazon, чтобы посмотреть на продукты. В этот момент Scout распознает, что вы покупаете на Amazon, и продукт, который вы смотрите, и он скажет “Привет”. Он появляется как чат-виджет на веб-странице, похожий на то, как работает Intercom, за исключением того, что Scout может появиться на потенциально любой веб-странице. Вы можете увидеть, как это выглядит на моем сайте.
Поскольку вы покупаете, он начнет предлагать способы, которыми он может помочь. Он спросит вас, хотите ли вы увидеть отзывы в Интернете, другие цены, видео YouTube продукта и многое другое. Вы взаимодействуете, нажимая кнопки, и чатбот адаптирует опыт к тому, что вы хотите, чтобы он сделал. Когда он находит информацию (например, видео YouTube), он будет встроен в чат-поток, как если бы друг поделился с вами медиа в WhatsApp. Со временем вы в конечном итоге ведете диалог с браузером о том, что вы делаете в Интернете, а браузер помогает вам на пути.
Обработка веб-страниц происходит внутри браузера selbst. Единственная информация, которую видит наш бэкенд, – это чат-поток, что означает, что последствия для конфиденциальности минимальны.
У нас есть специальная архитектура для понимания онлайн-поведения браузера и управления диалогами с пользователем. Мы используем машинное обучение, чтобы определить, с какими задачами мы можем помочь в Интернете и как мы должны помочь. Первоначально мы использовали подкрепляющее обучение, чтобы адаптироваться к предпочтениям пользователей со временем. Однако один из самых больших уроков, которые я выучил из запуска стартапа ИИ, заключается в том, чтобы поддерживать процессы простыми и пытаться использовать машинное обучение только для оптимизации существующего процесса. Итак, вместо этого у нас теперь есть сложный движок правил для обработки задач со временем, который может быть управляем с помощью подкрепляющего обучения, когда нам нужно масштабироваться.
Какие примеры того, как Scout может помочь в планировании мероприятий?
Мы поняли, что планирование мероприятий (и бронирование путешествий) не так сильно отличаются от покупок в Интернете. Вы все равно смотрите на продукты, читаете отзывы и совершаете покупку/посещаете. Итак, многое из того, что мы построили для покупок, также применимо здесь.
Самое большое различие заключается в том, что время и местоположение теперь важны. Итак, например, если вы смотрите на билеты на концерт на Ticketmaster, Scout может определить адрес места проведения и предложить найти вам направления от вашего текущего местоположения до него или найти цену Uber, или предложить, во сколько вам следует уйти. Если вы подключили Scout к своему календарю, то Scout может проверить, доступны ли вы в время мероприятия, и добавить его в ваш календарь.
В будущем мы предвидим, что пользователи Scout смогут общаться со своими друзьями через платформу, чтобы обсудить то, что они делают в Интернете, например, планирование мероприятий, покупки, работу и т. д.
Триггеры диалога будут использоваться для инициирования коммуникаций Scout. Какие из них?
По умолчанию Scout не будет беспокоить вас, если он не встретит триггер, который скажет ему, что вам может понадобиться помощь. Существует несколько типов триггеров:
- Посещение конкретного веб-сайта.
- Посещение типа веб-сайта (например, новостей, покупок и т. д.).
- Посещение веб-сайта, содержащего определенный тип информации (например, адрес, видео и т. д.).
- Нажатие ссылок или кнопок на веб-страницах.
- Взаимодействие с Scout, нажимая кнопки
- Scout, извлекающий определенные типы медиа, такие как видео, музыку, твиты и т. д.
Мы планируем разрешить пользователям настроить, какие типы триггеров они хотят, чтобы Scout реагировал, и в конечном итоге, научиться их предпочтениям автоматически.
Не могли бы вы обсудить некоторые из трудностей, связанных с обеспечением того, чтобы Scout был действительно полезен, когда он решает взаимодействовать с пользователем, не становясь раздражающим?
Мы относимся к вовлечению пользователя очень серьезно и пытаемся измерить, привели ли взаимодействия к положительным или отрицательным результатам. Мы пытаемся поддерживать хорошее соотношение того, как часто Scout пытается начать разговор, и как часто он используется. Однако это хрупкий баланс, чтобы все сделать правильно, и мы всегда пытаемся улучшиться.
Из-за навязчивой природы этого продукта получение правильного интерфейса и UX имеет решающее значение. Мы потратили много времени на попытки совершенно разных интерфейсов и методов взаимодействия с пользователем. Эта работа привела нас к текущему интерфейсу чатбота, который, как мы считаем, дает нам наибольшую гибкость в помощи, которую мы можем предоставить, в сочетании с знакомством пользователя и минимальными усилиями пользователя для взаимодействия.
Не могли бы вы предоставить другие сценарии того, как Scout может помочь конечным пользователям?
Наш фокус сейчас заключается в том, чтобы протестировать на рынке конкретные применения для Scout. Покупки и планирование мероприятий уже были упомянуты, но мы также смотрим на то, как Scout может помочь академикам (с поиском научных статей, подробностями авторов и сетями ссылок) и даже гитаристам (поиск нот для гитары, воспроизведение музыки и видео вместе с нотами в Интернете и помощи в настройке гитары). Мы также потратили некоторое время на изучение профессиональных сценариев, таких как онлайн-рекрутинг, финансовый анализ и право.
В конечном итоге Scout потенциально может работать на любом веб-сайте и помочь в любой ситуации, что делает технологию невероятно интересной, но также делает ее трудной для начала.
Есть ли что-то еще, что вы хотели бы поделиться о Scout?
Если вы хотите увидеть, как выглядит браузер, который может разговаривать с вами, вы можете прочитать больше на блоге Scout.
Спасибо за увлекательный взгляд на проектирование единого типа чатбота. Мы с нетерпением ждем этого проекта. Пожалуйста, посетите веб-сайт Марка Слоана, чтобы узнать больше.












