Inteligência artificial
Marc Sloan, Co-Fundador & CEO da Scout – Série de Entrevistas

Marc Sloan é o Co-Fundador & CEO da Scout, o primeiro chatbot de navegador web do mundo, um assistente digital para realizar qualquer tarefa online. A Scout sugere coisas úteis que pode fazer por você com base no que você está fazendo online.
O que inicialmente o atraiu para a IA?
Minha primeira experiência de trabalho com IA foi durante um ano de interrupção que passei trabalhando na equipe de pesquisa de processamento de linguagem natural da GCHQ durante meu bacharelado. Eu pude ver em primeira mão o impacto que o aprendizado de máquina poderia ter em problemas do mundo real e a diferença que isso fazia.
Isso acionou um interruptor em minha mente sobre como os computadores podem ser usados para resolver problemas: a engenharia de software ensina a criar programas que tomam dados e produzem resultados, mas o aprendizado de máquina permite tomar dados e descrever os resultados que você deseja produzir um programa. Isso significa que você pode usar a mesma estrutura para resolver milhares de problemas diferentes. Para mim, isso parecia muito mais impactante do que ter que escrever um programa para cada problema.
Eu já estava estudando problemas de otimização em matemática ao lado da ciência da computação, então, assim que voltei à universidade, me concentrei em IA e completei minha dissertação sobre processamento de fala antes de me inscrever para um PhD em Recuperação de Informação na UCL.
Você pesquisou aprendizado por reforço em busca na web sob a supervisão de David Silver, o fundador do AlphaGo. Pode discutir alguns desses pesquisas?
Meu PhD foi sobre o tema de aplicar aprendizado por reforço a problemas de classificação em recuperação de informação, um campo que ajudei a criar chamado Recuperação de Informação Dinâmica. Fui supervisionado pelo Prof. Jun Wang e pelo Prof. David Silver, ambos especialistas em aprendizado por reforço baseado em agentes.
Nossa pesquisa olhou para como os mecanismos de busca podem aprender com o comportamento do usuário para melhorar os resultados de busca de forma autônoma ao longo do tempo. Usando uma abordagem de Multi-Armed Bandit, nosso sistema tentaria diferentes classificações de busca e coletaria comportamento de cliques para determinar se elas eram eficazes ou não. Ele também poderia se adaptar a usuários individuais ao longo do tempo e foi particularmente eficaz no tratamento de consultas de busca ambíguas. Na época, David estava se concentrando profundamente no problema do Go e ele me ajudou a determinar a configuração apropriada de aprendizado por reforço de estados e função de valor para esse problema específico.
Quais são algumas das lições de empreendedorismo que você aprendeu trabalhando com David Silver?
Pesquisa na UCL é frequentemente empreendedora. David havia fundado anteriormente a Elixir Studios com Demis Hassabis e, claro, se juntou à DeepMind para trabalhar no Alpha Go. Mas outros membros de nosso grupo de pesquisa de Media Futures também acabaram criando uma variedade de startups: Jun fundou a Mediagamma (aplicando RL ao gasto publicitário online), Simon Chan começou a prediction.io (adquirida pela SalesForce) e Jagadeesh Gorla começou a Jaggu (um serviço de recomendação para e-commerce). Nossa equipe frequentemente discutia o impacto comercial que nossa pesquisa poderia ter, acho que talvez porque a base da UCL em Londres a torna um ponto de partida natural para criar um negócio.
Você recentemente lançou a Scout, o primeiro chatbot de navegador web do mundo. Qual foi a inspiração por trás do lançamento da Scout?
A ideia evoluiu naturalmente de minha pesquisa de PhD. Eu fui direto de terminar meu PhD para me juntar à Entrepreneur First, onde comecei a pensar sobre como eu poderia transformar minha pesquisa em um produto.
Antes disso, completei um estágio na Microsoft Research, onde apliquei minha pesquisa ao Bing. Na época, a principal coisa que aprendi com minha pesquisa foi que a busca de informações poderia ser prevista com base no comportamento do usuário online. Mas eu me senti frustrado porque a única maneira real de superfície dessas previsões em um mecanismo de busca era tornando a sugestão automática melhor. Então, comecei a pensar sobre como a experiência online completa do usuário poderia ser melhorada usando essas previsões, não apenas a experiência de busca.
Foi esse pensamento que levou meu novo co-fundador e eu, na Entrepreneur First, a criar uma extensão de navegador que observa o comportamento do usuário, prevê o que o usuário provavelmente precisará em seguida online e busca por ele. Após alguns anos de experimentos e protótipos, isso evoluiu para uma interface de chatbot onde o navegador “conversa” com você sobre o que você está fazendo online e tenta ajudá-lo no caminho.
Quais são os navegadores web com os quais a Scout será compatível?
Estamos nos concentrando no Chrome no momento, devido à sua popularidade e arquitetura de extensão madura, mas temos protótipos funcionando no Firefox e Safari e até mesmo um aplicativo móvel.
A funcionalidade de assistente de compras da Scout parece que poderia economizar tempo e dinheiro para os usuários. Supondo que alguém esteja pesquisando um produto na Amazon, o que acontece nos bastidores, e como a Scout interage com o usuário?
A ideia é que, uma vez que você tenha a Scout instalada, você continue usando a web como de costume. Se você estiver comprando, você pode visitar a Amazon para olhar produtos. Nesse ponto, a Scout reconhece que você está comprando na Amazon e o produto que você está olhando, e ela dirá “Olá”. Ela aparece como um widget de chat na página da web, tipo como o Intercom funciona, exceto que a Scout pode aparecer em potencialmente qualquer página da web. Você pode ver como isso parece no meu site.
Porque você está comprando, ela começará a sugerir maneiras pelas quais ela pode ajudar. Ela perguntará se você deseja ver avaliações online, outros preços, vídeos do YouTube do produto e mais. Você interage pressionando botões e o chatbot personaliza a experiência para o que você deseja que ele faça. Sempre que ele encontra informações (como um vídeo do YouTube), ele as incorpora dentro da thread de chat, assim como um amigo poderia compartilhar mídia com você no WhatsApp. Com o tempo, você acaba tendo um diálogo com o navegador sobre o que você está fazendo online, com o navegador ajudando no caminho.
O processamento da página da web acontece dentro do próprio navegador. A única informação que nosso backend vê é a thread de chat, o que significa que as implicações de privacidade são mínimas.
Temos uma arquitetura personalizada para entender o comportamento de navegação online e gerenciar diálogos com o usuário. Usamos aprendizado de máquina para identificar quais tarefas podemos ajudar online e como devemos ajudar. Originalmente, usamos aprendizado por reforço para adaptar às preferências do usuário ao longo do tempo. No entanto, uma das maiores lições que aprendi ao executar uma startup de IA é manter os processos simples e tentar usar aprendizado de máquina apenas para otimizar um processo existente. Então, agora temos um motor de regras sofisticado para lidar com tarefas ao longo do tempo que pode ser gerenciado por aprendizado por reforço uma vez que precisamos dimensionar.
Quais são alguns exemplos de como a Scout pode ajudar na organização de eventos?
Percebemos que a organização de eventos (e reserva de viagens) não são tão diferentes de comprar online. Você ainda está olhando produtos, lendo avaliações e se comprometendo a comprar/participar. Então, muito do que construímos para compras também se aplica aqui.
A maior diferença é que tempo e localização agora são importantes. Então, por exemplo, se você estiver olhando ingressos para concertos no Ticketmaster, a Scout pode identificar o endereço do local e sugerir encontrar direções de sua localização atual para lá, ou encontrar o preço de uma Uber, ou sugerir a que horas você deve sair. Se você tiver conectado a Scout ao seu calendário, então a Scout pode verificar se você está disponível no horário do evento e adicioná-lo ao seu calendário para você.
No futuro, prevedemos que os usuários da Scout possam se comunicar com seus amigos por meio da plataforma para discutir as coisas que eles estão fazendo online, como organização de eventos, compras, trabalho, etc.
Gatilhos de diálogo serão usados para a Scout iniciar comunicações. Quais são alguns desses gatilhos?
Por padrão, a Scout não perturbará você a menos que ela encontre um gatilho que indique que você pode precisar de ajuda. Existem vários tipos de gatilhos:
- Visitar um site específico.
- Visitar um tipo de site (como notícias, compras, etc.).
- Visitar um site que contenha um certo tipo de informação (por exemplo, um endereço, um vídeo, etc.).
- Clicar em links ou botões em páginas da web.
- Interagir com a Scout pressionando botões
- A Scout recuperar certos tipos de mídia, como vídeos, músicas, tweets, etc.
Planejamos permitir que os usuários ajustem finamente que tipo de gatilhos eles desejam que a Scout responda e, eventualmente, aprender suas preferências automaticamente.
Pode discutir algumas das dificuldades por trás de garantir que a Scout seja genuinamente útil quando decide interagir com um usuário sem se tornar irritante?
Levamos o engajamento do usuário muito a sério e tentamos medir se as interações levaram a resultados positivos ou negativos. Tentamos manter uma boa razão para quantas vezes a Scout tenta iniciar uma conversa e quantas vezes ela é usada. No entanto, é um equilíbrio difícil de alcançar e estamos sempre tentando melhorar.
Devido à natureza intrusiva desse produto, obter a interface e a experiência do usuário certas é crítico. Passamos muito tempo tentando interfaces e métodos de interação do usuário completamente diferentes. Esse trabalho nos levou à interface de chatbot atual, que encontramos dar-nos a maior flexibilidade na ajuda que podemos fornecer, combinada com a familiaridade do usuário e o mínimo esforço do usuário para interações.
Pode fornecer outros cenários de como a Scout pode ajudar os usuários finais?
Nosso foco no momento é testar mercados para aplicações específicas da Scout. Compras e organização de eventos já foram mencionados, mas também estamos olhando para como a Scout pode ajudar acadêmicos (encontrando artigos de pesquisa, detalhes de autores e redes de referências) e até mesmo guitarristas (encontrando partituras de guitarra, tocando música e vídeos ao lado de partituras online e ajudando a afinar uma guitarra). Também passamos algum tempo explorando cenários profissionais, como recrutamento online, análise financeira e direito.
No final, a Scout pode potencialmente funcionar em qualquer site e ajudar em qualquer cenário, o que é o que torna a tecnologia incrivelmente emocionante, mas também torna difícil começar.
Há algo mais que você gostaria de compartilhar sobre a Scout?
Se você gostaria de ver como seria se seu navegador pudesse conversar com você, pode ler mais no blog da Scout.
Obrigado pela fascinante visão sobre o design de um tipo unificado de chatbot. Estamos ansiosos para seguir esse projeto. Por favor, visite o site de Marc Sloan para saber mais.












