Inteligência artificial
Dr. Neil Yager, Co-Fundador e Cientista Chefe da Phrasee – Série de Entrevistas

Dr. Neil Yager é o Cientista Chefe da Phrasee, e o arquiteto do método Phrasee, uma ferramenta de redação de cópias movida por IA que ajudou a otimizar a cópia de marketing para algumas das marcas mais reconhecidas do mundo, incluindo eBay, Groupon e Virgin – e muitas mais, da Austrália à América, em mais de 20 idiomas, do inglês ao japonês.
Dr. Yager escreveu mais de uma dúzia de publicações acadêmicas, autor de um livro sobre mineração de dados, e detém várias patentes. Como um dos principais especialistas do mundo na comercialização de inteligência artificial, ele possui um PhD em Ciência da Computação pela Universidade de New South Wales, na Austrália.
Você é um veterano de 20 anos da indústria de tecnologia, quais foram alguns de seus papéis anteriores relacionados à IA?
Eu estive envolvido em trabalhos relacionados à IA desde meu PhD, no meio dos anos 2000. No entanto, o campo passou por várias rebrandings desde então. Por exemplo, 15 anos atrás eu estudei “reconhecimento de padrões estatísticos”. Alguns anos depois, isso era mais comumente conhecido como “aprendizado de máquina”, que é um nome muito mais atraente. Mais recentemente, o aprendizado de máquina (e “aprendizado profundo” em particular) se tornou sinônimo de “inteligência artificial” em geral. Eu tenho sentimentos mistos sobre isso. Por um lado, meu trabalho com a Phrasee me ensinou a importância do branding. Por outro lado, o termo “inteligência artificial” traz bagagem e pode levar a concepções erradas sobre a tecnologia. Eu me pergunto onde estaríamos se ainda estivéssemos chamando isso de “reconhecimento de padrões estatísticos”.
A maior parte do meu trabalho anterior foi nos campos de processamento de sinais e visão computacional. Eu não tive muita exposição ao processamento de linguagem natural antes da Phrasee. Eu desde então aprendi que a linguagem é provavelmente o problema mais difícil da IA.
Em 2008, você co-escreveu um livro chamado ‘Biometric System and Data Analysis: Design, Evaluation, and Data Mining‘, que combina aspectos de estatística e aprendizado de máquina para fornecer um guia abrangente para avaliar, interpretar e entender dados biométricos. Fora dos recursos computacionais mais avançados, você acredita que esse campo evoluiu desde a publicação desse livro? Pode descrever como?
O aprendizado profundo revolucionou os campos de visão computacional, processamento de linguagem e aprendizado de máquina desde que eu escrevi esse livro. Não seria possível escrever esse livro hoje sem uma seção sobre aprendizado profundo.
A revolução do aprendizado profundo realmente decolou em 2012, quando um modelo de aprendizado profundo venceu uma competição chamada ImageNet. ImageNet é um conjunto de dados de reconhecimento de objetos visuais onde o computador determina o que está em uma imagem (por exemplo, “cachorro” ou “balão”). Por décadas, os pesquisadores vinham fazendo ganhos incrementais em conjuntos de dados de referência como esse. Cada subcampo operava de forma independente e dependia fortemente da expertise específica do domínio. Quase da noite para o dia, todos os modelos cuidadosamente construídos ao longo de muitos anos foram tornados obsoletos. Modelos de aprendizado profundo projetados por outsiders estavam vencendo competições por margens significativas. Isso transformou a indústria de IA.
O campo ainda está em constante movimento e evoluiu mesmo desde que começamos a Phrasee, há apenas alguns anos. Por exemplo, as ferramentas de aprendizado profundo que agora usamos não existiam quando fundamos a empresa. O ritmo da inovação traz desafios próprios.
Pode compartilhar conosco o que é que a Phrasee é capaz de fazer para as empresas?
A Phrasee resolve dois problemas para as empresas. Primeiro, há o problema de escrever cópias de marketing. Existem mais canais de publicidade do que nunca (por exemplo, e-mail, AdWords, redes sociais, impressão, podcasts, etc.). É difícil escrever cópias para todos esses canais que sejam de alta qualidade e estejam de acordo com o estilo e o tom de voz da marca. A Phrasee resolve o problema de escala gerando automaticamente cópias. Em segundo lugar, é importante que toda a linguagem utilizada seja eficaz. Além de gerar linguagem, a Phrasee também usa aprendizado de máquina para prever o impacto da mensagem e otimizar de acordo.
O que o atraiu para a ideia de usar Processamento de Linguagem Natural (PLN) e Aprendizado Profundo para melhorar o poder da cópia publicitária?
Usar IA para maximizar o impacto das campanhas de marketing digitais não é uma ideia nova. Existem equipes de pessoas com PhDs em física que foram recrutadas para trabalhar na otimização de anúncios. No entanto, na maioria dos casos, eles estão focando seus esforços de P&D em coisas como segmentação de audiência, personalização, entrega no momento certo, posicionamento de anúncios, fontes, etc. Quando estávamos lançando ideias para a Phrasee, notamos que quase tudo sobre anúncios está sendo otimizado, exceto a linguagem real utilizada! Identificamos isso como uma lacuna no mercado e uma grande oportunidade.
A Phrasee é capaz de melhorar a cópia de marketing em mais de 20 idiomas, incluindo japonês. Pode discutir alguns dos problemas únicos de Processamento de Linguagem Natural que são encontrados com idiomas estrangeiros?
A adição mais recente ao nosso conjunto de idiomas suportados é o russo. Essa é uma língua eslava e é bastante distinta das outras línguas indo-europeias. Nesse caso, foi necessário construir novas regras em nosso sistema de geração de linguagem para que a saída seja fluente e gramaticalmente correta. Isso não é apenas um problema de idioma. É também um problema de desenvolvimento de software. Quando a saída do nosso sistema está no idioma nativo do desenvolvedor, é relativamente fácil identificar erros e verificar se tudo está funcionando corretamente. No entanto, quando trabalhamos com russo ou japonês, podemos estar produzindo nonsense e não ter ideia. É importante ter um falante nativo envolvido no processo de QA.
O desafio não é apenas com idiomas estrangeiros. Existem algumas diferenças regionais interessantes também. Por exemplo, o inglês tem variações de ortografia para os EUA, Reino Unido, Austrália, Canadá, etc. Além disso, existem diferenças gramaticais. No inglês britânico, você “dá uma olhada”, enquanto no inglês americano, você “toma uma olhada”. O significado das palavras também pode variar de lugar para lugar. Um “borracha” é uma borracha no Reino Unido, mas um preservativo na América do Norte! Para que os sistemas de Geração de Linguagem Natural sejam usados para aplicações comerciais, eles precisam lidar com todas essas sutilezas.
Pode compartilhar conosco alguns detalhes sobre como o aprendizado profundo é usado na Phrasee?
Existem 2 principais componentes de IA na tecnologia da Phrasee. O primeiro é a Geração de Linguagem Natural (GLN), que realmente produz linguagem. O segundo é o aprendizado profundo, e o foco aqui está no desempenho. O desempenho pode significar coisas diferentes dependendo do contexto. Por exemplo, o objetivo de um assunto de e-mail é atrair o destinatário para abrir o e-mail e ver o conteúdo dentro. Para o Facebook, o objetivo pode ser maximizar os likes ou compartilhamentos. Dados grandes volumes de dados históricos, é possível encontrar tendências e padrões sutis que nunca seriam notados por um ser humano. Isso é um problema padrão de aprendizado de máquina.
O aprendizado profundo oferece algumas vantagens sobre a abordagem tradicional de aprendizado de máquina. Com o aprendizado de máquina tradicional, há um forte foco na “engenharia de recursos”. Isso significa que o desenvolvedor precisa decidir o que acredita serem os recursos mais importantes da linguagem. por exemplo, palavras, comprimento, uso de emojis, etc. O problema é que isso é limitado pela habilidade e imaginação do engenheiro. No entanto, com o aprendizado profundo, o texto bruto é alimentado no modelo, e ele constrói sua própria representação de máquina da linguagem (isso é conhecido como aprendizado de ponta a ponta). Portanto, é livre de viés humano e é uma abordagem poderosa. No entanto, o lado negativo é que pode ser difícil entender por que o modelo se comporta da maneira que faz. “Explicabilidade” é uma área ativa de pesquisa dentro da comunidade de aprendizado profundo. No entanto, há um trade-off fundamental entre a complexidade de um sistema e nossa capacidade de entendê-lo. A linguagem humana é bagunçada, então as soluções de PNL bem-sucedidas geralmente têm um alto grau de complexidade.
Uma das funcionalidades da Phrasee é a capacidade de escrever no tom único de uma marca, pode elaborar sobre como isso é realizado?
Quando assinamos um novo cliente, a primeira coisa que fazemos é coletar informações sobre o estilo de comunicação da marca. Isso inclui quaisquer diretrizes de marca formais, campanhas de marketing históricas e uma série de questionários que desenvolvemos para esse propósito. Todas essas informações são usadas por uma equipe interna de técnicos de linguagem para construir um modelo de linguagem personalizado para o cliente. Nossos modelos de linguagem são gerativos, o que significa que eles podem produzir linguagem nunca vista antes no estilo único do cliente.
Os modelos de linguagem podem ser atualizados a qualquer momento. Por exemplo, no momento estamos no auge da crise do COVID-19. Nossa equipe de linguagem está revisando nossos modelos para garantir que a linguagem inadequada não possa ser criada. Uma frase como “Essas ofertas estão se tornando virais!” pode ter sido inofensiva alguns meses atrás, mas é claramente inadequada em meio a uma pandemia global. Isso demonstra a flexibilidade do nosso sistema.
Que tipo de dados é necessário por uma empresa que deseja começar a usar a Phrasee?
Para ser honesto, não é necessário muito dados para começar a usar a Phrasee. O primeiro passo é identificar uma área de projeto adequada. Por exemplo, isso pode ser os assuntos de e-mails de promoção semanais. Idealmente, isso terá uma audiência relativamente grande e as comunicações serão regulares. Uma vez que o projeto tenha sido identificado, precisamos de informações sobre o tópico pretendido e a voz da marca para construir o modelo de linguagem. A Phrasee precisa de resultados de desempenho de forma contínua. Como nossa solução usa aprendizado de máquina, é importante que medimos e acompanhamos métricas-chave ao longo do tempo. Essas informações são alimentadas de volta em nosso sistema para que ele possa continuar a otimizar para o engajamento.
Existe algo mais que você gostaria de compartilhar sobre a Phrasee?
Quando Parry, Victoria e eu começamos a Phrasee, há cinco anos, estávamos certos de que seria apenas uma questão de tempo antes que muitas outras startups surgissem com produtos semelhantes. Nosso plano era dar um salto à frente da concorrência e permanecer um passo à frente. No entanto, fomos surpreendidos pela falta de entrantes nesse espaço. Onde está todo mundo? Acho que há algumas razões para isso, mas uma das principais é que a linguagem é um problema tão difícil. Suspeito que outros tentaram criar produtos semelhantes, mas falharam cedo nas etapas de P&D. Isso é um testemunho de quão única é nossa tecnologia.
Obrigado pela entrevista informativa sobre Processamento de Linguagem Natural, Geração de Linguagem Natural e Aprendizado Profundo. Para saber mais, os visitantes podem visitar Phrasee.












