Inteligência artificial
Dr. Lingjia Tang, CTO e Co-Fundador, Clinc – Série de Entrevistas

Dr. Lingjia Tang, CTO e Co-Fundador da Clinc, é professor de Ciência da Computação na Universidade de Michigan. A pesquisa do Dr. Tang sobre a construção de infraestrutura de produção em larga escala para aplicações inteligentes é amplamente reconhecida e respeitada na comunidade acadêmica. Além de trabalhar na Microsoft e no Google, Lingjia recebeu seu PhD em Ciência da Computação pela Universidade da Virgínia. Lingjia recentemente recebeu prêmios prestigiosos, incluindo o ISCA Hall of Fame, Facebook Research Awards e Google Research Award.
O que inicialmente o atraiu para a IA? Quando você primeiro descobriu que queria lançar um negócio de IA?
No meio dos anos 2000, eu estava realizando pesquisas em torno de sistemas em larga escala que suportam várias aplicações e como podemos projetar servidores como um sistema de software para executar essas aplicações de forma mais eficiente. Na época, estávamos mudando do trabalho com aplicações web tradicionais para funções mais impulsionadas por aprendizado de máquina. Foi então que comecei a prestar atenção nos algoritmos associados à IA e ganhei interesse em entender fundamentalmente como as aplicações de IA funcionam. Logo após, a equipe de pesquisa com a qual eu estava trabalhando decidiu mudar de direção e basicamente construir nossas próprias aplicações de IA como benchmarks para estudar, o que nos levou a publicar nossos primeiros artigos de pesquisa e desenvolver nosso primeiro produto, Sirius – um assistente pessoal de voz e visão de ponta a ponta de código aberto.
Como um software de código aberto, o Sirius permitia que as pessoas construíssem assistentes virtuais conversacionais por conta própria. Na época, essa era uma capacidade muito limitada para o público em geral e era realmente controlada apenas pelas grandes empresas, como o Google e a Apple. No entanto, vimos que estávamos preenchendo uma lacuna crítica quando lançamos o software e vimos que ele teve dezenas de milhares de downloads na primeira semana! Esse foi o ponto de inflexão em que soubemos que havia uma grande demanda de mercado por esse tipo de software.
Em 2015, lançamos a Clinc com a mentalidade de que seríamos capazes de fornecer a todos – todos os desenvolvedores, empresas, pessoas – que desejam construir um assistente virtual com acesso a expertise, ferramentas e inovação para ser capaz de fazer isso.
A Clinc oferece soluções de IA conversacional sem depender de palavras-chave ou scripts. Você poderia entrar em alguns detalhes sobre como isso é alcançado? Quais são alguns dos desafios de Processamento de Linguagem Natural (NLP) que tiveram que ser superados?
O que realmente distingue a Clinc de outras plataformas de IA conversacional no mercado são seus algoritmos de IA subjacentes que habilitam sua experiência “humano na sala”, que entende linguagem desordenada e não scriptada. Isso permite correções para retroceder e “curar” erros feitos em conversas humanas e permite fluxos de conversa complexos – conversas que um ser humano real seria capaz de entender. Em contraste com um algoritmo de correspondência de palavra de fala-para-texto, a Clinc analisa dezenas de fatores da entrada do usuário, incluindo palavras, sentimento, intenção, tom de voz, hora do dia, localização e relacionamentos, e usa esses fatores para fornecer uma resposta que representa um composto de conhecimento extraído de seu cérebro treinado. Por exemplo, se eu perguntar ao meu assistente virtual: “quanto dinheiro eu gastei em um hambúrguer?”, ele precisa entender que estou perguntando sobre dinheiro e gastos, que estou perguntando especificamente sobre um hambúrguer e que um hambúrguer é um tipo de comida e deve ser correspondido aos meus gastos recentes em um restaurante.
Alcançar esse nível de compreensão não é fácil. Em geral, dividimos a IA conversacional em dois componentes: Compreensão de Linguagem Natural (NLU) e gerenciamento de diálogo. Portanto, o desafio que tivemos que superar foi descobrir como construir um sistema que possa extrair peças-chave de informações com precisão e possa antecipar o que o usuário está perguntando.
Conseguimos fazer isso por meio de uma NLU contextual, sofisticada e de cima para baixo, que é treinada para ser intuitiva por natureza para acompanhar o fluxo natural da conversa, entendendo gírias e contexto. Isso é em comparação com soluções competitivas que têm uma abordagem baseada em regras para o Processamento de Linguagem Natural (NLP) que não permite a cura conversacional, ou seja, se o cliente comete um erro, as soluções competitivas fazem com que ele volte ao início, desperdiçando tempo e frustrando apenas o usuário. Também usamos crowdsourcing para extrair nossos dados de linguagem para criar um conjunto de dados mais rico e diverso que possa ser usado imediatamente para treinar modelos de IA.
Você poderia discutir como o aprendizado profundo é usado com o sistema de IA da Clinc?
A Clinc está usando uma abordagem híbrida de aprendizado profundo, onde usamos o modelo tradicional de forma parcial e aproveitamos o aprendizado profundo quando necessário. Especificamente, usamos aprendizado profundo para entender palavras e idiomas para determinar o fluxo de diálogo. Geralmente, todo o nosso diálogo é uma combinação de aprendizado profundo e IA simbólica. Não usamos aprendizado profundo para geração de linguagem ainda, porque, quando se trata de nossos clientes, que são principalmente no setor bancário, há muitas regulamentações que o assistente virtual deve seguir que ditam o que eles podem e não podem dizer aos clientes. Portanto, ainda há muita incerteza sobre se o aprendizado profundo será capaz de seguir essas restrições de linguagem estabelecidas.
Até o momento, não acho que a comunidade de IA conversacional esteja completamente pronta para adotar totalmente o aprendizado profundo, enquanto a comunidade acadêmica está 100% dentro, mas estou ansioso para ver o que os novos modelos podem fazer.
Qual é o processo para uma empresa que deseja personalizar as respostas da IA para atingir um público específico? Você poderia dar alguns exemplos de como a Clinc está sendo usada atualmente por clientes?
Permitimos que os clientes licenciem uma plataforma que possam construir como quiserem ou tomem nosso chatbot totalmente construído e treinado, Finie, e o personalizem e integrem em seus aplicativos ou serviços de mensagens. O Finie pode lidar com questões relacionadas a saldos, transações, histórico de gastos, localização de um caixa eletrônico, realização de transferências e mais.
Meu exemplo favorito de como um cliente personalizou a IA da Clinc para atingir um público específico é o İşbank. Como o maior banco privado da Turquia, eles se voltaram para nós para desenvolver seu assistente de banco digital, Maxi, em 2018. Para infundir o Maxi com uma personalidade única, o İşbank realizou 14 grupos focais para avaliar quais características e habilidades os clientes do banco desejavam em um assistente virtual. Eles também contrataram uma atriz de voz para recitar frases em turco relacionadas a tarefas bancárias. A equipe de banco conversacional do İşbank veio com essas frases, considerando a forma como as pessoas reais expressariam suas necessidades. Com base em nossa recomendação, a equipe pagou participantes em mercados de crowdsourcing, como o Amazon Mechanical Turk, para fornecer diferentes maneiras pelas quais eles poderiam expressar as mesmas perguntas, como um pedido para visualizar seus saldos (“qual é meu saldo”, “quanto dinheiro eu tenho na minha conta”, “mostre-me o dinheiro na minha conta”) ou pagar uma conta (“pagar minha conta”, “pagamento de contas”).
Esse exemplo realmente mostra o quanto o İşbank está investido em oferecer um assistente de banco digital para ajudar seus clientes a navegar melhor em suas contas. Com a Clinc, o İşbank lançou o Maxi para mais de 7,5 milhões de pessoas, em turco. Desde seu lançamento, o İşbank viu uma adoção generalizada por mais de 5,5 milhões de usuários, com uma média de 9,8 interações por usuário. Nos últimos meses, à medida que os casos de COVID-19 aumentaram na Turquia, o İşbank rapidamente treinou o Maxi para ser responsivo a consultas relacionadas à COVID-19. Desde março de 2020, o Maxi respondeu a mais de 1,2 milhão de consultas de clientes relacionadas à COVID-19, um aumento de mais de 62% no uso.
O que você diria às mulheres que estão interessadas em aprender mais sobre IA, mas estão relutantes em se envolver devido ao fato de ser um campo dominado por homens?
Desde o início, não acho que haja motivo pelo qual a IA seja considerada um campo dominado por homens. Acho que há muitas mulheres pioneiras em IA que estão fazendo muito bem e estão tendo um impacto. Acho que a IA, combinada com política social, é uma área única que tem o potencial de ter um grande impacto na vida das pessoas. Aqui é onde acho que mais insights diversificados em toda a área realmente nos beneficiariam, especialmente porque há muitas conversas em torno da IA envolvendo viés de raça e gênero. Acredito que ter uma comunidade de desenvolvedores de IA delimitada continuará a ter um impacto desproporcional na sociedade e na política.
Para as mulheres que estão interessadas em ingressar no campo de IA, eu as recomendo fortemente, especialmente se elas estão interessadas em fazer um impacto. A IA teve tanto crescimento e inovação ao longo dos anos e realmente é um momento emocionante para fazer parte disso.
Há algo mais que você gostaria de compartilhar sobre a Clinc?
A Clinc está dando grandes passos agora. Pessoalmente, eu acabei de entrar em um novo papel como CTO da Clinc e estou realmente animado para me concentrar em como podemos trabalhar mais com desenvolvedores e cientistas de dados para crescer o alcance de nossa tecnologia. À medida que olho para o futuro, vejo a demanda por aplicações impulsionadas por IA mudando para permitir que as pessoas que não têm anos de experiência em ciência de dados e aprendizado de máquina sejam capazes de usá-las também. Por exemplo, você não precisa ter um diploma em design gráfico para ser capaz de usar o Photoshop. Acho que a IA está indo nessa direção, onde os desenvolvedores sem treinamento em IA ou aprendizado de máquina serão capazes de alcançar resultados e produzir aplicações de alta qualidade. Em geral, queremos reiterar que não estamos apenas devotados ao usuário final, mas também aos desenvolvedores, independentemente do nível, que mostram interesse em nossa solução.
Obrigado pela grande entrevista, estou ansioso para seguir seu progresso. Qualquer pessoa que deseje aprender mais deve visitar Clinc.












