Entrevistas
Rana Gujral, CEO da Behavioral Signals – Série de Entrevistas

Rana Gujral é o CEO da Behavioral Signals, uma empresa que está pontuando a lacuna de comunicação entre humanos e máquinas, introduzindo inteligência emocional, a partir da fala, em conversas com IA.
A Behavioral Signals é uma startup relativamente jovem, tendo sido lançada em 2016. Pode compartilhar a história de como tudo começou?
Impulsionada por uma paixão para levar as tecnologias patentes de fala-para-emocional e fala-para-comportamento da empresa para o mercado, o CTO, Alex Potamianos, e o Chief Scientist, Shri Narayanan, fundaram a Behavioral Signals em 2016. Shri é um professor Andrew J. Viterbi de Engenharia na Universidade do Sul da Califórnia (USC). Ele fundou e atualmente dirige o Laboratório de Análise e Interpretação de Sinais (SAIL) na USC. Alex é um inovador renomado no campo de fala e processamento de linguagem natural, sistemas de resposta de voz interativa e informática comportamental. Ele tem mais de 20 anos de experiência de liderança tanto no lado corporativo quanto no lado empreendedor dos negócios, enquanto seu histórico inclui trabalhar nos AT&T Labs-Research, Bell Labs e Lucent Technologies.
Com o objetivo de melhorar e mudar para sempre o mundo dos negócios, acreditamos que a tecnologia está no núcleo do que pode ser alcançado. Os algoritmos da Behavioral Signals analisam emoções e comportamentos humanos, transformam dados em informações utilizáveis e levam a melhores decisões de negócios e aumento de lucros. Até agora, a emoção humana foi considerada impossível de quantificar e impossível de medir. Com nosso motor de análise patenteado, medimos e interpretamos a parte “como” das interações humanas.
A Behavioral Signals confia em um tipo de aprendizado de máquina de computação afetiva (também conhecida como Emotion AI). Pode explicar o que é isso?
Inteligência artificial emocional, também chamada de Emotion AI ou computação afetiva, está sendo usada para desenvolver máquinas capazes de ler, interpretar, responder e imitar o afeto humano – a forma como experimentamos e expressamos emoções. O que isso significa para os consumidores? Significa que seus dispositivos, como seu smartphone ou alto-falantes inteligentes, poderão oferecer interações que sejam mais naturais do que nunca, simplesmente lendo as pistas emocionais em sua voz.
À medida que nossa dependência de IA cresce, também cresce a necessidade de IA emocionalmente inteligente. É uma coisa pedir ao seu assistente virtual para ler os placares de jogos de hoje, mas é completamente outra coisa confiar seus pais idosos ao cuidado de um robô impulsionado por IA. Atualmente, a IA pode fazer coisas incríveis, como diagnosticar condições médicas e esboçar tratamentos, mas ainda precisa de inteligência emocional para se comunicar com pacientes de uma maneira mais humana.
Quais outros tipos de tecnologias de aprendizado de máquina são utilizadas?
Quando se trata de aprendizado de máquina, utilizamos principalmente aprendizado profundo e PNL em nossos modelos de análise de Processamento de Sinais Comportamentais. Para explicar um pouco melhor, pioneiramos um campo, Processamento de Sinais Comportamentais, baseado em mais de uma década de pesquisa vencedora de prêmios e patenteada, para detectar automaticamente informações codificadas na voz humana a partir de áudio e medir a qualidade da interação humana. É uma disciplina emergente que une engenharia com ciências comportamentais e visa quantificar e interpretar interação e comunicação humana por meio do uso de inovações de engenharia e computação. O aprendizado profundo é a ferramenta que ajuda a criar modelos preditivos melhores.
Que tipo de dados você coleta do tom de voz?
Nossa tecnologia de IA de aprendizado profundo analisa o que e como algo está sendo dito, em ambos os lados de uma conversa, medindo emoções e comportamentos. A gama de emoções é bastante diversa, mas o que realmente importa é a inteligência agregada dessa análise. Para dar um exemplo, considere uma conversa entre um funcionário de um banco e um cliente; podemos capturar e medir cortesia, compostura (calma vs agitada), empatia em relação ao cliente, reações do cliente e estilo de fala geral, como lento, rápido, engajado ou desengajado, para calcular a pontuação de qualidade da conversa, a eficácia do resultado e o desempenho do funcionário.
Que tipo de análise de dados é feita para prever intenção?
Previsão de intenção é muito semelhante ao que já foi mencionado. Utilizamos sinais comportamentais na voz para prever a intenção de um cliente de comprar um produto, renovar uma assinatura ou se um devedor pagará sua dívida. A previsão de intenção pode ajudar as empresas a aumentar suas taxas de vendas e coleta, reduzir custos e, em última análise, melhorar a satisfação do cliente.
A Behavioral Signals foi vencedora 6 vezes do desafio de qualidade de interações humanas e paralinguística computacional da INTERSPEECH. O que é esse desafio e quão significativo é esse feito?
Interspeech é a maior conferência técnica do mundo focada em processamento de fala e aplicativos. Ela tem a maior audiência nesse domínio e um número significativo de artigos de pesquisa. A conferência enfatiza abordagens interdisciplinares que abordam todos os aspectos da ciência e tecnologia da fala, desde teorias básicas até aplicações avançadas. Seus desafios são considerados o Prêmio Turing em reconhecimento de fala e disciplinas de processamento de linguagem natural. Vencer é um reconhecimento importante de nosso trabalho científico e capacidade única de detectar sinais a partir de dados de áudio associados a comportamentos e traços que impulsionam a tomada de decisões humanas.
Quão rapidamente a Behavioral Signals pode se adaptar a diferentes idiomas, e que tamanho de conjunto de dados é necessário?
Nossa tecnologia é agnóstica em relação ao idioma. Escutamos como algo está sendo dito, em vez de o que está sendo dito. Escutamos as emoções expressas, que são bastante universais em todos os idiomas. Claro, cada idioma tem seus próprios traços únicos que podem exigir um ajuste fine dos nossos algoritmos, mas a diferença em nossos modelos de análise preditiva é geralmente pequena.
Pode discutir a solução mais recente da Behavioral Signals, a Conversa Mediada por IA?
Conversas Mediadas por IA (AI-MC) é uma solução de roteamento de chamadas automatizada que usa IA de emoção e dados de voz para combinar o cliente com o funcionário mais adequado para lidar com uma chamada específica. Se voltarmos ao exemplo mencionado anteriormente, do funcionário do banco e do cliente, nossa tecnologia pode guiar a dinâmica da conversa com o objetivo final de melhorar o resultado, seja para melhorar a experiência do cliente, aumentar a coleta ou resolver problemas mais rapidamente. Qualquer que seja o objetivo, sempre há um catalisador que permitiria que ambas as partes alcançassem o resultado desejado. Esse fator contribuinte é geralmente um processo humano simples e natural: a afinidade ou rapport desenvolvida entre as pessoas. Independentemente do tipo de comunicação de negócios (chamada de vendas, suporte, coleta), sempre será uma interação entre humanos reais, onde raramente a afinidade é idêntica entre dois pares de pessoas. Temos comportamentos e traços específicos que nos ajudam a nos dar melhor com algumas pessoas do que com outras. Essa combinação é baseada em dados de perfil e nossos algoritmos superiores desenvolvidos a partir de anos de pesquisa e experiência em PNL e Processamento de Sinais Comportamentais.
Implementamos recentemente a solução AI-MC da Behavioral Signals para aumentar a eficácia e eficiência do call center de um banco da UE. O estudo de caso foi reconhecido pela Gartner e incluído em seu Relatório de Adoção de Emotion AI. A solução demonstrou um ROI significativo com um aumento de 20% nas aplicações de reestruturação de dívida ativa. Além disso, essa melhoria foi alcançada com 7,6% menos chamadas, levando a reduções de custos adicionais. Em números absolutos, esses resultados corresponderam a um aumento de $300M para o banco.
Há algo mais que você gostaria de compartilhar sobre a Behavioral Signals?
Enquanto nos orgulhamos muito de nossos feitos de pesquisa, somos igualmente gratos pelos reconhecimentos da indústria. No outono de 2019, nossa tecnologia foi listada como líder de caso de uso no cobiçado Pesquisa Maverick da Gartner, que perfila tecnologias de ponta. No início deste ano, fomos incluídos no Ciclo de Hype da Gartner, onde nossa tecnologia foi classificada como “transformacional”. No mês passado, fomos listados como Fornecedores Cool da Gartner 2020.
Obrigado pela grande entrevista, leitores que desejam aprender mais devem visitar a Behavioral Signals.












