Connect with us

Andrea Vattani, Co-Fundador & Cientista Chefe na Spiketrap – Série de Entrevistas

Entrevistas

Andrea Vattani, Co-Fundador & Cientista Chefe na Spiketrap – Série de Entrevistas

mm

Andrea Vattani, é o Co-Fundador & Cientista Chefe na Spiketrap, uma empresa de contextualização que fornece inteligência de audiência e desempenho de mídia para criadores, plataformas e marcas. O Clair AI proprietário extrai o sinal do ruído de conjuntos de dados não estruturados, fornecendo clareza e contexto sem precedentes, particularmente em ambientes online de alta velocidade.

O que o atraiu inicialmente para a ciência da computação e a IA?

Foi uma combinação de circunstâncias fortuitas, eu cheguei à Universidade de Roma para fazer o exame de admissão em Estatística, e acabou que eu estava um dia atrasado! Fui aconselhado a me inscrever em Ciência da Computação em vez disso e mudar de volta para o departamento de Estatística um ano depois. Eu fui ao exame de admissão em Ciência da Computação (que era naquele dia!) e passei… nunca mais mudei para Estatística! Meu interesse em IA realmente começou com a realização de como os computadores podem ajudar a automatizar coisas, e a IA é a máquina de automação definitiva. Além disso, a linguagem natural e como as pessoas a usam sempre foi um interesse meu: eu me concentrei em estudos clássicos no ensino médio, estudando grego antigo e latim, o que é provavelmente semelhante a como uma máquina se sente quando alimentada com um fluxo de palavras.

Você trabalhou anteriormente como Líder de Engenharia de Software Sênior na Amazon Goodreads, quais foram alguns dos projetos em que você trabalhou e quais foram algumas das principais lições aprendidas com essa experiência?

Enquanto estava na Goodreads, eu trabalhei em vários projetos de aprendizado de máquina que incluíam detecção de spam e escalonamento do mecanismo de recomendação de livros. Minhas lições aprendidas durante meu tempo lá foram aprender a importância de definir métricas de ML que correspondam aos objetivos dos negócios e dos clientes. Para dar um exemplo, os mecanismos de recomendação existem há muito tempo. Lembre-se do concurso “Netflix Prize” em 2009 para descobrir recomendações de filmes melhores? Algumas percepções das soluções vencedoras sugeriram que a probabilidade de você assistir a um filme não é muito impulsionada por você gostar ou não, mas principalmente se é semelhante aos seus interesses. Isso pode funcionar para filmes, pois é um compromisso curto de 90 minutos, mas para livros não é o caso. Integrar o objetivo certo nas métricas é fundamental.

Outra lição que eu apliquei na Spiketrap é construir equipes de IA que sejam orientadas para entrega e integradas ao roadmap do produto, em vez de uma equipe isolada apenas focada em explorações e pesquisas. Isso leva a uma melhor definição de objetivos, prazos e compreensão do ROI. Isso também favorece naturalmente a equipe a se concentrar na velocidade e praticidade de um modelo, em vez de apenas olhar para a precisão. Voltando ao exemplo do concurso Netflix, os modelos das equipes vencedoras nunca foram integrados devido à falta de praticidade, apesar de sua precisão aprimorada.

Sua pesquisa foi publicada em numerosos periódicos, qual é, na sua opinião, o artigo mais importante até agora?

Durante meu Ph.D., tive a sorte de colaborar com vários pesquisadores de diferentes áreas, incluindo aprendizado de máquina, “big data”, análise de dados sociais e teoria dos jogos. Um artigo que eu gosto por sua simplicidade e aplicabilidade é “K-Means++ Escalável“: K-means++ é um método de agrupamento não supervisionado amplamente utilizado para dividir um conjunto de dados em K grupos coerentes. Ele faz isso adicionando um grupo de cada vez, então, quando você tem muitos dados e grupos, isso se torna muito lento. Nesse artigo, mostramos como você pode alcançar a mesma precisão, se não melhor, paralelizando o método. Nossa metodologia é extremamente simples e foi implementada em várias bibliotecas de aprendizado de máquina.

Pode compartilhar a história de criação por trás da Spiketrap?

Depois de trabalhar na Goodreads, eu e os co-fundadores da Spiketrap, Kieran e Virgilio, entendemos que havia uma lacuna na indústria para acessar insights avançados de marca de plataformas sociais de nicho. Ao aplicar tecnologias de IA, poderíamos abordar o problema de forma eficiente.

Na economia de hoje, é imperativo que as empresas ouçam seus clientes e suas respectivas indústrias como um todo. No entanto, muito do que os clientes têm a dizer sobre marcas vai ouvido. Milhões de pessoas expressam suas opiniões abertamente todos os dias, em plataformas como Twitter, Reddit, Twitch e outras. Isso se provou ser um recurso extremamente valioso para qualquer pesquisador de mercado, desde que o conteúdo possa ser contextualizado em escala. O problema é que a indústria de insights não acompanhou os comportamentos digitais e a linguagem em evolução.

As ferramentas de escuta ainda dependem de palavras-chave e buscas booleanas, perdendo grande parte da conversa que poderia e deveria ser atribuída a uma marca específica. Enquanto isso, as empresas de pesquisa de mercado têm sido pegos em um ato de equilíbrio cada vez mais difícil, tentando obter insights qualitativos de metodologias quantitativas e limitadas por custos.

Em resumo, as pessoas carecem das ferramentas necessárias para entender seu público em escala. Números de vendas e contagens de visualizações respondem ao “o quê” dos comportamentos da audiência, mas não ao “por quê”. Sem contexto, descobrir o que é correlação versus causalidade é um jogo de adivinhação. Reconhecendo esse vazio, mergulhamos no que uma solução para compreensão contextual seria e a Spiketrap nasceu.

Quais são algumas das tecnologias de aprendizado de máquina utilizadas na Spiketrap?

Nós usamos uma variedade de tecnologias, desde a sua biblioteca Scikit-learn até bibliotecas de aprendizado profundo como Pytorch. Além das bibliotecas, as metodologias, modelos e conjuntos de dados que usamos são principalmente proprietários. Aprendemos que métodos e modelos prontos para uso só te levam até certo ponto, mas para realmente resolver um problema, você realmente precisa colocar seu próprio trabalho, começando com objetivos e indo até a arquitetura do modelo e conjuntos de dados. Para dar um exemplo, modelagem de tópicos é a tarefa de extrair temas de uma coleção de peças de texto. Nosso “Spiketrap Convos” fornece aos nossos clientes insights cruciais sobre sua audiência e usa modelagem de tópicos como um dos sinais. O método usual para modelagem de tópicos é LDA (Alocação Latente de Dirichlet), mas infelizmente é muito inconsistente e imprevisível e simplesmente não é poderoso o suficiente. No outro lado do espectro, você pode tentar um modelo pré-treinado moderno como Bert-Topics, que – embora poderoso e abrangente – também é muito rígido e lento. NLP e IA de linguagem fizeram grandes progressos na última década, mas transformar modelos existentes em produtos ainda está longe do ideal e é uma aposta arriscada.

Pode elaborar sobre como a Spiketrap fornece compreensão instantânea da audiência para criadores, plataformas e marcas?

Anunciantes e agências usam nossas líderes de influenciadores e ferramentas de afinidade de marca para identificar criadores cujas comunidades são seguras para a marca em várias categorias, incluindo notas para conteúdo tóxico, profano e sexual – bem como segurança geral da comunidade da marca.

Criadores podem usar a ferramenta para mergulhar em transmissões individuais e ver quais conversas foram as mais ou menos seguras, quais impulsionaram o engajamento positivo para seus patrocinadores e onde eles podem melhorar seus esforços de moderação.

Um artigo recente intitulado ‘FeelsGoodMan: Inferindo Semântica de Neologismos do Twitch‘ foi publicado pela Spiketrap. Pode descrever brevemente o que é esse artigo?

A forma como as pessoas se comunicam e expressam online tem se tornado progressivamente mais complexa e desafiadora de decifrar. Primeiro vieram os emoticons :-). Então vieram os emojis . Então vieram as memês… e agora “emotes”, uma nova forma de comunicação baseada em ícones que se tornou muito popular na plataforma de streaming Twitch. Um pouco semelhante aos emojis por seu uso intermisturado com texto regular, eles apresentam desafios semelhantes aos das memês, pois são gerados pelo usuário e seu significado críptico não tem conexão óbvia com a imagem real representada. Existem mais de 8 milhões de emotes distintos até o momento, com mais de 400 mil usados semanalmente. Ainda assim, as pessoas se comunicam efetivamente usando-os para expressar qualquer tipo de sentimento, como alegria, tédio, excitação ou sarcasmo. Nosso artigo recente é um “livro de receitas” de IA para inferir o significado semântico dos emotes. Nossa abordagem não requer manter e atualizar um conjunto de dados curado manualmente e é capaz de se adaptar automaticamente à introdução contínua de novos emotes, bem como à evolução do significado de emotes populares. Isso é particularmente importante quando um emote se torna carregado politicamente ou racialmente, o que vimos acontecer com emotes extremamente populares, como “TriHard”, “PogChamp” e “FeelsGoodMan”. O uso dinâmico da linguagem e as mudanças de significado apresentam enormes problemas para sistemas de moderação ou frameworks de análise de sentimento, então estamos orgulhosos de abordar esse problema da maneira certa na Spiketrap.

Há algo mais que você gostaria de compartilhar sobre a Spiketrap?

À medida que olhamos para o novo ano, a Spiketrap está trabalhando no desenvolvimento e aperfeiçoamento de uma nova ferramenta que fornecerá uma compreensão mais profunda do sentimento da marca para nossos clientes. A nova Ferramenta de Afinidade da Spiketrap fornece uma maneira interativa e intuitiva de identificar e quantificar afinidades da audiência em criadores, marcas, jogos e mais. Para qualquer consulta dada, a ferramenta gera índices de afinidade que indicam como uma entidade específica está positivamente correlacionada a outra. Vários sinais contextuais compõem a pontuação, incluindo a frequência e o sentimento de menções relacionadas. A pilha de tecnologia da Spiketrap está posicionada de forma única para indexar afinidades entre jogos, marcas e criadores. O Clair, sua IA de NLP proprietária, processa milhões de mensagens de usuário geradas publicamente todos os dias, atribuindo conteúdo ambíguo a entidades dentro do gráfico de conhecimento da Spiketrap, identificando tópicos de conversa, determinando sentimento e monitorando segurança. A adição da nova Ferramenta de Afinidade capacita desenvolvedores, criadores, marcas e mais a entender melhor seu público e impacto da marca.

Obrigado pela grande entrevista, leitores que desejam aprender mais devem visitar Spiketrap.

Antoine é um líder visionário e sócio-fundador da Unite.AI, impulsionado por uma paixão inabalável em moldar e promover o futuro da IA e da robótica. Um empreendedor serial, ele acredita que a IA será tão disruptiva para a sociedade quanto a eletricidade, e é frequentemente pego falando sobre o potencial das tecnologias disruptivas e da AGI. Como um futurista, ele está dedicado a explorar como essas inovações moldarão nosso mundo. Além disso, ele é o fundador da Securities.io, uma plataforma focada em investir em tecnologias de ponta que estão redefinindo o futuro e remodelando setores inteiros.