Connect with us

Inteligência artificial

Ricky Costa, CEO da Quantum Stat – Série de Entrevistas

mm

Ricky Costa é o CEO da Quantum Stat, uma empresa que oferece soluções de negócios para NLP e Iniciativas de IA

O que inicialmente o interessou em inteligência artificial?

Aleatoriedade. Eu estava lendo um livro sobre probabilidade quando encontrei um famoso teorema. Na época, eu ingenuamente me perguntei se eu poderia aplicar esse teorema em um problema de linguagem natural que eu estava tentando resolver no trabalho. Como se revelou, o algoritmo já existia, desconhecido por mim, era chamado de Naïve Bayes, um modelo gerativo muito famoso e simples usado no aprendizado de máquina clássico. Esse teorema era o teorema de Bayes. Eu senti que essa coincidência era um indício e plantou uma semente de curiosidade para continuar aprendendo mais.

 

Você é o CEO da Quantum Stat, uma empresa que oferece soluções para Processamento de Linguagem Natural. Como você se encontrou nessa posição?

Quando há uma revolução em uma nova tecnologia, algumas empresas são mais hesitantes do que outras ao enfrentar o desconhecido. Eu comecei minha empresa porque perseguir o desconhecido é divertido para mim. Além disso, eu senti que era o momento certo para entrar no campo do NLP, considerando todas as pesquisas incríveis que chegaram nos últimos 2 anos. A comunidade do NLP tem a capacidade de alcançar muito mais com muito menos, graças ao advento de novas técnicas de NLP que requerem menos dados para escalar o desempenho.

 

Para os leitores que podem não estar familiarizados com esse campo, você poderia compartilhar conosco o que o Processamento de Linguagem Natural faz?

NLP é um subcampo da IA e análise que tenta entender a linguagem natural em texto, fala ou aprendizado multi-modal (texto e imagens/vídeo) e computá-la ao ponto de onde você está dirigindo insights e/ou fornecendo um serviço valioso. O valor pode chegar de vários ângulos, desde a recuperação de informações no sistema de arquivos interno de uma empresa, até a classificação de sentimentos nas notícias, ou um bot do Twitter GPT-2 que ajuda com o marketing nas redes sociais (como o que construímos há algumas semanas).

 

Você tem um Bacharelado em Artes pela Hunter College em Psicologia Experimental. Você sente que entender o cérebro humano e a psicologia humana é um ativo quando se trata de entender e expandir o campo do Processamento de Linguagem Natural?

Isso é contrariano, mas infelizmente, não. A analogia de neurônios e redes neurais profundas é simplesmente para ilustração e instilar intuição. Alguém pode aprender muito mais com a ciência da complexidade e engenharia. A dificuldade de entender como o cérebro funciona é que estamos lidando com um sistema complexo. “Inteligência” é um fenômeno emergente da complexidade do cérebro interagindo com seu ambiente e é muito difícil de pinar. Psicologia e outras ciências sociais, que dependem do “reducionismo” (de cima para baixo), não funcionam sob esse paradigma complexo. Aqui está a intuição: imagine alguém tentando reduzir a música “Let it Be” dos Beatles para a escala de Dó Maior. Não há nada nessa escala que preveja que “Let it Be” emergirá dela. O mesmo se aplica a alguém tentando reduzir o comportamento à atividade neural no cérebro.

 

Você poderia compartilhar conosco por que os Big Data são tão importantes quando se trata de Aprendizado Profundo e, mais especificamente, Processamento de Linguagem Natural?

Como está, porque os modelos de aprendizado profundo interpolam os dados, quanto mais dados você alimenta o modelo, menos casos de bordo ele verá ao fazer uma inferência no mundo real. Essa arquitetura “incentiva” grandes conjuntos de dados a serem computados por modelos para aumentar a precisão da saída. No entanto, se queremos alcançar um comportamento mais inteligente por modelos de IA, precisamos olhar além de quanto dados temos e mais para como podemos melhorar a capacidade do modelo de raciocinar de forma mais eficiente, o que intuitivamente não deve requerer muitos dados. De uma perspectiva de complexidade, os experimentos de autômatos celulares conduzidos no passado por físicos como John von Neumann e Stephen Wolfram mostram que a complexidade pode emergir de condições iniciais simples e regras. O que essas condições/regras devem ser em relação à IA é o que todos estão caçando.

 

Você recentemente lançou o ‘Big Bad NLP Database’. O que é esse banco de dados e por que ele é importante para aqueles na indústria de IA?

Esse banco de dados foi criado para que os desenvolvedores de NLP tenham acesso sem problemas a todos os conjuntos de dados pertinentes na indústria. Esse banco de dados ajuda a indexar conjuntos de dados, o que tem um efeito secundário agradável de permitir que os usuários os consultem. O pré-processamento de dados leva a maior parte do tempo no pipeline de implantação e esse banco de dados tenta mitigar esse problema o máximo possível. Além disso, é uma plataforma gratuita para qualquer pessoa, independentemente de ser um pesquisador acadêmico, praticante ou guru de IA independente que queira se atualizar com os dados de NLP. Link

 

A Quantum Stat atualmente oferece soluções de ponta a ponta. Quais são algumas dessas soluções?

Nós ajudamos as empresas a facilitar seu pipeline de modelagem de NLP, oferecendo desenvolvimento em qualquer estágio. Podemos cobrir uma ampla gama de serviços, desde a limpeza de dados na etapa de pré-processamento até a implantação do servidor de modelo em produção (esses serviços também são destacados em nossa página inicial). Nem todos os projetos de IA chegam a fruição devido à natureza desconhecida de como seus dados/arquitetura de projeto funcionam com um modelo de estado da arte. Dada essa incerteza, nossos serviços dão às empresas a chance de iterar sobre seu projeto por uma fração do custo de contratar um engenheiro de ML em tempo integral.

 

Qual é o avanço recente em IA que você acha mais interessante?

O avanço mais importante nos últimos tempos é o modelo transformer, você pode ter ouvido falar: BERT, RoBERTa, ALBERT, T5 e assim por diante. Esses modelos transformer são muito atraentes porque permitem que o pesquisador alcance o desempenho de estado da arte com conjuntos de dados menores. Antes dos transformers, um desenvolvedor precisaria de um conjunto de dados muito grande para treinar um modelo do zero. Como esses transformers vêm pré-treinados em bilhões de palavras, permite uma iteração mais rápida de projetos de IA e é com o que estamos mais envolvidos no momento.

 

Há algo mais que você gostaria de compartilhar sobre a Quantum Stat?

Estamos trabalhando em um novo projeto que lida com a análise de sentimento do mercado financeiro, que será lançado em breve. Nós aproveitamos vários transformers para dar uma visão sem precedentes de como as notícias financeiras se desenrolam em tempo real. Fique atento!

Para saber mais, visite a Quantum Stat ou leia nosso artigo sobre o Big Bad NLP Database.

Antoine é um líder visionário e sócio-fundador da Unite.AI, impulsionado por uma paixão inabalável em moldar e promover o futuro da IA e da robótica. Um empreendedor serial, ele acredita que a IA será tão disruptiva para a sociedade quanto a eletricidade, e é frequentemente pego falando sobre o potencial das tecnologias disruptivas e da AGI. Como um futurista, ele está dedicado a explorar como essas inovações moldarão nosso mundo. Além disso, ele é o fundador da Securities.io, uma plataforma focada em investir em tecnologias de ponta que estão redefinindo o futuro e remodelando setores inteiros.