Entrevistas

Mike Capps, Co-Fundador & CEO da Diveplane – Série de Entrevistas

Published September 13, 2022

Updated April 5, 2026

Antoine Tardif, CEO & Founder of Unite.AI

O Dr. Michael Capps é um tecnólogo renomado e CEO da Diveplane Corporation. Antes de co-fundar a Diveplane, Mike teve uma carreira lendária na indústria de videogames como presidente da Epic Games, criadora de sucessos como Fortnite e Gears of War. Seu mandato incluiu mais de cem prêmios de jogo do ano, dezenas de palestras em conferências, um prêmio de realização de carreira e uma defesa bem-sucedida da liberdade de expressão dos videogames no Supremo Tribunal dos EUA.

Diveplane oferece soluções de negócios impulsionadas por IA em várias indústrias. Com seis patentes aprovadas e várias pendentes, a IA Compreensível da Diveplane fornece compreensão e transparência de decisões em apoio a políticas de IA éticas e estratégias de privacidade de dados.

Você se aposentou com sucesso de uma carreira bem-sucedida na indústria de videogames na Epic Games, o que o inspirou a sair da aposentadoria para se concentrar em IA?

Fazer jogos foi incrível, mas – pelo menos na época – não era uma carreira ideal quando se tem uma nova família. Eu me mantive ocupado com conselhos e funções de consultoria, mas não era gratificante. Então, fiz uma lista de três problemas principais que o mundo enfrenta e que eu poderia impactar – e isso incluiu a proliferação de sistemas de IA caixa-preta. Meu plano era passar um ano em cada um, cavando fundo, mas algumas semanas depois, meu amigo brilhante Chris Hazard me disse que havia trabalhado secretamente em uma plataforma de IA transparente e totalmente explicável. E aqui estamos.

A Diveplane foi iniciada com a missão de trazer humanidade para a IA, pode explicar o que isso significa especificamente?

Claro. Aqui estamos usando humanidade para significar “humanidade” ou “compaixão”. Para garantir que o melhor da humanidade esteja em seu modelo de IA, você não pode apenas treinar, testar um pouco e torcer para que esteja tudo bem.

Nós precisamos revisar cuidadosamente os dados de entrada, o modelo em si e a saída desse modelo, e ter certeza de que reflete o melhor da nossa humanidade. A maioria dos sistemas treinados com dados históricos ou do mundo real não estará correta da primeira vez, e não são necessariamente imparciais. Acreditamos que a única maneira de erradicar o viés em um modelo – significando tanto erros estatísticos quanto preconceito – é a combinação de transparência, auditoria e explicação compreensível para humanos.

A tecnologia central da Diveplane é chamada REACTOR, o que torna essa uma abordagem inovadora para tornar a aprendizagem de máquina explicável?

A aprendizagem de máquina geralmente envolve usar dados para construir um modelo que toma um tipo particular de decisão. Decisões podem incluir o ângulo para girar as rodas de um veículo, se aprovar ou negar uma compra ou marcá-la como fraude, ou qual produto recomendar a alguém. Se você quiser aprender como o modelo tomou a decisão, geralmente precisa perguntar a ele muitas decisões semelhantes e tentar novamente para prever o que o modelo pode fazer. As técnicas de aprendizagem de máquina são limitadas nos tipos de insights que podem oferecer, seja pelo fato de os insights refletirem o que o modelo fez para chegar à decisão ou por terem menor precisão.

Trabalhar com REACTOR é bastante diferente. REACTOR caracteriza a incerteza dos seus dados, e os seus dados se tornam o modelo. Em vez de construir um modelo por tipo de decisão, você simplesmente pergunta ao REACTOR o que você gostaria que ele decidisse – pode ser qualquer coisa relacionada aos dados – e o REACTOR consulta quais dados são necessários para uma decisão específica. O REACTOR sempre pode mostrar a você os dados que ele usou, como eles se relacionam com a resposta, todos os aspectos de incerteza, raciocínio contrafactual e virtualmente qualquer outra pergunta que você gostaria de fazer. Como os dados são o modelo, você pode editar os dados e o REACTOR será atualizado instantaneamente. Ele pode mostrar se houve algum dado que parecesse anômalo que entrou na decisão e rastrear cada edição dos dados e sua fonte. O REACTOR usa teoria de probabilidade em todos os níveis, o que significa que podemos dizer a você as unidades de medida de cada parte de sua operação. E, finalmente, você pode reproduzir e validar qualquer decisão usando apenas os dados que levaram à decisão e as incertezas, usando matemática relativamente direta, sem precisar do REACTOR.

O REACTOR é capaz de fazer tudo isso enquanto mantém uma precisão altamente competitiva, especialmente para conjuntos de dados pequenos e esparsos.

GEMINAI é um produto que constrói um gêmeo digital de um conjunto de dados, o que isso significa especificamente e como isso garante a privacidade dos dados?

Quando você alimenta o GEMINAI com um conjunto de dados, ele constrói um conhecimento profundo da forma estatística desses dados. Você pode usá-lo para criar um gêmeo sintético que se assemelha à estrutura dos dados originais, mas todos os registros são criados novamente. Mas a forma estatística é a mesma. Então, por exemplo, a frequência cardíaca média dos pacientes em ambos os conjuntos seria quase a mesma, assim como todas as outras estatísticas. Portanto, qualquer análise de dados usando o gêmeo daria a mesma resposta que os originais, incluindo o treinamento de modelos de ML.

E se alguém tiver um registro nos dados originais, não haverá registro para essa pessoa no gêmeo sintético. Não estamos apenas removendo o nome – estamos garantindo que não haja um novo registro que esteja “perto” do registro (e de todos os outros) no espaço de informações. I.e., não há registro que seja reconhecível em ambos os conjuntos originais e sintéticos.

E isso significa que o conjunto de dados sintéticos pode ser compartilhado mais livremente, sem risco de compartilhar informações confidenciais de forma inadequada. Não importa se for transações financeiras pessoais, informações de saúde do paciente, dados classificados – desde que as estatísticas dos dados não sejam confidenciais, o gêmeo sintético não é confidencial.

Por que o GEMINAI é uma solução melhor do que usar privacidade diferencial?

A privacidade diferencial é um conjunto de técnicas que mantém a probabilidade de que qualquer indivíduo influencie as estatísticas mais do que uma quantidade marginal, e é uma peça fundamental em quase qualquer solução de privacidade de dados. No entanto, quando a privacidade diferencial é usada sozinha, um orçamento de privacidade para os dados precisa ser gerenciado, com ruído suficiente adicionado a cada consulta. Uma vez que esse orçamento é usado, os dados não podem ser usados novamente sem incorrer em riscos de privacidade.

Uma maneira de superar esse orçamento é aplicar o orçamento de privacidade completo de uma vez para treinar um modelo de ML para gerar dados sintéticos. A ideia é que esse modelo, treinado usando privacidade diferencial, pode ser usado relativamente com segurança. No entanto, a aplicação adequada da privacidade diferencial pode ser complicada, especialmente se houver volumes de dados diferentes para indivíduos diferentes e relações mais complexas, como pessoas que moram na mesma casa. E os dados sintéticos produzidos a partir desse modelo provavelmente incluirão, por acaso, dados reais que um indivíduo pode reivindicar como seus, porque são muito semelhantes.

O GEMINAI resolve esses problemas e mais, combinando múltiplas técnicas de privacidade ao sintetizar os dados. Ele usa uma forma prática de privacidade diferencial que pode acomodar uma ampla variedade de tipos de dados. Ele é construído sobre o nosso motor REACTOR, então ele também sabe a probabilidade de que qualquer pedaços de dados possam ser confundidos uns com os outros, e sintetiza dados garantindo que estejam sempre suficientemente diferentes dos dados originais mais semelhantes. Além disso, ele trata cada campo, cada pedaço de dados como potencialmente sensível ou identificador, então ele aplica formas práticas de privacidade diferencial para campos que não são tradicionalmente considerados sensíveis, mas que podem identificar de forma única um indivíduo, como a única transação em uma loja de 24 horas entre 2h e 3h. Geralmente nos referimos a isso como “corte transversal de privacidade”.

O GEMINAI consegue alcançar alta precisão para quase qualquer propósito, que se assemelha aos dados originais, mas impede que alguém encontre dados sintéticos muito semelhantes aos dados sintéticos.

A Diveplane foi fundamental na co-fundação da Data & Trust Alliance, o que é essa aliança?

É um grupo absolutamente fantástico de CEOs de tecnologia, colaborando para desenvolver e adotar práticas responsáveis de dados e IA. Organizações de classe mundial como IBM, Johnson&Johnson, Mastercard, UPS, Walmart e Diveplane. Estamos muito orgulhosos de ter feito parte dos estágios iniciais e também orgulhosos do trabalho que coletivamente realizamos em nossas iniciativas.

A Diveplane recentemente levantou uma rodada de financiamento de série A bem-sucedida, o que isso significará para o futuro da empresa?

Nós fomos sortudos por sermos bem-sucedidos com nossos projetos de empresa, mas é difícil mudar o mundo uma empresa de cada vez. Vamos usar esse apoio para construir nossa equipe, compartilhar nossa mensagem e colocar a IA Compreensível em tantos lugares quanto possível!

Há algo mais que você gostaria de compartilhar sobre a Diveplane?

A Diveplane é tudo sobre garantir que a IA seja feita corretamente à medida que se prolifera. Estamos falando de IA justa, transparente e compreensível, mostrando proativamente o que está impulsionando as decisões e nos afastando da mentalidade “caixa-preta” na IA que tem o potencial de ser injusta, antiética e tendenciosa. Acreditamos que a Explicabilidade é o futuro da IA e estamos ansiosos para desempenhar um papel fundamental em impulsioná-la!

Obrigado pela ótima entrevista, leitores que desejam aprender mais devem visitar Diveplane.

Unite.AI

Mike Capps, Co-Fundador & CEO da Diveplane – Série de Entrevistas

You may like