Entrevistas
Fabiana Clemente, Co-fundadora e Diretora de Dados da YData – Série de Entrevistas

Fabiana Clemente é a Co-fundadora e Diretora de Dados da YData. A YData é uma startup de IA que criou a primeira solução de desenvolvimento centrada em dados para combinar descoberta de dados, melhoria e escala em uma única plataforma.
O que inicialmente a atraiu para a IA e o aprendizado de máquina?
Minha formação é em Matemática Aplicada, onde tive a oportunidade de aprender e entender como podemos extrair informações a partir de dados, bem como fazer isso utilizando código. Naquela época, não era tão “sexy” quanto o Aprendizado de Máquina, mas foi definitivamente o que despertou minha paixão pela área.
Pode compartilhar a história de criação por trás da YData?
Como uma Cientista de Dados que trabalhou para startups e empresas, tive minha cota de lutas – às vezes, o acesso aos dados era bloqueado sob a premissa de segurança ou privacidade, outras vezes o acesso era fácil, mas a qualidade dos dados não estava nem perto do que era necessário para construir soluções baseadas em IA. Sabendo que essas lutas são muito frequentes na maioria das organizações, nos inspirou a criar a empresa com o objetivo de ajudar essas equipes a superar esses obstáculos, acelerando seu desenvolvimento de IA com dados melhorados.
Pode descrever para nossa audiência o que é dados sintéticos?
Dados sintéticos são considerados qualquer dado que não foi gerado no mundo real, ou seja, qualquer dado criado artificialmente. Existem métodos que permitem a geração de dados sintéticos – desde estratégias baseadas em regras até o uso de modelos de Aprendizado de Máquina ou Aprendizado Profundo para aprender essas “regras” para nós. Na YData, adotamos e nos especializamos em uma estratégia baseada em Aprendizado Profundo para gerar novos dados que mantêm o comportamento de eventos do mundo real sem preocupações em torno da privacidade.
O que torna os dados sintéticos tão importantes?
Quanto mais as organizações percebem a importância dos dados para impulsionar seus negócios, mais a importância e o papel dos dados sintéticos serão entendidos. Coletar dados reais não é apenas demorado e caro, mas às vezes também impossível. Para construir aplicações de IA, os dados são um requisito difícil – é aqui que os dados sintéticos entram em cena. A capacidade de gerar cenários não vistos ou simplesmente desbloquear o acesso aos dados é fundamental para evoluir em um mundo onde pioneiros, como Andrew Ng, afirmam que se tornar centrado em dados é fundamental para uma adoção bem-sucedida de IA.
Em carros autônomos ou outras atividades de automação de máquinas, já podemos perceber a importância dos dados sintéticos, então eu diria que é apenas natural que essa compreensão se espalhe por todos os verticais de indústria.
Como a YData gera dados sintéticos?
A YData utiliza principalmente modelos gerativos profundos para aprender os atributos estatísticos e as correlações entre variáveis dos dados originais. Isso permite que o modelo gere um conjunto de dados estatisticamente relevante que tem o mesmo valor comercial do original, sem permitir rastreabilidade aos registros originais.
A YData está impulsionando essa tecnologia para frente e é a empresa por trás da Comunidade de Dados Sintéticos – um grupo de especialistas em ciência de dados comprometidos em evangelizar e ajudar qualquer um que queira aprender e usar essa tecnologia.
Como a plataforma da YData ajuda a descobrir e desbloquear novas fontes de dados?
A plataforma da YData inclui conectores integrados para qualquer tipo de banco de dados, armazém de dados ou lago de dados, que permite aos usuários acessar facilmente os metadados relevantes e entender se os dados existentes são úteis para responder às perguntas de negócios que eles têm em mãos – sem sequer olhar para os registros reais.
Pode compartilhar alguns detalhes sobre a Comunidade de Código Aberto de Dados Sintéticos?
Os dados sintéticos estão apenas nos seus primeiros dias e, por esse motivo, a conscientização sobre como eles são gerados, os benefícios ou limitações ainda são desconhecidos para uma audiência maior. Por esse motivo, na YData, decidimos tomar um caminho mais educacional, criando a Comunidade de Dados Sintéticos – além de ser um local para trocar ideias ou obter ajuda de especialistas em dados sintéticos, também é um local onde cientistas de dados e outros perfis de tecnologia podem começar sua jornada em dados sintéticos, com alguns dos algoritmos mais interessantes da literatura.
Além disso, também oferecemos uma perspectiva sobre a qualidade dos dados, para que os cientistas de dados possam primeiro entender os dados com os quais estão trabalhando, antes de sintetizá-los ou melhorar a sintetização de dados. Estamos verdadeiramente comprometidos em ajudar as equipes de dados a se tornarem cada vez mais centradas em dados.
A YData anunciou recentemente $2,7 milhões em financiamento para acelerar sua expansão internacional. Pode compartilhar alguns detalhes sobre o que isso significa para o futuro da empresa e sua estratégia de expansão?
A YData nasceu internacional – sabíamos que esse tipo de tecnologia precisa de adotantes precoces que geralmente estão nos países mais sofisticados. Por esse motivo, nossos primeiros clientes já estavam fora de Portugal, por toda a Europa, e agora estamos estabelecendo uma presença na América do Norte também. Esse financiamento nos permitirá fortalecer nossa presença em ambos os continentes, não apenas comercialmente, mas também para crescer a equipe: somos uma equipe totalmente distribuída, o que nos permite contratar os melhores talentos, onde quer que eles estejam.
Há algo mais que você gostaria de compartilhar sobre a YData?
A YData está impulsionando a barreira da IA centrada em dados e criando uma nova categoria: DataPrepOps – embora seja um nome feio, é uma dor que a maioria das empresas enfrenta hoje em dia quando se trata de desenvolvimento de ciência de dados. A tendência de Qualidade de Dados continua a crescer e, após os pipelines de dados e a observabilidade de dados, a Qualidade de Dados para equipes de ciência de dados ainda está em sua infância, e a YData está surgindo como uma líder de pensamento na preparação de dados.
Obrigada pela grande entrevista, leitores que desejam aprender mais devem visitar YData.












