toco Yashar Behzadi, CEO da Synthesis AI - Série de entrevistas - Unite.AI
Entre em contato

Entrevistas

Yashar Behzadi, CEO da Synthesis AI – Série de entrevistas

mm

Publicado

 on

Yashar Behzadi PhD é o CEO e fundador da Síntese AI. Ele é um empreendedor experiente que construiu negócios transformadores nos mercados de IA, tecnologia médica e IoT. Ele passou os últimos 14 anos no Vale do Silício construindo e expandindo empresas de tecnologia centradas em dados. Yashar tem mais de 30 patentes e patentes pendentes e um Ph.D. da UCSD com foco na modelagem espaço-temporal de imagens funcionais do cérebro.

Síntese AI é uma startup na interseção de aprendizagem profunda e CGI, criando um novo paradigma para o desenvolvimento de modelos de visão computacional. Eles permitem que os clientes desenvolvam modelos melhores por uma fração do tempo e do custo das abordagens tradicionais baseadas em anotações humanas.

Como você se envolveu inicialmente com ciência da computação e IA?

Eu obtive um Ph.D. da UCSD em 2006 com foco em visão computacional e modelagem espacial e temporal de dados de imagens cerebrais. Em seguida, trabalhei no Vale do Silício na interseção de sensores, dados e aprendizado de máquina em todos os setores pelos 16 anos seguintes. Sinto-me muito feliz por ter a oportunidade de trabalhar em algumas tecnologias notáveis ​​e tenho mais de 30 patentes emitidas ou depositadas focadas em processamento de sinais, aprendizado de máquina e ciência de dados.

Você poderia compartilhar a história da gênese da Synthesis AI?

Antes de fundar a Synthesis AI em 2019, liderei uma empresa global de serviços de IA focada no desenvolvimento de modelos de visão computacional para empresas líderes em tecnologia. Não importa o tamanho da empresa, descobri que éramos extremamente limitados pela qualidade e quantidade de dados de treinamento rotulados. À medida que as empresas se expandiam geograficamente, aumentavam sua base de clientes ou desenvolviam novos modelos e novo hardware, novos dados de treinamento eram necessários para garantir que os modelos funcionassem adequadamente. Também ficou claro que o futuro da visão computacional não seria bem-sucedido com o atual paradigma de anotação humano-in-the-loop. Aplicações emergentes de visão computacional em autonomia, robótica e aplicações de AR/VR/metaverso requerem um rico conjunto de rótulos 3D, informações de profundidade, propriedades de materiais, segmentação detalhada, etc., que os humanos não podem rotular. Um novo paradigma era necessário para fornecer o rico conjunto necessário de rótulos para treinar esses novos modelos. Além dos motivadores técnicos, observamos um aumento do escrutínio regulatório e do consumidor em torno de questões éticas relacionadas ao viés do modelo e à privacidade do consumidor.

Estabeleci a Synthesis AI com o objetivo de transformar o paradigma da visão computacional. A plataforma de geração de dados sintéticos da empresa permite a geração sob demanda de dados de imagens fotorrealistas com um conjunto expandido de rótulos 3D com pixels perfeitos. Nossa missão é ser pioneira em tecnologias de dados sintéticos para permitir o desenvolvimento ético de modelos mais capazes.

Para os leitores que não estão familiarizados com esse termo, você poderia definir o que são dados sintéticos?

Dados sintéticos são dados gerados por computador que servem como uma alternativa aos dados do mundo real. Dados sintéticos são criados em mundos digitais simulados, em vez de coletados ou medidos no mundo real. Combinando ferramentas do mundo dos efeitos visuais e CGI com modelos generativos de IA, o Synthesis AI permite que as empresas criem grandes quantidades de dados diversos fotorrealistas sob demanda para treinar modelos de visão computacional. A plataforma de geração de dados da empresa reduziu o custo e a velocidade para obter dados de imagem de alta qualidade em ordens de magnitude, preservando a privacidade.

Você poderia discutir como os dados sintéticos são gerados?

Um conjunto de dados sintéticos é criado artificialmente, e não por meio de dados do mundo real. As tecnologias da indústria de efeitos visuais são combinadas com redes neurais generativas para criar dados de imagem rotulados vastos, diversos e fotorrealistas. Os dados sintéticos permitem a criação de dados de treinamento por uma fração do custo e do tempo das abordagens atuais.

Como o aproveitamento de dados sintéticos cria uma vantagem competitiva?

Atualmente, a maioria dos sistemas de IA utiliza o 'aprendizado supervisionado', onde os humanos rotulam as chaves atribuídas nas imagens e treinam algoritmos de IA para interpretar as imagens. Este é um processo intensivo em recursos e tempo e é limitado pelo que os humanos podem rotular com precisão. Além disso, as preocupações com o viés demográfico da IA ​​e a privacidade do consumidor aumentaram, tornando cada vez mais difícil obter dados humanos representativos.

Nossa abordagem é criar mundos digitais fotorrealistas que sintetizam dados complexos de imagem. Como geramos os dados, sabemos tudo sobre as cenas, incluindo informações nunca antes disponíveis sobre a localização 3D dos objetos e suas complexas interações entre si e com o ambiente. Adquirir e rotular essa quantidade de dados usando as abordagens atuais levaria meses, senão anos. Este novo paradigma permitirá uma melhoria de 100x em eficiência e custo e conduzirá uma nova classe de modelos mais capazes.

Como os dados sintéticos são gerados artificialmente, isso elimina muitos preconceitos e preocupações com a privacidade na coleta tradicional de conjuntos de dados do mundo real.

Como a geração de dados sob demanda permite escalabilidade acelerada?

Capturar e preparar dados do mundo real para treinamento de modelo é um processo longo e tedioso. A implantação do hardware necessário pode ser proibitivamente cara para sistemas de visão computacional complicados, como veículos autônomos, robótica ou imagens de satélite. Depois que os dados são capturados, os humanos rotulam e anotam os recursos essenciais. Esse processo está sujeito a erros e os humanos são limitados em sua capacidade de rotular informações importantes, como a posição 3D necessária para muitos aplicativos.

Os dados sintéticos são ordens de magnitude mais rápidas e baratas do que as abordagens tradicionais de dados reais anotados por humanos e virão para acelerar a implantação de modelos novos e mais capazes em todos os setores.

Como os dados sintéticos permitem uma redução ou prevenção do viés da IA?

Os sistemas de IA são onipresentes, mas podem conter vieses inerentes que podem afetar grupos de pessoas. Os conjuntos de dados podem ser desequilibrados com certas classes de dados e grupos de pessoas super ou sub-representados. A construção de sistemas centrados no ser humano geralmente pode levar a preconceitos de gênero, etnia e idade. Por outro lado, os dados de treinamento gerados pelo design são devidamente balanceados e não possuem vieses humanos.

Dados sintéticos podem se tornar uma solução robusta para resolver o problema de viés da IA. Os dados sintéticos são gerados parcial ou completamente artificialmente, em vez de medidos ou extraídos de eventos ou fenômenos do mundo real. Se o conjunto de dados não for diversificado ou grande o suficiente, os dados gerados pela IA podem preencher as lacunas e formar um conjunto de dados imparcial. A melhor parte? A criação manual desses conjuntos de dados pode levar vários meses ou anos para as equipes serem concluídas. Quando projetado com dados sintéticos, pode ser feito durante a noite.

Fora da visão computacional, quais são alguns outros possíveis casos de uso futuros para dados sintéticos?

Além da infinidade de casos de uso de visão computacional relacionados a produtos de consumo, autonomia, robótica, AR/VR/metaverso e muito mais, os dados sintéticos também impactarão outras modalidades de dados. Já estamos vendo empresas aproveitando abordagens de dados sintéticos para dados tabulares estruturados, voz e processamento de linguagem natural. As tecnologias subjacentes e os canais de geração diferem para cada modalidade e, num futuro próximo, esperamos ver sistemas multimodais (por exemplo, vídeo + voz).

Há mais alguma coisa que você gostaria de compartilhar sobre a Synthesis AI?

No final do ano passado, lançamos API Humana, uma expansão significativa dos recursos de dados sintéticos da Synthesis AI, permitindo a geração programática de milhões de seres humanos digitais 3D exclusivos e de alta qualidade. Este anúncio ocorre meses após o lançamento do produto sintético de dados como serviço FaceAPI, que forneceu mais de 10 milhões de imagens faciais rotuladas para as principais empresas de smartphones, teleconferências, automóveis e tecnologia. O HumanAPI é o próximo passo na jornada da empresa para oferecer suporte a aplicativos avançados de Inteligência Artificial (IA) de visão computacional.

O HumanAPI também permite uma infinidade de novas oportunidades para nossos clientes, incluindo assistentes inteligentes de IA, treinadores de condicionamento físico virtuais e, é claro, o mundo dos aplicativos metaversos.

Ao criar um duplo digital do mundo real, o metaverso permitirá novos aplicativos que vão desde redes sociais reimaginadas, experiências de entretenimento, teleconferência, jogos e muito mais. A IA de visão computacional será fundamental para como o mundo real é capturado e recriado com alta fidelidade no mundo digital. Humanos fotorrealistas, expressivos e com comportamento preciso serão um componente essencial do futuro dos aplicativos de visão computacional. O HumanAPI é o primeiro produto a permitir que as empresas criem grandes quantidades de dados de corpo inteiro perfeitamente rotulados sob demanda para construir modelos de IA mais capazes, incluindo estimativa de pose, reconhecimento de emoção, caracterização de atividade e comportamento, reconstrução facial e muito mais.

Obrigado pela ótima entrevista, os leitores que desejam saber mais devem visitar Síntese AI.

Sócio fundador da unite.AI e membro do Conselho de Tecnologia da Forbes, Antoine é um futurista que é apaixonado pelo futuro da IA ​​e da robótica.

Ele também é o fundador da Valores Mobiliários.io, um site que foca em investir em tecnologia disruptiva.