Entrevistas
Stas Tushinskiy, CEO & Co-Founder of Instreamatic – Série de Entrevistas

Stas Tushinskiy é o CEO e co-fundador da Instreamatic, uma plataforma que oferece soluções de marketing de voz e áudio impulsionadas por IA para permitir que as marcas se engajem melhor com os consumidores.
Você co-fundou anteriormente a Unisound, uma agência de anúncios de áudio. Como essa experiência o levou a conceber o lançamento de uma empresa de marketing de voz com IA?
Minha experiência na Unisound foi fundamental para entender a paisagem em evolução da publicidade de áudio digital. Estávamos à frente do reconhecimento da crescente demanda e do potencial para anúncios de áudio em um espaço digital.
Uma lição importante do meu tempo lá foi a realização de que a personalização e a contextualização aumentam significativamente a eficácia da publicidade, incluindo anúncios de áudio. Essa compreensão se tornou uma pedra angular para a visão por trás da Instreamatic.
Na Unisound, observamos uma lacuna no mercado para soluções de publicidade inteligentes e responsivas. Visualizamos o uso de IA não apenas para direcionamento, mas também para criar uma experiência mais interativa e envolvente. Isso levou à ideia de uma plataforma de marketing impulsionada por IA, que revolucionaria a forma como interagimos com anúncios.
Pode compartilhar a história de como lançou a Instreamatic?
Originalmente, a Instreamatic nasceu de uma visão para transformar a forma como os editores de áudio monetizam seu conteúdo. Inicialmente, nosso foco estava em servir anúncios de áudio para monetização, o que ainda é uma parte significativa de nossas operações.
À medida que nos aprofundamos mais na indústria, identificamos uma oportunidade substancial em IA para otimização criativa. Essa realização foi fundamental para moldar nossa direção em direção à integração de tecnologia de IA mais profundamente em nossos serviços.
A convergência de nossa especialização em publicidade de áudio e os avanços na tecnologia de IA foi o catalisador para a Instreamatic. Vimos o potencial para não apenas servir editores, mas também para melhorar a experiência geral de anúncios para usuários e anunciantes, pavimentando o caminho para um ecossistema de publicidade mais dinâmico e eficiente.
Quais foram algumas das tecnologias iniciais de IA/ML utilizadas?
Começamos com um classificador simples. É um método de aprendizado de máquina supervisionado onde o modelo tenta prever o rótulo correto dos dados de entrada fornecidos. Em seguida, aprimoramos nosso classificador usando embeddings. Eventualmente, não nos limitamos apenas às tecnologias de NLP. Novas ideias e desafios nos apresentaram novos obstáculos e, agora, nosso arsenal inclui síntese de texto-para-voz e clonagem de voz zero-shot.
Como a IA gerativa mudou sua pilha de tecnologia e como você a implanta?
A IA gerativa trouxe mudanças significativas para nossa pilha de tecnologia e estratégias de implantação. Nossa pilha de tecnologia atual inclui bibliotecas e frameworks de aprendizado de máquina avançados que suportam modelos de IA gerativa, particularmente para síntese de texto-para-voz e clonagem de voz zero-shot. Utilizamos recursos de computação de alto desempenho para treinar esses modelos, pois eles exigem poder computacional substancial. Isso envolve aproveitar hardware acelerado por GPU para lidar com as demandas de processamento intensivo.
Para implantação, confiamos fortemente em soluções baseadas em nuvem. Isso nos oferece a escalabilidade necessária para gerenciar as cargas de trabalho pesadas de aplicações de IA gerativa. Utilizamos tecnologias de contêinerização, como Docker, e ferramentas de orquestração, como Kubernetes, para gerenciar e dimensionar nossas aplicações de forma eficiente. Essa configuração garante que nossos modelos de IA gerativa possam ser implantados rapidamente e dimensionados de acordo com a demanda.
Nossos pipelines de CI/CD são otimizados para fluxos de trabalho de aprendizado de máquina. Utilizamos ferramentas que nos permitem automatizar o treinamento e a implantação de modelos, garantindo que eles estejam sempre atualizados com os dados e algoritmos mais recentes. Essa automação é crucial para manter a eficácia de nossas aplicações de IA gerativa.
Em termos de manipulação de dados, implementamos pipelines de processamento de dados robustos. Esses pipelines são projetados para lidar com grandes volumes de dados de forma eficiente, o que é essencial para treinar e operar modelos de IA gerativa. Garantimos que os dados sejam processados e armazenados de forma segura, seguindo as melhores práticas de segurança e privacidade de dados.
No geral, a integração de IA gerativa em nossa pilha de tecnologia nos levou a adotar recursos de computação de alto desempenho, infraestruturas baseadas em nuvem, contêinerização para escalabilidade, pipelines de CI/CD automatizados para aprendizado de máquina e mecanismos de processamento de dados seguros. Esses elementos técnicos são fundamentais para apoiar as capacidades avançadas de nossas aplicações de IA gerativa.
A Instreamatic se especializa no que você chama de publicidade de vídeo e áudio contextual—como você define isso?
A Publicidade Contextual aproveita os avanços atuais dentro da IA gerativa para alterar significativamente o que é possível com anúncios de vídeo e áudio. O resultado para os negócios é um aumento na engajamento da marca e no ROI. Os Anúncios Contextuais oferecem uma capacidade essencialmente ilimitada para gerar e testar continuamente novo conteúdo criativo relevante para o contexto e ambiente específicos do ouvinte.
O fato é que a indústria de publicidade tem enfrentado taxas de engajamento em declínio em todos os tipos de anúncios por anos. Isso provavelmente não é surpreendente para ninguém, pois os consumidores demonstram fadiga de tela aumentada e resistência a publicidade generalizada que confia em bombardear as audiências com quantidade de anúncios para ganhar conversões. Enquanto anúncios que demonstram conteúdo original mais específico e maior relevância para o consumidor ganham maior engajamento, os investimentos de tempo e custo necessários para produzir e gerenciar cópias de anúncios separadas para o contexto de cada consumidor individual são extremamente proibitivos.
Nossos anúncios de áudio, vídeo e CTV contextuais são impulsionados por IA para combater a tendência de baixo engajamento, permitindo que os anunciantes tornem cada anúncio hiper-relevante e precisamente direcionado ao consumidor que o ouve. Considere um spot de anúncio de áudio tradicional de 30 segundos: um ator de voz contratado pode gravar apenas algumas variações de cópia de anúncio, não o suficiente para surpreender o ouvinte ou necessariamente capturar sua atenção. Os Anúncios Contextuais são capazes de aprimorar esse conteúdo de anúncio tradicional, usando IA gerativa para sintetizar a voz do mesmo ator e gerar automaticamente milhares de variações de anúncios em uma campanha.
Os Anúncios Contextuais são especialmente úteis para revitalizar campanhas de anúncios mais longas (na faixa de 3-6 meses). Tradicionalmente, essas campanhas são muito vulneráveis à fadiga criativa: as audiências recebem o mesmo criativo repetidamente, inevitavelmente levando a uma diminuição do engajamento. Nossa tecnologia resolve esse desafio, tornando fácil refrescar criativos semanalmente. Para varejistas com ofertas de produtos atualizadas semanalmente, por exemplo, nossa geração automática de anúncios é ideal para manter essas campanhas atualizadas e frescas.
Quão realista é para as marcas esperar que a IA hiper-personalize anúncios?
Agora é plenamente realista, como demonstrado pela publicidade contextual impulsionada por IA gerativa. Os Anúncios Contextuais podem apresentar detalhes hiper-personalizados, incluindo a localização do ouvinte, a hora do dia, o nome ou tipo de aplicativo ou plataforma que ele está usando e a atividade que ele está realizando, seja ouvindo um podcast, jogando um jogo, etc. Os Anúncios Contextuais também podem incluir variáveis como nomes de lojas físicas e endereços, promoções em lojas físicas, códigos de promoção (únicos para cada canal para permitir a medição de desempenho), destinos de viagem com ofertas específicas e muito mais. Esses anúncios também podem nomear a loja física mais próxima onde o ouvinte pode interagir com a marca e resgatar a oferta apresentada no anúncio. Essa mesma capacidade de direcionamento garante que as campanhas publicitárias atinjam audiências validadas que são mais receptivas aos produtos e soluções sendo oferecidos. Esses anúncios são todos gerados e entregues sem gravar novo áudio ou conteúdo de voz.
Pode discutir as ofertas principais que seus clientes têm acesso?
Do ponto de vista da marca, nossa plataforma de Anúncios Contextuais pega uma amostra de voz original e um roteiro, identifica o conjunto de parâmetros únicos para cada ouvinte individual e usa nossas capacidades de IA de voz para produzir e servir anúncios de áudio, vídeo ou CTV alinhados com esses detalhes. Por exemplo, um Anúncio Contextual gerado para um usuário específico pode começar: “Espero que você esteja desfrutando de seu podcast nesta manhã chuvosa em Chicago, eu só queria deixar você saber que o café é comprado um e levado um de graça no Jake’s Coffeeshop todo o mês.” Enquanto produzir esse mesmo anúncio criativo com áudio pré-gravado e lógica de ramificação seria uma tarefa quase impossível, a IA de voz por trás dos Anúncios Contextuais prepara essa criatividade sob demanda — automaticamente e em tempo real.
Do ponto de vista do editor, os anúncios de voz, vídeo e CTV contextuais impulsionados por IA oferecem uma inovação que muda o jogo, sem necessidade de integração complexa. Os Anúncios Contextuais funcionam com todas as plataformas de lado da demanda (DSPs) e servidores de anúncios que suportam tags VAST, oferecendo escalabilidade instantânea. Os editores também podem aproveitar nossa rede de anúncios para alcançar mais de 6 bilhões de impressões globalmente sem custo de plataforma: os custos técnicos são incluídos no gasto de mídia ao publicar dentro da rede.
Pode compartilhar alguns detalhes sobre o processo de lançar um anúncio na plataforma?
Lançar um anúncio em nossa plataforma leva literalmente apenas minutos. O usuário da marca ou agência simplesmente escreve a cópia do anúncio com ou sem ajuda da IA, então escolhe uma voz royalty-free de nossa Biblioteca de Vozes ou clona seu próprio talento de voz. Os usuários também podem fazer upload de quaisquer ativos adicionais necessários (música de fundo, footage de vídeo, banners, etc.). O usuário finaliza o anúncio, e a plataforma fornece versões prontas para serem servidas — seja via tag VAST (o padrão da indústria para tráfego de anúncios), ou como arquivos de mídia baixáveis prontos para ir para qualquer ambiente digital e de transmissão.
Esses anúncios enriquecidos com IA não apenas aumentam o desempenho de campanhas de anúncios de vídeo e áudio, permitindo a hiper-personalização em escala, mas também reduzem o custo de produzir campanhas e diminuem o tempo de criação de anúncios de semanas para minutos. Para campanhas com 50+ variações, os usuários experimentam uma diminuição de custo de ~10X. Nossa tecnologia oferece benefícios semelhantemente decisivos para campanhas de criativo único. A plataforma também é um grande instrumento para equipes de vendas produzirem rapidamente mock-ups de anúncios para seus clientes sem envolver equipes de produção e criativas em uma fase inicial, desde que nossa IA possa escrever cópia e produzir anúncios personalizados.
Qual é sua visão para o futuro da publicidade e marketing com IA?
Eu realmente vejo um futuro onde os clientes não se irritam (ou desligam) os anúncios porque cada um agora é relevante e mais interessante para eles, com marcas que são capazes de alcançar os públicos certos nos momentos certos com a mensagem contextual perfeita. Isso é claramente uma mudança no mar desde onde a indústria está agora, mas acredito que é para onde estamos indo — e a IA, utilizada estrategicamente, está tornando isso possível. Os Anúncios Contextuais também continuarão a melhorar na captura da atenção dos ouvintes porque falam precisamente ao seu contexto e às suas necessidades, especialmente em um mundo que prioriza a privacidade, onde o direcionamento de usuário se torna cada vez mais difícil — então o direcionamento contextual é o único mecanismo eficiente para aumentar o desempenho dos anúncios. Nossa IA de anúncio gerativa avançada pode criar novos criativos ilimitados para abordar cada ouvinte como um indivíduo. O resultado é um aumento no engajamento do ouvinte, um maior ROI de anúncio e conexões de cliente mais significativas para as marcas.
Obrigado pela grande entrevista, leitores que desejam aprender mais devem visitar Instreamatic.












