Entrevistas
Stas Tushinskiy, CEO & Co-Fundador de Instreamatic – Serie de Entrevistas

Stas Tushinskiy es el CEO y co-fundador de Instreamatic, una plataforma que ofrece soluciones de marketing de voz y audio impulsadas por IA para que las marcas puedan interactuar mejor con los consumidores.
Anteriormente, co-fundó Unisound, una agencia de publicidad de audio. ¿Cómo le llevó esta experiencia a conceptualizar el lanzamiento de una empresa de marketing de voz con IA?
Mi experiencia en Unisound fue fundamental para entender el panorama en constante evolución de la publicidad de audio digital. Estábamos a la vanguardia del reconocimiento de la creciente demanda y el potencial de los anuncios de audio en el espacio digital.
Un punto clave que saqué de mi tiempo allí fue la realización de que la personalización y la contextualización mejoran significativamente la eficacia de la publicidad, incluidos los anuncios de audio. Esta comprensión se convirtió en una piedra angular de la visión detrás de Instreamatic.
En Unisound, observamos una brecha en el mercado para soluciones de publicidad inteligentes y responsivas. Visualizamos el uso de la IA no solo para la segmentación, sino también para crear una experiencia más interactiva y atractiva. Esto llevó a la idea de una plataforma de marketing impulsada por la IA, que revolucionaría la forma en que interactuamos con los anuncios.
¿Podría compartir la historia de la génesis del lanzamiento de Instreamatic?
Originalmente, Instreamatic nació de una visión para transformar la forma en que los editores de audio monetizan su contenido. Inicialmente, nuestro enfoque estaba en servir anuncios de audio para la monetización, lo que sigue siendo una parte significativa de nuestras operaciones.
A medida que nos sumergimos más en la industria, identificamos una oportunidad sustancial en la IA para la optimización creativa. Esta realización fue fundamental para dar forma a nuestra dirección hacia la integración de la tecnología de la IA más profundamente en nuestros servicios.
La convergencia de nuestra experiencia en publicidad de audio y los avances en la tecnología de la IA fue el catalizador para Instreamatic. Vimos el potencial para no solo servir a los editores, sino también para mejorar la experiencia publicitaria general para los usuarios y anunciantes por igual, allanando el camino para un ecosistema publicitario más dinámico y eficiente.
¿Cuáles fueron algunas de las tecnologías iniciales de IA/ML que se utilizaron?
Comenzamos con un clasificador simple. Es un método de aprendizaje automático supervisado donde el modelo intenta predecir la etiqueta correcta de los datos de entrada dados. Luego, mejoramos nuestro clasificador utilizando incrustaciones. Finalmente, no nos limitamos solo a las tecnologías de NLP. Nuevas ideas y desafíos nos presentaron obstáculos frescos y, ahora, nuestro arsenal incluye síntesis de texto a voz y clonación de voz de disparo cero.
¿Cómo ha cambiado la IA generativa su pila de tecnología y cómo la despliega?
La IA generativa ha traído cambios significativos a nuestra pila de tecnología y estrategias de despliegue. Nuestra pila de tecnología actual incluye bibliotecas y marcos de aprendizaje automático avanzados que admiten modelos de IA generativa, particularmente para la síntesis de texto a voz y la clonación de voz de disparo cero. Utilizamos recursos de computación de alto rendimiento para entrenar estos modelos, ya que requieren una cantidad sustancial de poder computacional. Esto implica aprovechar hardware acelerado por GPU para manejar las demandas de procesamiento intensivo.
Para el despliegue, dependemos en gran medida de soluciones basadas en la nube. Esto nos ofrece la escalabilidad necesaria para gestionar las cargas de trabajo pesadas de las aplicaciones de IA generativa. Utilizamos tecnologías de contenerización como Docker y herramientas de orquestación como Kubernetes para gestionar y escalar nuestras aplicaciones de manera eficiente. Esta configuración garantiza que nuestros modelos de IA generativa puedan desplegarse rápidamente y escalarse según la demanda.
Nuestras tuberías de CI/CD están optimizadas para flujos de trabajo de aprendizaje automático. Utilizamos herramientas que nos permiten automatizar el entrenamiento y el despliegue de modelos, asegurando que siempre estén actualizados con los últimos datos y algoritmos. Esta automatización es crucial para mantener la eficacia de nuestras aplicaciones de IA generativa.
En cuanto al manejo de datos, hemos implementado tuberías de procesamiento de datos robustas. Estas tuberías están diseñadas para manejar grandes volúmenes de datos de manera eficiente, lo cual es esencial para el entrenamiento y la operación de los modelos de IA generativa. Aseguramos que los datos se procesen y almacenen de manera segura, siguiendo las mejores prácticas en seguridad y privacidad de datos.
En general, la integración de la IA generativa en nuestra pila de tecnología nos ha llevado a adoptar recursos de computación de alto rendimiento, infraestructuras basadas en la nube, contenerización para escalabilidad, tuberías de CI/CD automatizadas para el aprendizaje automático y mecanismos de procesamiento de datos seguros. Estos elementos técnicos son fundamentales para respaldar las capacidades avanzadas de nuestras aplicaciones de IA generativa.
Instreamatic se especializa en lo que usted llama publicidad de video y audio contextual—¿cómo define eso?
La publicidad contextual aprovecha los avances actuales en la IA generativa para alterar significativamente lo que es posible con los anuncios de video y audio. El resultado para los negocios es un aumento en la participación de la marca y el ROI. Los anuncios contextuales ofrecen una capacidad prácticamente ilimitada para generar y probar creativos de contenido nuevos relevantes para el contexto y el entorno específicos del oyente.
El hecho es que la industria publicitaria ha estado luchando contra tasas de participación en declive en todos los tipos de anuncios durante años. Eso probablemente no sorprenda a nadie, ya que los consumidores demuestran una mayor fatiga de pantalla y resistencia a la publicidad generalizada que confía en bombardear a las audiencias con cantidad de anuncios para lograr conversiones. Mientras que los anuncios que demuestran contenido original más específico y mayor relevancia para el consumidor obtienen una mayor participación, las inversiones de tiempo y costo necesarias para producir y gestionar manualmente copias de anuncios separadas para el contexto de cada consumidor individual son extremadamente prohibitivas.
Nuestros anuncios de audio, video y televisión conectada (CTV) contextuales están impulsados por la IA para revertir esta tendencia de baja participación, permitiendo a los anunciantes hacer que cada anuncio sea hiperrelevante y precisamente dirigido al consumidor que lo escucha. Considere un anuncio de audio tradicional de 30 segundos: un actor de voz contratado podría grabar solo unas pocas variaciones de la copia del anuncio, no suficientes para sorprender al oyente o captar necesariamente su atención. Los anuncios contextuales son capaces de mejorar ese contenido publicitario tradicional, utilizando la IA generativa para sintetizar la voz del mismo actor y generar automáticamente miles de variaciones de anuncios a lo largo de una campaña.
Los anuncios contextuales son especialmente útiles para revitalizar campañas publicitarias más largas (en el rango de 3-6 meses). Tradicionalmente, estas campañas son muy vulnerables a la fatiga creativa: las audiencias reciben el mismo creativo una y otra vez, lo que inevitablemente conduce a una disminución de la participación. Nuestra tecnología resuelve este desafío haciendo que sea simple refrescar creativos semanalmente. Para los minoristas con ofertas de productos actualizadas semanalmente, por ejemplo, nuestra generación automática de anuncios es ideal para mantener esas campañas actualizadas y frescas.
¿Qué tan realista es para las marcas esperar que la IA hiperpersonalice los anuncios?
Es completamente realista, como lo demuestra la publicidad contextual impulsada por la IA generativa. Los anuncios contextuales pueden presentar detalles hiperpersonalizados, incluyendo la ubicación del oyente, la hora del día, el nombre o tipo de aplicación o plataforma que están utilizando, y la actividad en la que están participando, ya sea escuchando un podcast, jugando un juego, etc. Los anuncios contextuales incluso pueden incluir variables como nombrar tiendas y direcciones locales, promociones en tienda, códigos de promoción (únicos para cada canal para permitir la medición del rendimiento), destinos de viaje con ofertas específicas, y mucho más. Estos anuncios también pueden nombrar la tienda local más cercana donde el oyente puede interactuar con la marca y canjear la oferta presentada en el anuncio. Esta misma capacidad de segmentación garantiza que las campañas publicitarias alcancen audiencias verificadas que son más receptivas a los productos y soluciones que se ofrecen. Todos estos anuncios se generan y entregan sin grabar nuevo contenido de voz o voz en off.
¿Puede discutir las ofertas centrales a las que tienen acceso sus clientes?
Desde la perspectiva de una marca, nuestra plataforma de anuncios contextuales toma una muestra de voz original y un guión, identifica el conjunto de parámetros únicos para cada oyente individual, y utiliza nuestras capacidades de IA de voz para producir y servir anuncios de audio, video o CTV alineados con esos detalles. Por ejemplo, un anuncio contextual generado para un usuario determinado podría comenzar: “Espero que esté disfrutando de su podcast en esta lluviosa mañana en Chicago, solo quería dejarle saber que el café es de compras uno y obtenga uno gratis en la cafetería de Jake todo el mes”. Mientras que producir ese mismo anuncio creativo con audio pregrabado y lógica de ramificación sería una tarea prácticamente imposible, la IA de voz detrás de los anuncios contextuales prepara este creativo a demanda, de manera automática y en tiempo real.
Desde la perspectiva de un editor, los anuncios contextuales de voz, video y CTV impulsados por la IA ofrecen una innovación innovadora que no requiere una integración compleja. Los anuncios contextuales funcionan con todas las plataformas de lado de la demanda (DSP) y servidores de anuncios que admiten etiquetas VAST, ofreciendo una escalabilidad instantánea. Los editores también pueden aprovechar nuestra red de anuncios para llegar a más de 6 mil millones de impresiones a nivel global sin costo de plataforma: los costos técnicos están incluidos en el gasto de medios al publicar dentro de la red.
¿Podría compartir algunos detalles sobre el proceso de lanzar un anuncio en la plataforma?
Lanzar un anuncio en nuestra plataforma literalmente lleva solo minutos. El usuario de la marca o agencia simplemente escribe la copia del anuncio con o sin la ayuda de la IA, luego elige una voz de libre uso de nuestra Biblioteca de Voces o clona su propio talento de voz. Los usuarios también pueden cargar cualquier activo adicional necesario (música de fondo, metraje de video, banners, etc.). El usuario finaliza el anuncio, y la plataforma proporciona versiones listas para servir, ya sea a través de la etiqueta VAST (el estándar de la industria para el tráfico de anuncios), o como archivos de medios descargables listos para ir en cualquier entorno digital y de radiodifusión.
Estos anuncios enriquecidos con IA no solo aumentan el rendimiento de las campañas de anuncios de video y audio al permitir la hiperpersonalización a escala, sino que también reducen el costo de producir campañas y reducen el tiempo de creación de anuncios de semanas a minutos. Para campañas con 50+ versiones, los usuarios experimentan una disminución de costo de ~10X. Nuestra tecnología ofrece beneficios similares para campañas de creativos únicos. La plataforma también es una excelente herramienta para que los equipos de ventas produzcan rápidamente bocetos de anuncios para sus clientes sin involucrar a los equipos de producción y creativos en una etapa temprana, ya que nuestra IA puede escribir la copia y producir anuncios personalizados por completo.
¿Cuál es su visión para el futuro de la publicidad y el marketing con IA?
Realmente veo un futuro donde los clientes no se molestan (o desconectan) los anuncios porque cada uno es ahora relevante y más interesante para ellos, y las marcas son mucho más capaces de llegar a las audiencias adecuadas en el momento adecuado con el mensaje contextual perfecto. Eso es obviamente un cambio radical desde donde se encuentra la industria ahora, pero creo que hacia allí nos dirigimos, y la IA, aprovechada estratégicamente, lo hace posible. Los anuncios contextuales también seguirán mejorando para captar la atención de los oyentes porque hablan precisamente a su contexto y sus necesidades, especialmente en un mundo de privacidad donde la segmentación del usuario se vuelve más difícil y más difícil, así que la segmentación contextual es el único mecanismo eficiente para mejorar el rendimiento de los anuncios. Nuestra IA de anuncios generativos avanzada puede crear creativos nuevos ilimitados para dirigirse a cada oyente como un individuo. El resultado es un aumento en la participación del oyente, un mayor ROI publicitario y conexiones de cliente más significativas para las marcas.
Gracias por la excelente entrevista, los lectores que deseen aprender más deben visitar Instreamatic.












