Entretiens
Stas Tushinskiy, PDG & Co-Fondateur d’Instreamatic – Série d’entretiens

Stas Tushinskiy est le PDG et co-fondateur de Instreamatic, une plateforme qui propose des solutions de marketing audio et vocalisées alimentées par l’IA pour permettre aux marques de mieux engager les consommateurs.
Vous avez précédemment co-fondé Unisound, une agence de publicité audio. Comment cette expérience vous a-t-elle conduit à conceptualiser le lancement d’une entreprise de marketing vocal utilisant l’IA?
Mon expérience chez Unisound a été fondamentale pour comprendre l’évolution du paysage de la publicité audio numérique. Nous étions à la pointe de la reconnaissance de la demande croissante et du potentiel des annonces audio dans l’espace numérique.
Un enseignement clé de mon séjour là-bas était la réalisation que la personnalisation et la contextualisation améliorent considérablement l’efficacité de la publicité, y compris les annonces audio. Cette compréhension est devenue un élément clé de la vision derrière Instreamatic.
Chez Unisound, nous avons observé un vide sur le marché pour des solutions publicitaires intelligentes et réactives. Nous avons imaginé utiliser l’IA non seulement pour la ciblage, mais également pour créer une expérience plus interactive et engageante. Cela a conduit à l’idée d’une plateforme marketing alimentée par l’IA, qui révolutionnerait la façon dont nous interagissons avec les publicités.
Pouvez-vous partager l’histoire de la création d’Instreamatic?
À l’origine, Instreamatic est née d’une vision pour transformer la façon dont les éditeurs audio monétisent leur contenu. Initialement, notre focus était sur le service d’annonces audio pour la monétisation, qui reste une partie importante de nos opérations.
Au fur et à mesure que nous nous sommes immergés plus profondément dans l’industrie, nous avons identifié une opportunité significative dans l’IA pour l’optimisation créative. Cette réalisation a été cruciale pour façonner notre direction vers une intégration plus approfondie de la technologie IA dans nos services.
La convergence de notre expertise en publicité audio et des progrès de la technologie IA a été le catalyseur d’Instreamatic. Nous avons vu le potentiel pour ne pas seulement servir les éditeurs, mais également pour améliorer l’expérience publicitaire globale pour les utilisateurs et les annonceurs, ouvrant la voie à un écosystème publicitaire plus dynamique et efficient.
Quelles étaient certaines des premières technologies d’IA/ML utilisées?
Nous avons commencé avec un simple classificateur. Il s’agit d’une méthode d’apprentissage automatique supervisée où le modèle tente de prédire l’étiquette correcte des données d’entrée données. Ensuite, nous avons amélioré notre classificateur en utilisant des embeddings. Finalement, nous ne nous sommes pas limités aux seules technologies NLP. De nouvelles idées et défis nous ont présenté de nouveaux obstacles et, maintenant, notre arsenal comprend la synthèse de la parole à partir du texte et le clonage vocal à zéro coup.
Comment l’IA générative a-t-elle modifié votre pile technologique et comment la déployez-vous?
L’IA générative a apporté des changements importants à la fois à notre pile technologique et à nos stratégies de déploiement. Notre pile technologique actuelle comprend des bibliothèques et des cadres d’apprentissage automatique avancés qui prennent en charge les modèles d’IA générative, en particulier pour la synthèse de la parole à partir du texte et le clonage vocal à zéro coup. Nous utilisons des ressources de calcul haute performance pour former ces modèles, car ils nécessitent une puissance de calcul considérable. Cela implique l’utilisation de matériel accéléré par GPU pour gérer les exigences de traitement intensif.
Pour le déploiement, nous nous appuyons fortement sur des solutions basées sur le cloud. Cela nous offre la scalabilité nécessaire pour gérer les charges de travail lourdes des applications d’IA générative. Nous utilisons des technologies de conteneurisation comme Docker et des outils d’orchestration comme Kubernetes pour gérer et mettre à l’échelle nos applications de manière efficace. Cette configuration garantit que nos modèles d’IA générative peuvent être déployés rapidement et mis à l’échelle en fonction de la demande.
Nos pipelines CI/CD sont optimisés pour les flux de travail d’apprentissage automatique. Nous utilisons des outils qui nous permettent d’automatiser la formation et le déploiement de modèles, en veillant à ce qu’ils soient toujours mis à jour avec les dernières données et algorithmes. Cette automatisation est cruciale pour maintenir l’efficacité de nos applications d’IA générative.
En termes de gestion des données, nous avons mis en place des pipelines de traitement de données robustes. Ces pipelines sont conçus pour gérer efficacement de grands volumes de données, ce qui est essentiel pour former et exploiter des modèles d’IA générative. Nous nous assurons que les données sont traitées et stockées de manière sécurisée, en respectant les meilleures pratiques en matière de sécurité et de confidentialité des données.
Dans l’ensemble, l’intégration de l’IA générative dans notre pile technologique nous a conduit à adopter des ressources de calcul haute performance, des infrastructures basées sur le cloud, une conteneurisation pour la scalabilité, des pipelines CI/CD automatisés pour l’apprentissage automatique et des mécanismes de traitement de données sécurisés. Ces éléments techniques sont fondamentaux pour soutenir les capacités avancées de nos applications d’IA générative.
Instreamatic se spécialise dans ce que vous appelez la publicité contextuelle audio et vidéo—comment la définissez-vous?
La publicité contextuelle tire parti des avancées actuelles de l’IA générative pour modifier considérablement ce qui est possible avec les annonces audio et vidéo. Le résultat pour les entreprises est une augmentation de l’engagement de la marque et du ROI. Les annonces contextuelles offrent une capacité pratiquement illimitée à générer et tester de nouvelles créations publicitaires en fonction du contexte et de l’environnement spécifiques de l’auditeur.
Le fait est que l’industrie de la publicité est confrontée à des taux d’engagement en baisse pour tous les types d’annonces depuis des années. Ce n’est probablement pas une surprise pour qui que ce soit, car les consommateurs montrent une fatigue accrue à l’écran et une résistance à la publicité généralisée qui repose sur le bombardement des audiences avec une quantité d’annonces pour obtenir des conversions. Alors que les annonces qui présentent un contenu original plus spécifique et plus pertinent pour le consommateur obtiennent un engagement plus élevé, les investissements de temps et de coûts nécessaires pour produire et gérer manuellement des copies d’annonces distinctes pour chaque contexte individuel du consommateur sont extrêmement prohibitifs.
Nos annonces audio, vidéo et CTV contextuelles sont alimentées par l’IA pour inverser cette tendance de faible engagement en permettant aux annonceurs de rendre chaque annonce hyper-pertinente et ciblée avec précision pour le consommateur qui l’entend. Considérez une annonce audio traditionnelle de 30 secondes : un acteur de voix peut enregistrer quelques variations de copie d’annonce au maximum, ce qui n’est pas suffisant pour surprendre l’auditeur ou pour capturer nécessairement son attention. Les annonces contextuelles sont capables d’améliorer ce contenu d’annonce traditionnel en utilisant l’IA générative pour synthétiser la voix du même acteur et générer automatiquement des milliers de variations d’annonces sur une campagne.
Les annonces contextuelles sont particulièrement utiles pour revitaliser les campagnes publicitaires plus longues (dans la plage de 3 à 6 mois). Traditionnellement, ces campagnes sont très vulnérables à la fatigue créative : les audiences reçoivent la même création plusieurs fois, ce qui conduit inévitablement à un engagement diminué. Notre technologie résout ce défi en rendant simple le rafraîchissement des créations hebdomadaires. Par exemple, pour les détaillants avec des offres de produits mises à jour hebdomadairement, notre génération automatique d’annonces est idéale pour garder ces campagnes à jour et fraîches.
Combien est-il réaliste pour les marques de s’attendre à ce que l’IA personnalise fortement les annonces?
C’est maintenant tout à fait réaliste, comme le démontre la publicité contextuelle alimentée par l’IA générative. Les annonces contextuelles peuvent présenter des détails hyper-personnalisés, notamment l’emplacement de l’auditeur, l’heure de la journée, le nom ou le type d’application ou de plateforme qu’il utilise, et l’activité dans laquelle il est engagé, que ce soit l’écoute d’un podcast, le jeu, etc. Les annonces contextuelles peuvent même inclure des variables telles que la nomination de magasins locaux et d’adresses, de promotions en magasin locales, de codes de promotion (uniques à chaque canal pour permettre la mesure des performances), de destinations de voyage avec des offres spécifiques, et bien plus encore. Ces annonces peuvent également nommer le magasin local le plus proche où un auditeur peut interagir avec la marque et réclamer l’offre proposée dans l’annonce. Cette même capacité de ciblage garantit que les campagnes publicitaires atteignent des audiences éprouvées qui sont les plus réceptives aux produits et solutions proposés. Ces annonces sont toutes générées et diffusées sans enregistrer de nouveaux contenus vocaux ou de voix.
Pouvez-vous discuter des offres de base auxquelles vos clients ont accès?
Du point de vue d’une marque, notre plateforme d’annonces contextuelles prend un échantillon de voix original et un script, identifie l’ensemble de paramètres uniques pour chaque auditeur individuel, et utilise nos capacités d’IA vocale pour produire et diffuser en toute transparence des annonces audio, vidéo ou CTV alignées sur ces spécificités. Par exemple, une annonce contextuelle générée pour un utilisateur particulier pourrait commencer par : « J’espère que vous appréciez votre podcast ce matin pluvieux à Chicago, je voulais juste vous faire savoir que le café est à deux pour le prix d’un au café de Jake tout le mois ». Alors que produire la même créative publicitaire avec un audio préenregistré et une logique de branchement serait une tâche presque impossible, l’IA vocale derrière les annonces contextuelles prépare cette créative à la demande—automatiquement et en temps réel.
Du point de vue d’un éditeur, les annonces contextuelles audio, vidéo et CTV alimentées par l’IA offrent une innovation révolutionnaire sans intégration complexe requise. Les annonces contextuelles fonctionnent avec tous les DSP et serveurs de publicité prenant en charge les balises VAST, offrant une scalabilité instantanée. Les éditeurs peuvent également utiliser notre réseau d’annonces pour atteindre plus de 6 milliards d’impressions dans le monde entier sans frais de plateforme : les coûts techniques sont inclus dans les dépenses de média lors de la publication dans le réseau.
Pouvez-vous partager certains détails sur le processus de lancement d’une annonce sur la plateforme?
Lancer une annonce sur notre plateforme prend littéralement quelques minutes. L’utilisateur de la marque ou de l’agence écrit simplement la copie d’annonce avec ou sans l’aide de l’IA, puis choisit soit une voix libre de droits de notre bibliothèque de voix, soit clone sa propre voix talentueuse. Les utilisateurs peuvent également télécharger tout élément supplémentaire nécessaire (musique de fond, séquences vidéo, bannières, etc.). L’utilisateur finalise l’annonce, et la plateforme fournit des versions prêtes à être diffusées—soit via la balise VAST (la norme de l’industrie pour le routage des annonces), soit sous forme de fichiers média téléchargeables prêts à être utilisés dans tout environnement numérique et de diffusion.
Ces annonces enrichies par l’IA ne font pas seulement augmenter les performances des campagnes publicitaires audio et vidéo en permettant une personnalisation à grande échelle, mais réduisent également le coût de production des campagnes et réduisent le temps de création des annonces de semaines à minutes. Pour les campagnes avec 50+ versions, les utilisateurs bénéficient d’une diminution de coûts d’environ 10 fois. Notre technologie offre des avantages similaires pour les campagnes à création unique. La plateforme est également un excellent outil pour les équipes de vente pour produire rapidement des maquettes d’annonces pour leurs clients sans impliquer les équipes de production et de création à un stade précoce, puisque notre IA peut écrire la copie et produire entièrement des annonces personnalisées.
Quelle est votre vision pour l’avenir de la publicité et du marketing basés sur l’IA?
Je vois vraiment un avenir où les clients ne sont pas ennuyés (ou qui zappent) les annonces parce que chacune est maintenant pertinente et plus intéressante pour eux, et les marques sont encore plus capables d’atteindre les bonnes audiences au bon moment avec le message contextuel parfait. C’est évidemment un changement radical par rapport à l’état actuel de l’industrie, mais je crois que c’est là que nous allons—et l’IA, utilisée de manière stratégique, le rend possible. Les annonces contextuelles vont également continuer à améliorer leur capacité à captiver l’attention des auditeurs parce qu’elles parlent précisément à leur contexte et à leurs besoins, en particulier dans un monde où la confidentialité est la priorité et où le ciblage des utilisateurs devient de plus en plus difficile—le ciblage contextuel est donc le seul mécanisme efficace pour améliorer les performances des annonces. Notre IA publicitaire générative avancée peut créer de nouvelles créations illimitées pour s’adresser à chaque auditeur en tant qu’individu. Le résultat est une augmentation de l’engagement de l’auditeur, un ROI publicitaire plus élevé et des connexions client plus significatives pour les marques.
Merci pour cette excellente interview, les lecteurs qui souhaitent en savoir plus peuvent visiter Instreamatic.












