Connect with us

Stas Tushinskiy, CEO & Co-Founder von Instreamatic – Interview-Serie

Interviews

Stas Tushinskiy, CEO & Co-Founder von Instreamatic – Interview-Serie

mm

Stas Tushinskiy ist der CEO und Co-Founder von Instreamatic, einer Plattform, die AI-gestützte Voice- und Audio-Marketinglösungen anbietet, um es Marken zu ermöglichen, besser mit Verbrauchern zu interagieren.

Sie haben zuvor Unisound co-gegründet, eine Audio-Werbeagentur. Wie hat diese Erfahrung Sie dazu geführt, das Konzept einer AI-Stimmen-Marketingfirma zu entwickeln?

Meine Erfahrung bei Unisound war grundlegend für das Verständnis der sich entwickelnden Landschaft der digitalen Audio-Werbung. Wir waren an der Spitze der Erkenntnis, dass die Nachfrage und das Potenzial für Audio-Anzeigen in einem digitalen Raum wuchsen.

Ein wichtiger Takeaway aus meiner Zeit dort war die Erkenntnis, dass Personalisierung und Kontextualisierung die Effektivität der Werbung, einschließlich Audio-Anzeigen, erheblich verbessern. Dieses Verständnis wurde zu einem Eckpfeiler für die Vision hinter Instreamatic.

Bei Unisound haben wir eine Lücke im Markt für intelligente, responsive Werbelösungen beobachtet. Wir haben uns vorgestellt, AI nicht nur für Targeting, sondern auch für die Schaffung einer interaktiveren und ansprechenderen Erfahrung zu nutzen. Dies führte zur Idee einer AI-getriebenen Marketingplattform, die die Art und Weise, wie wir mit Anzeigen interagieren, revolutionieren würde.

Können Sie die Genesis-Geschichte des Launches von Instreamatic teilen?

Ursprünglich wurde Instreamatic aus einer Vision geboren, die Art und Weise zu transformieren, wie Audio-Verleger ihren Inhalt monatisieren. Anfangs lag unser Fokus auf der Auslieferung von Audio-Anzeigen für die Monetisierung, was immer noch ein wesentlicher Teil unserer Operationen ist.

Als wir tiefer in die Branche eintauchten, identifizierten wir eine erhebliche Gelegenheit in AI für die kreative Optimierung. Diese Erkenntnis war entscheidend für die Ausrichtung unserer Richtung auf die Integration von AI-Technologie in unsere Dienstleistungen.

Die Konvergenz unserer Expertise in Audio-Werbung und der Fortschritte in der AI-Technologie war der Katalysator für Instreamatic. Wir sahen das Potenzial, nicht nur Verlegern zu dienen, sondern auch die gesamte Werbeerfahrung für Nutzer und Werbetreibende zu verbessern und den Weg für ein dynamischeres und effizienteres Werbesystem zu ebnen.

Welche waren einige der anfänglichen AI/ML-Technologien, die verwendet wurden?

Wir begannen mit einem einfachen Klassifizierer. Es handelt sich um eine überwachte maschinelle Lernmethode, bei der das Modell versucht, die korrekte Bezeichnung der gegebenen Eingabedaten vorherzusagen. Dann verbesserten wir unseren Klassifizierer, indem wir Embeddings verwendeten. Schließlich beschränkten wir uns nicht nur auf NLP-Technologien. Neue Ideen und Herausforderungen stellten uns vor frische Hindernisse, und jetzt umfasst unser Arsenal auch Text-to-Speech-Synthese und Zero-Shot-Stimmen-Kloning.

Wie hat generative AI Ihre Technologie-Stack und wie setzen Sie es ein?

Generative AI hat erhebliche Änderungen an unserem Technologie-Stack und unseren Bereitstellungsstrategien gebracht. Unser aktueller Technologie-Stack umfasst fortschrittliche maschinelle Lernbibliotheken und -Frameworks, die generative AI-Modelle unterstützen, insbesondere für Text-to-Speech-Synthese und Zero-Shot-Stimmen-Kloning. Wir nutzen Hochleistungsrechenressourcen, um diese Modelle zu trainieren, da sie erhebliche Rechenleistung erfordern. Dies beinhaltet die Nutzung von GPU-beschleunigter Hardware, um die intensiven Verarbeitungsanforderungen zu bewältigen.

Für die Bereitstellung verlassen wir uns stark auf cloud-basierte Lösungen. Dies bietet uns die Skalierbarkeit, die wir benötigen, um die hohen Arbeitslasten von generativen AI-Anwendungen zu bewältigen. Wir verwenden Container-Technologien wie Docker und Orchestrierungstools wie Kubernetes, um unsere Anwendungen effizient zu verwalten und zu skalieren. Diese Einrichtung stellt sicher, dass unsere generativen AI-Modelle schnell bereitgestellt und skaliert werden können, um die Nachfrage zu decken.

Unsere CI/CD-Pipelines sind für maschinelle Lern-Workflows optimiert. Wir verwenden Tools, die es uns ermöglichen, das Training und die Bereitstellung von Modellen zu automatisieren, um sicherzustellen, dass sie immer mit den neuesten Daten und Algorithmen aktualisiert sind. Diese Automatisierung ist entscheidend für die Aufrechterhaltung der Effektivität unserer generativen AI-Anwendungen.

In Bezug auf die Datenverarbeitung haben wir robuste Datenverarbeitungspipelines implementiert. Diese Pipelines sind darauf ausgelegt, große Datenmengen effizient zu verarbeiten, was für das Training und Betreiben von generativen AI-Modellen unerlässlich ist. Wir stellen sicher, dass Daten sicher verarbeitet und gespeichert werden, indem wir die besten Praktiken für Datensicherheit und -privatsphäre einhalten.

Insgesamt hat die Integration von generativen AI in unseren Technologie-Stack dazu geführt, dass wir Hochleistungsrechenressourcen, cloud-basierte Infrastrukturen, Containerisierung für Skalierbarkeit, automatisierte CI/CD-Pipelines für maschinelles Lernen und sichere Datenverarbeitungsmechanismen adoptiert haben. Diese technischen Elemente sind fundamental für die Unterstützung der erweiterten Fähigkeiten unserer generativen AI-Anwendungen.

Instreamatic spezialisiert sich auf das, was Sie kontextuelle Video- und Audio-Werbung nennen – können Sie das definieren?

Kontextuelle Werbung nutzt die aktuellen Fortschritte im Bereich generativer AI, um das zu ändern, was mit Video- und Audio-Anzeigen möglich ist. Das Ergebnis für Unternehmen ist eine erhöhte Markenbindung und ROI. Kontextuelle Anzeigen bieten eine im Wesentlichen unbegrenzte Fähigkeit, kontinuierlich neue kreative Inhalte zu generieren und A/B-Tests durchzuführen, die für den Hörer relevant sind.

Die Tatsache ist, dass die Werbeindustrie jahrelang mit sinkenden Engagement-Raten bei allen Arten von Anzeigen konfrontiert war. Das ist wahrscheinlich keine Überraschung für niemanden, da Verbraucher zunehmend unter Bildschirmmüdigkeit leiden und Widerstand gegen generalisierte Werbung leisten, die auf die Bombardierung von Zielgruppen mit Anzeigenquantität setzt, um Konversionen zu erzielen. Während Anzeigen, die spezifischen Original-Inhalt und höhere Relevanz für den Verbraucher bieten, höhere Engagement-Raten erzielen, sind die Zeit- und Kosteninvestitionen, die erforderlich sind, um separate Anzeigeninhalte für jeden individuellen Kontext des Verbrauchers manuell zu produzieren und zu verwalten, extrem prohibitiv.

Unsere kontextuellen Audio-, Video- und Connected-TV-Anzeigen (CTV) sind durch AI angetrieben, um diesen Trend der geringen Engagement-Raten zu durchbrechen, indem sie es Werbetreibenden ermöglichen, jede Anzeige hyper-relevant und genau auf den Hörer zuzuschneiden. Betrachten Sie eine traditionelle 30-Sekunden-Audio-Anzeige: Ein engagierter Sprecher könnte höchstens einige Anzeigen-Variationen aufnehmen, nicht genug, um den Hörer besonders zu überraschen oder seine Aufmerksamkeit zu erregen. Kontextuelle Anzeigen sind in der Lage, diesen traditionellen Anzeigen-Inhalt zu verbessern, indem sie generative AI verwenden, um die Stimme des Sprechers zu synthetisieren und automatisch Tausende von Anzeigen-Variationen über eine Kampagne zu generieren.

Kontextuelle Anzeigen sind besonders nützlich für die Wiederbelebung längerer Anzeigen-Kampagnen (im Bereich von 3-6 Monaten). Traditionell sind diese Kampagnen sehr anfällig für kreative Ermüdung: Zielgruppen bekommen das gleiche kreative Material immer wieder, was unweigerlich zu sinkendem Engagement führt. Unsere Technologie löst diese Herausforderung, indem sie es einfach macht, kreative Inhalte wöchentlich aufzufrischen. Für Einzelhändler mit wöchentlich aktualisierten Produktangeboten ist unsere automatische Anzeigen-Generierung beispielsweise ideal, um diese Kampagnen aktuell und frisch zu halten.

Wie realistisch ist es für Marken, von AI zu erwarten, Anzeigen zu hyper-personalisieren?

Es ist jetzt vollkommen realistisch, wie durch generative-AI-gestützte kontextuelle Werbung demonstriert. Kontextuelle Anzeigen können hyper-personalisierte Details enthalten, einschließlich des Standorts des Hörers, der Tageszeit, des Namens oder der Art der App oder Plattform, die er verwendet, und der Aktivität, die er ausführt, sei es das Hören eines Podcasts, das Spielen eines Spiels usw. Kontextuelle Anzeigen können sogar Variablen wie die Nennung lokaler Geschäfte und Adressen, lokale In-Store-Promotionen, Promo-Codes (einzigartig für jeden Kanal, um Leistungsmessung zu ermöglichen), Reiseziele mit spezifischen Angeboten und vieles mehr enthalten. Diese Anzeigen können auch die nächstgelegene lokale Filiale nennen, in der der Hörer mit der Marke interagieren und das in der Anzeige angebotene Angebot einlösen kann. Diese gleiche Zielgruppenansprache stellt sicher, dass Anzeigen-Kampagnen Zielgruppen erreichen, die am meisten für die angebotenen Produkte und Lösungen empfänglich sind. Diese Anzeigen werden alle generiert und ausgeliefert, ohne dass neue Voice- oder Voice-Over-Inhalte aufgenommen werden müssen.

Können Sie die Kernangebote erläutern, auf die Ihre Kunden zugreifen können?

Aus der Sicht einer Marke bietet unsere Plattform für kontextuelle Anzeigen eine einzelne Original-Stimme und ein Skript, identifiziert den Satz von Parametern, die für jeden einzelnen Hörer einzigartig sind, und verwendet unsere Voice-AI-Fähigkeiten, um nahtlos Audio-, Video- oder CTV-Anzeigen zu produzieren und auszuliefern, die mit diesen Spezifika übereinstimmen. Zum Beispiel könnte eine kontextuelle Anzeige, die für einen bestimmten Benutzer generiert wird, beginnen: “Ich hoffe, Sie genießen Ihr Podcast am regnerischen Morgen in Chicago, ich wollte Ihnen nur schnell mitteilen, dass Kaffee im Jake’s Coffeeshop den ganzen Monat über kaufen-ein-geben-kostenlos ist.” Während die Erstellung dieser Anzeige mit vorab aufgenommenem Audio und Verzweigungslogik ein nahezu unmögliches Unterfangen wäre, bereitet die Voice-AI hinter kontextuellen Anzeigen diese Kreativität auf Abruf und in Echtzeit vor.

Aus der Sicht eines Verlegers bieten AI-getriebene Voice-, Video- und CTV-kontextuelle Anzeigen eine innovationsgetriebene Neuerung, die keine komplexe Integration erfordert. Kontextuelle Anzeigen sind mit allen Demand-Side-Plattformen (DSPs) und Ad-Servern kompatibel, die VAST-Tags unterstützen, und bieten sofortige Skalierbarkeit. Verleger können auch unser Ad-Netzwerk nutzen, um mehr als 6 Milliarden Impressionen weltweit zu erreichen, ohne Plattformkosten: technische Kosten sind im Media-Ausgabenbetrag enthalten, wenn innerhalb des Netzwerks veröffentlicht wird.

Können Sie einige Details über den Prozess des Launchens einer Anzeige auf der Plattform teilen?

Das Launchen einer Anzeige auf unserer Plattform dauert buchstäblich nur Minuten. Der Marken- oder Agentur-Benutzer schreibt einfach Anzeigen-Text, mit oder ohne Hilfe von AI, dann wählt er entweder eine lizenzfreie Stimme aus unserer Voice-Bibliothek oder klonen seine eigene Stimme. Benutzer können auch zusätzliche Assets hochladen, die erforderlich sind (Hintergrundmusik, Video-Footage, Banner usw.). Der Benutzer finalisiert die Anzeige, und die Plattform stellt Versionen bereit, die ready to serve sind – entweder über den VAST-Tag (der Branchenstandard für Ad-Verkehr), oder als herunterladbare Medien-Dateien, die für alle digitalen und Broadcasting-Umgebungen bereit sind.

Diese AI-angereicherten Anzeigen erhöhen nicht nur die Leistung von Video- und Audio-Anzeigen-Kampagnen, indem sie Hyper-Personalisierung im großen Maßstab ermöglichen, sondern senken auch die Kosten für die Erstellung von Kampagnen und reduzieren die Anzeigen-Erstellungzeit von Wochen auf Minuten. Für Kampagnen mit 50+ Versionen erleben Benutzer eine ~10X-Kostenreduzierung. Unsere Technologie bietet ähnliche Vorteile für Einzel-Kampagnen. Die Plattform ist auch ein großartiges Instrument für Vertriebsteams, um schnell Anzeigen-Mock-ups für ihre Kunden zu erstellen, ohne dass sie sich an einer frühen Stufe mit Produktions- und Kreativ-Teams befassen müssen, da unsere AI-Text schreiben und vollständig benutzerdefinierte Anzeigen produzieren kann.

Was ist Ihre Vision für die Zukunft der AI-Werbung und des Marketings?

Ich sehe wirklich eine Zukunft, in der Kunden nicht mehr von Anzeigen genervt sind (oder sie ausblenden), weil jede Anzeige für sie relevant und interessanter ist, und Marken in der Lage sind, die richtigen Zielgruppen im richtigen Moment mit der perfekten kontextuellen Botschaft zu erreichen. Das ist offensichtlich ein Paradigmenwechsel im Vergleich zu dem, wo die Branche derzeit ist, aber ich glaube, dass das, wo wir hinsteuern – und AI, strategisch eingesetzt, macht es möglich. Kontextuelle Anzeigen werden auch weiterhin besser darin, die Aufmerksamkeit der Hörer zu erregen, da sie genau auf ihren Kontext und ihre Bedürfnisse abgestimmt sind, insbesondere in einer Welt, in der die Privatsphäre an erster Stelle steht und die Zielgruppenansprache immer schwieriger wird – also ist die Kontext-Zielgruppenansprache der einzige effiziente Mechanismus, um die Anzeigen-Leistung zu steigern. Unsere fortschrittliche generative Anzeigen-AI kann unbegrenzt neue Kreativinhalte erstellen, um jeden Hörer als Individuum anzusprechen. Das Ergebnis ist eine Steigerung der Hörer-Interaktion, ein höherer ROI für Anzeigen und bedeutungsvollere Kunden-Verbindungen für Marken.

Vielen Dank für das großartige Interview. Leser, die mehr erfahren möchten, sollten Instreamatic besuchen.

Antoine ist ein visionärer Führer und Gründungspartner von Unite.AI, getrieben von einer unerschütterlichen Leidenschaft für die Gestaltung und Förderung der Zukunft von KI und Robotik. Ein Serienunternehmer, glaubt er, dass KI so disruptiv für die Gesellschaft sein wird wie Elektrizität, und wird oft dabei ertappt, wie er über das Potenzial disruptiver Technologien und AGI schwärmt.

Als futurist ist er darauf fokussiert, zu erforschen, wie diese Innovationen unsere Welt formen werden. Zusätzlich ist er der Gründer von Securities.io, einer Plattform, die sich auf Investitionen in hochmoderne Technologien konzentriert, die die Zukunft neu definieren und ganze Branchen umgestalten.