Intervjuer
Stas Tushinskiy, VD & Medgrundare av Instreamatic – Intervju-serie

Stas Tushinskiy är VD och medgrundare av Instreamatic, en plattform som erbjuder AI-drivna lösningar för röst- och ljudmarknadsföring för att möjliggöra för varumärken att engagera sig bättre med konsumenter.
Tidigare co-founderade du Unisound, en audio-reklambyrå. Hur ledde denna erfarenhet dig till att konceptualisera lanseringen av ett AI-röstmarknadsföringsföretag?
Min erfarenhet på Unisound var grundläggande för att förstå den föränderliga landskapsbilden av digital audio-reklam. Vi var i framkanten av att erkänna den växande efterfrågan och potentialen för audio-annonser i ett digitalt utrymme.
En viktig insikt från min tid där var att personanpassning och kontextualisering avsevärt förbättrar effektiviteten hos annonsering, inklusive audio-annonser. Denna förståelse blev en hörnsten för visionen bakom Instreamatic.
På Unisound observerade vi ett gap i marknaden för intelligenta, responsiva annonslösningar. Vi föreställde oss att använda AI inte bara för målgruppsval, utan också för att skapa en mer interaktiv och engagerande upplevelse. Detta ledde till idén om en AI-driven marknadsplattform, som skulle revolutionera hur vi interagerar med annonser.
Kan du dela den ursprungliga berättelsen om lanseringen av Instreamatic?
Ursprungligen föddes Instreamatic ur en vision att omvandla hur audio-förlag monetiserar sitt innehåll. Initialt låg vårt fokus på att tjäna audio-annonser för monetisering, vilket fortfarande är en betydande del av vår verksamhet.
När vi gick djupare in i branschen identifierade vi en betydande möjlighet i AI för kreativ optimering. Denna insikt var avgörande för att forma vår riktning mot att integrera AI-teknologi mer djupt i våra tjänster.
Konvergensen av vår expertis inom audio-reklam och framstegen inom AI-teknologi var katalysatorn för Instreamatic. Vi såg potentialen att inte bara tjäna förlag, utan också att förbättra den övergripande annonsupplevelsen för användare och annonsörer, och bana väg för ett mer dynamiskt och effektivt annons-ekosystem.
Vilka var några av de initiala AI/ML-teknologierna som användes?
Vi började med en enkel klassificerare. Det är en övervakad maskinlärningsmetod där modellen försöker förutsäga den korrekta etiketten för given indata. Sedan förbättrade vi vår klassificerare genom att använda inbäddningar. Till slut begränsade vi oss inte till bara NLP-teknologier. Nya idéer och utmaningar presenterade oss med färska hinder och nu omfattar vår arsenal text-till-tal-syntes och zero-shot-röstkloning.
Hur har generativ AI förändrat er tekniska stack och hur deployerar ni den?
Generativ AI har medfört betydande förändringar i både vår tekniska stack och deploymentsstrategier. Vår nuvarande tekniska stack inkluderar avancerade maskinlärningsbibliotek och ramverk som stöder generativa AI-modeller, särskilt för text-till-tal-syntes och zero-shot-röstkloning. Vi använder högpresterande datorresurser för att träna dessa modeller, eftersom de kräver betydande beräkningskraft. Detta innefattar att utnyttja GPU-accelererad hårdvara för att hantera de intensiva bearbetningskraven.
För deployment förlitar vi oss tungt på molnbaserade lösningar. Detta erbjuder oss den skalbarhet som behövs för att hantera de tunga arbetsbelastningarna för generativa AI-applikationer. Vi använder containertekniker som Docker och orkestreringsverktyg som Kubernetes för att hantera och skala våra applikationer effektivt. Detta setup säkerställer att våra generativa AI-modeller kan deployeras snabbt och skalas enligt efterfrågan.
Våra CI/CD-pipelines är optimerade för maskinlärningsarbetsflöden. Vi använder verktyg som möjliggör att vi kan automatisera utbildning och deployment av modeller, vilket säkerställer att de alltid är uppdaterade med de senaste data och algoritmer. Denna automatisering är avgörande för att upprätthålla effektiviteten hos våra generativa AI-applikationer.
I termer av datahantering har vi implementerat robusta dataprocesseringspipelines. Dessa pipelines är utformade för att hantera stora volymer data effektivt, vilket är avgörande för att träna och driva generativa AI-modeller. Vi säkerställer att data bearbetas och lagras säkert, i enlighet med bästa praxis för datasäkerhet och sekretess.
Sammanfattningsvis har integrationen av generativ AI i vår tekniska stack lett oss att anta högpresterande datorresurser, molnbaserade infrastrukturer, containerteknik för skalbarhet, automatiserade CI/CD-pipelines för maskinlärning och säkra dataprocesseringsmekanismer. Dessa tekniska element är grundläggande för att stödja de avancerade funktionerna i våra generativa AI-applikationer.
Instreamatic specialiserar sig på det ni kallar kontextuell video- och ljudannonsning—hur definierar ni det?
Kontextuell annonsning utnyttjar den senaste utvecklingen inom generativ AI för att väsentligt förändra vad som är möjligt med video- och ljudannonser. Resultatet för företag är ökad varumärkesengagemang och avkastning på investeringar. Kontextuella annonser erbjuder en i princip obegränsad förmåga att kontinuerligt generera och A/B-testa nytt kreativt innehåll som är relevant för lyssnarens specifika kontext och miljö.
Faktum är att annonsbranschen har kämpat mot sjunkande engagemangstal för annonsformat under flera år. Det är förmodligen ingen överraskning för någon, eftersom konsumenter visar ökad skärmtrötthet och motstånd mot generaliserad annonsering som förlitar sig på att bomba publiken med annonsmängd för att uppnå konverteringar. Medan annonser som visar mer specifikt originalinnehåll och högre relevans för konsumenten tjänar högre engagemang, är tids- och kostnadsinvesteringarna som krävs för att manuellt producera och hantera separata annonskopior för varje enskild konsuments kontext extremt begränsande.
Våra kontextuella ljud-, video- och connected TV (CTV)-annonser drivs av AI för att bryta denna låga engagemangstrend genom att möjliggöra för annonsörer att göra varje annons hyper-relevant och exakt riktad till konsumenten som hör den. Överväg en traditionell 30-sekunders ljudannons: en anställd röstskådespelare kan spela in några annonskopior, inte tillräckligt för att lyssnaren ska bli särskilt förvånad eller för att nödvändigtvis fånga deras uppmärksamhet. Kontextuella annonser kan förbättra det traditionella annonsinnehållet genom att använda generativ AI för att syntetisera samma skådespelares röst och automatiskt generera tusentals annonsvarianter över en kampanj.
Kontextuella annonser är särskilt användbara för att återuppliva längre annonskampanjer (i intervallet 3-6 månader). Traditionellt är dessa kampanjer mycket sårbara för kreativ trötthet: publiken får samma kreativa innehåll om och om igen, vilket oundvikligen leder till minskat engagemang. Vår teknik löser denna utmaning genom att göra det enkelt att förnya kreativa innehåll veckovis. För detaljhandlare med veckovis uppdaterade produkt erbjudanden, till exempel, är vår automatiska annonsgenerering idealisk för att hålla dessa kampanjer aktuella och färska.
Hur realistiskt är det för varumärken att förvänta sig att AI ska hyper-personanpassa annonser?
Det är nu fullständigt realistiskt, som demonstrerats av generativ-AI-driven kontextuell annonsning. Kontextuella annonser kan innehålla hyper-personanpassade detaljer, inklusive lyssnarens plats, tid på dagen, namnet eller typen av app eller plattform de använder, och den aktivitet de är engagerade i, vare sig det är att lyssna på en podcast, spela ett spel etc. Kontextuella annonser kan även innehålla variabler som namnger lokala butiker och adresser, lokala butiks kampanjer, kampanjkoder (unika för varje kanal för att möjliggöra prestandamätning), resmål med specifika erbjudanden och mycket mer. Dessa annonser kan också namnge den närmaste lokala butiken där en lyssnare kan interagera med varumärket och lösa in erbjudandet som presenteras i annonsen. Denna samma målgruppskapacitet säkerställer att annonskampanjer når granskade målgrupper som är mest mottagliga för de produkter och lösningar som erbjuds. Dessa annonser genereras och levereras utan att spela in ny röst eller röstöverföringsinnehåll.
Kan du diskutera de kärnerbjudanden som era kunder har tillgång till?
Från ett varumärkesperspektiv tar vår Kontextuella annonsplattform en enda ursprunglig röstprov och manus, identifierar uppsättningen parametrar som är unika för varje enskild lyssnare, och använder vår röst-AI-förmåga för att sömlöst producera och leverera ljud-, video- eller CTV-annonser som är anpassade till dessa specifika detaljer. Till exempel kan en Kontextuell annons som genereras för en specifik användare börja, “Hoppas du njuter av din podcast på denna regniga morgon i Chicago, jag ville bara snabbt låta dig veta att kaffe är köp ett få ett gratis hela månaden på Jakes Coffeeshop.” Medan produktion av samma annonskreativitet med förinspelad audio och grenlogik skulle vara en i princip omöjlig uppgift, förbereder röst-AI bakom Kontextuella annonser denna kreativitet på begäran—automatiskt och i realtid.
Från en utgivares perspektiv erbjuder AI-drivna röst-, video- och CTV-Kontextuella annonser en banbrytande innovation utan komplex integration krävs. Kontextuella annonser fungerar med alla efterfråge-sidor (DSP:er) och annonservrar som stöder VAST-taggar, vilket erbjuder omedelbar skalbarhet. Utgivare kan också utnyttja vår annonsnätverk för att nå mer än 6 miljarder visningar globalt utan plattformsavgift: tekniska kostnader ingår i mediaköp när publicering sker inom nätverket.
Kan du dela några detaljer om processen för att lansera en annons på plattformen?
Att lansera en annons på vår plattform tar bokstavligen bara några minuter. Varumärkes- eller byråanvändaren skriver antingen annonskopior med eller utan hjälp av AI, sedan väljer de antingen en royaltyfri röst från vår Röstbibliotek eller klonar sin egen rösttalang. Användare kan också ladda upp eventuella ytterligare tillgångar som krävs (bakgrundsmusik, videoavsnitt, banner etc.). Användaren slutför annonsen, och plattformen tillhandahåller versioner som är klara att leverera—antingen via VAST-taggen (branschstandard för annons-trafik), eller som nedladdningsbara mediafiler redo att gå för alla digitala och sändningsmiljöer.
Dessa AI-berikade annonser inte bara ökar prestandan för video- och ljudannonskampanjer genom att möjliggöra hyper-personanpassning i skala, utan minskar också kostnaden för att producera kampanjer och reducerar annons-skapandetiden från veckor till minuter. För kampanjer med 50+ versioner upplever användarna en ~10X kostnadsminskning. Vår teknik erbjuder liknande avgörande fördelar för enkelt kreativt kampanjer. Plattformen är också ett utmärkt instrument för försäljningsteam för att snabbt producera annonsförslag för sina kunder utan att engagera sig i produktion och kreativa team på ett tidigt stadium, eftersom vår AI kan skriva kopior och fullständigt producera anpassade annonser.
Vad är er vision för framtiden för AI-annonsning och marknadsföring?
Jag ser verkligen en framtid där kunder inte störs av (eller stänger av) annonser eftersom varje annons nu är relevant och mer intressant för dem, och varumärken är ännu mer kapabla att nå rätt målgrupper vid rätt ögonblick med det perfekta kontextuella meddelandet. Det är uppenbarligen en havsändring från var branschen är nu, men jag tror att det är dit vi är på väg—and AI, utnyttjad strategiskt, gör det möjligt. Kontextuella annonser kommer också att fortsätta att förbättras för att fånga lyssnares uppmärksamhet eftersom de talar precis till deras kontext och behov, särskilt i en värld som prioriterar sekretess där användarmålgrupper blir allt svårare—så kontextmålgrupper är den enda effektiva mekanismen för att förbättra annonsprestanda. Vår avancerade generativa annons-AI kan skapa obegränsat nya kreativa innehåll för att behandla varje lyssnare som en individ. Resultatet är en ökning av lyssnarengagemang, större annonsavkastning och mer meningsfulla kundkontakter för varumärken.
Tack för den underbara intervjun, läsare som vill lära sig mer bör besöka Instreamatic.












