Connect with us

Stas Tushinskiy, CEO & Co-Founder of Instreamatic – Wywiad z serii

Wywiady

Stas Tushinskiy, CEO & Co-Founder of Instreamatic – Wywiad z serii

mm

Stas Tushinskiy jest CEO i współzałożycielem Instreamatic, platformy oferującej rozwiązania marketingowe oparte na głosie i dźwięku, wykorzystujące sztuczną inteligencję, aby umożliwić markom lepsze zaangażowanie konsumentów.

Wcześniej współzałożyłeś Unisound, agencję reklamową specjalizującą się w reklamie audio. Jak doświadczenie to doprowadziło Cię do pomysłu założenia firmy zajmującej się marketingiem głosowym opartym na sztucznej inteligencji?

Moje doświadczenie w Unisound było podstawowe w zrozumieniu ewoluującego krajobrazu reklamy cyfrowej w formacie audio. Byliśmy na czele uznania rosnącego popytu i potencjału reklam audio w przestrzeni cyfrowej.

Kluczowym wnioskiem z mojego czasu tam był fakt, że personalizacja i kontekstualizacja znacząco zwiększają skuteczność reklamy, w tym także reklam audio. To zrozumienie stało się kamieniem węgielnym wizji za Instreamatic.

W Unisound zauważyliśmy lukę na rynku w zakresie inteligentnych, responsywnych rozwiązań reklamowych. Wyobrażaliśmy sobie wykorzystanie sztucznej inteligencji nie tylko do celowania, ale także do tworzenia bardziej interaktywnych i angażujących doświadczeń. To doprowadziło do pomysłu platformy marketingowej napędzanej przez sztuczną inteligencję, która rewolucjonizuje sposób, w jaki wchodzimy w interakcje z reklamami.

Czy mógłbyś podzielić się historią powstania Instreamatic?

Początkowo Instreamatic powstał z wizji przekształcenia sposobu, w jaki wydawcy audio monetyzują swoją zawartość. Początkowo nasza uwaga była skierowana na obsługę reklam audio w celu monetyzacji, co nadal stanowi znaczącą część naszych operacji.

Gdy zagłębialiśmy się głębiej w branżę, zidentyfikowaliśmy znaczącą okazję w sztucznej inteligencji do optymalizacji kreatywnych rozwiązań. To zrozumienie było kluczowe w kształtowaniu naszego kierunku w stronę głębszego integrowania technologii sztucznej inteligencji z naszymi usługami.

Zbieżność naszej ekspertyzy w reklamie audio i postępów w technologiach sztucznej inteligencji była katalizatorem dla Instreamatic. Zobaczyliśmy potencjał, by nie tylko służyć wydawcom, ale także poprawić ogólne doświadczenie reklamowe dla użytkowników i reklamodawców, tworząc drogę ku bardziej dynamicznemu i wydajnemu ekosystemowi reklamowemu.

Jakie były niektóre z początkowych technologii AI/ML, które zostały wykorzystane?

Zaczynaliśmy od prostego klasyfikatora. Jest to nadzorowana metoda uczenia maszynowego, w której model próbuje przewidzieć poprawną etykietę danych wejściowych. Następnie udoskonaliliśmy nasz klasyfikator, wykorzystując embeddingi. Ostatecznie nie ograniczyliśmy się tylko do technologii NLP. Nowe pomysły i wyzwania przedstawiały nam nowe przeszkody, a obecnie nasz arsenał obejmuje syntezę mowy i klonowanie głosu bez szkoleń.

Jak sztuczna inteligencja generatywna zmieniła Wasz stos technologiczny i jak ją wdrożyliście?

Sztuczna inteligencja generatywna przyniosła znaczące zmiany w naszym stosie technologicznym i strategiach wdrożeniowych. Nasz obecny stos technologiczny obejmuje zaawansowane biblioteki i ramy uczenia maszynowego, które obsługują modele sztucznej inteligencji generatywnej, szczególnie w zakresie syntezy mowy i klonowania głosu. Wykorzystujemy zasoby obliczeniowe o wysokiej wydajności do szkolenia tych modeli, ponieważ wymagają one znaczącej mocy obliczeniowej. Obejmuje to wykorzystanie sprzętu z przyspieszeniem GPU do obsługi wymagań obliczeniowych.

Dla wdrożenia opieramy się głównie na rozwiązaniach chmurowych. Oferują one nam skalowalność niezbędną do zarządzania dużymi obciążeniami aplikacji sztucznej inteligencji generatywnej. Wykorzystujemy technologie konteneryzacji, takie jak Docker, i narzędzia do orchestracji, takie jak Kubernetes, aby efektywnie zarządzać i skalować nasze aplikacje. Ten zestaw gwarantuje, że nasze modele sztucznej inteligencji generatywnej mogą być wdrożone szybko i skalowane zgodnie z zapotrzebowaniem.

Nasze potoki CI/CD są zoptymalizowane pod kątem przepływów pracy związanych z uczeniem maszynowym. Wykorzystujemy narzędzia, które umożliwiają nam automatyzację szkolenia i wdrożenia modeli, zapewniając, że zawsze są one aktualne z najnowszymi danymi i algorytmami. Ta automatyzacja jest kluczowa dla utrzymania skuteczności naszych aplikacji sztucznej inteligencji generatywnej.

W kwestii obsługi danych wdrożyliśmy solidne potoki przetwarzania danych. Są one zaprojektowane do efektywnej obsługi dużych ilości danych, co jest niezbędne do szkolenia i eksploatacji modeli sztucznej inteligencji generatywnej. Zapewniamy, że dane są przetwarzane i przechowywane w sposób bezpieczny, zgodnie z najlepszymi praktykami w zakresie bezpieczeństwa i prywatności danych.

Ogólnie rzecz biorąc, integracja sztucznej inteligencji generatywnej z naszym stosiem technologicznym doprowadziła nas do przyjęcia zasobów obliczeniowych o wysokiej wydajności, infrastruktur chmurowych, konteneryzacji dla skalowalności, zautomatyzowanych potoków CI/CD dla uczenia maszynowego oraz bezpiecznych mechanizmów przetwarzania danych. Te elementy techniczne są fundamentalne dla wspierania zaawansowanych możliwości naszych aplikacji sztucznej inteligencji generatywnej.

Instreamatic specjalizuje się w tym, co nazywacie kontekstową reklamą wideo i audio — jak definiujecie to?

Reklama kontekstowa wykorzystuje najnowsze postępy w sztucznej inteligencji generatywnej, aby znacząco zmienić to, co jest możliwe w reklamach wideo i audio. Rezultatem dla firm jest zwiększone zaangażowanie marki i zwrot z inwestycji. Reklamy kontekstowe oferują praktycznie nieograniczoną możliwość ciągłego generowania i testowania nowych treści kreatywnych istotnych dla kontekstu i środowiska słuchacza.

Prawdą jest, że branża reklamowa borykała się z malejącymi wskaźnikami zaangażowania we wszystkich typach reklam przez lata. To nie jest zaskoczeniem, biorąc pod uwagę, że konsumenci wykazują coraz większą zmęczenie ekranem i opór wobec uogólnionej reklamy, która polega na zalewaniu audytorium reklamą, aby osiągnąć konwersje. Podczas gdy reklamy, które prezentują bardziej oryginalne treści i większą relewantność dla konsumenta, uzyskują wyższe zaangażowanie, nakłady czasu i koszty produkcji oraz zarządzania oddzielnymi wersjami reklam dla kontekstu każdego konsumenta są ekstremalnie ograniczające.

Nasze reklamy kontekstowe audio, wideo i CTV są napędzane przez sztuczną inteligencję, aby przeciwdziałać tendencji niskiego zaangażowania, umożliwiając reklamodawcom tworzenie reklam hiper-relewantnych i precyzyjnie ukierunkowanych na konsumenta, który je słucha. Rozważmy tradycyjne 30-sekundowe miejsce reklamowe audio: wynajęty aktor głosowy może nagrać tylko kilka wersji kopii reklamowej, co nie wystarcza, aby słuchacz był szczególnie zaskoczony lub aby koniecznie przyciągnąć jego uwagę. Reklamy kontekstowe są w stanie udoskonalić tę tradycyjną zawartość reklamową, wykorzystując sztuczną inteligencję generatywną do syntezy tego samego głosu aktora i automatycznego generowania tysięcy wersji reklamowych w ramach kampanii.

Reklamy kontekstowe są szczególnie przydatne do odświeżania dłuższych kampanii reklamowych (w zakresie 3-6 miesięcy). Tradycyjnie te kampanie są bardzo narażone na zmęczenie kreatywności: audytorium otrzymuje tę samą kreatywność wielokrotnie, co nieuchronnie prowadzi do zmniejszonego zaangażowania. Nasza technologia rozwiązuje ten problem, umożliwiając łatwe odświeżanie kreatywności co tydzień. Dla detalistów z cotygodniowo aktualizowanymi ofertami produktów nasza automatyczna generacja reklam jest podobnie idealna do utrzymania tych kampanii na bieżąco i świeżo.

Jak realistyczne jest oczekiwanie, że sztuczna inteligencja hiper-personalizuje reklamy?

To jest już w pełni realistyczne, jak pokazuje reklama kontekstowa napędzana przez sztuczną inteligencję generatywną. Reklamy kontekstowe mogą zawierać hiper-personalizowane szczegóły, w tym lokalizację słuchacza, godzinę dnia, nazwę lub typ aplikacji lub platformy, którą używa, oraz aktywność, w której uczestniczy, czy to słuchanie podcastu, granie w grę itp. Reklamy kontekstowe mogą również zawierać zmienne, takie jak nazwy lokalnych sklepów i adresy, lokalne promocje w sklepach, kody promocyjne (unikatowe dla każdego kanału, aby umożliwić pomiar wydajności), miejsca docelowe podróży z konkretnymi ofertami i wiele więcej. Te reklamy mogą również wymienić najbliższy lokalny sklep, w którym słuchacz może wchodzić w interakcje z marką i zrealizować ofertę przedstawioną w reklamie. Ta sama zdolność ukierunkowania gwarantuje, że kampanie reklamowe docierają do zweryfikowanych audytoriów, które są najbardziej podatne na produkty i rozwiązania oferowane. Te reklamy są generowane i dostarczane bez nagrywania nowych głosów lub treści voice-over.

Czy mógłbyś omówić podstawowe oferty, do których mają dostęp Twoi klienci?

Z perspektywy marki nasza platforma reklam kontekstowych bierze pojedynczy oryginalny próbek głosu i scenariusz, identyfikuje zestaw parametrów unikalnych dla każdego słuchacza i wykorzystuje nasze możliwości sztucznej inteligencji głosowej do płynnego tworzenia i obsługi reklam audio, wideo lub CTV zgodnych z tymi szczegółami. Na przykład reklama kontekstowa wygenerowana dla określonego użytkownika może zacząć się od: „Mam nadzieję, że dobrze się bawisz, słuchając tego podcastu w deszczowy poranek w Chicago, chciałbym tylko powiedzieć, że kawa jest kup jedna, dostajesz drugą gratis w Jake’s Coffeeshop przez cały miesiąc”. Podczas gdy wytworzenie tej samej kreatywności reklamowej z nagraniami audio i logiką rozgałęzioną byłoby praktycznie niemożliwe, sztuczna inteligencja głosowa za reklamami kontekstowymi przygotowuje tę kreatywność na żądanie — automatycznie i w czasie rzeczywistym.

Z perspektywy wydawcy reklamy kontekstowe audio, wideo i CTV napędzane przez sztuczną inteligencję oferują innowacyjne rozwiązanie, które nie wymaga skomplikowanej integracji. Reklamy kontekstowe działają z wszystkimi platformami po stronie popytu (DSP) i serwerami reklam wspierającymi tagi VAST, oferując natychmiastową skalowalność. Wydawcy mogą również wykorzystać naszą sieć reklamową, aby dotrzeć do ponad 6 miliardów wyświetleń na całym świecie bez kosztów platformy: koszty techniczne są uwzględnione w wydatkach na media podczas publikowania w sieci.

Czy mógłbyś podzielić się niektórymi szczegółami na temat procesu uruchomienia reklamy na platformie?

Uruchomienie reklamy na naszej platformie zajmuje dosłownie tylko kilka minut. Użytkownik marki lub agencji po prostu pisze kopię reklamową z lub bez pomocy sztucznej inteligencji, a następnie wybiera głos royalty-free z naszej biblioteki głosów lub klonuje swój własny głos. Użytkownicy mogą również przesłać wszelkie dodatkowe zasoby niezbędne (muzyka w tle, nagrania wideo, banery itp.). Użytkownik finalizuje reklamę, a platforma zapewnia gotowe wersje — albo za pomocą tagu VAST (standard branżowy dla ruchu reklamowego), albo jako pliki multimedialne gotowe do użycia w każdym środowisku cyfrowym i nadawczym.

Te reklamy wzbogacone sztuczną inteligencją nie tylko zwiększają wydajność kampanii reklamowych wideo i audio, umożliwiając hiper-personalizację na dużą skalę, ale także redukują koszty produkcji kampanii i skracają czas tworzenia reklam z tygodni do kilku minut. Dla kampanii z 50+ wersjami użytkownicy doświadczają około 10-krotnego spadku kosztów. Nasza technologia oferuje podobne korzyści dla kampanii z jedną kreatywnością. Platforma jest również doskonałym instrumentem dla zespołów sprzedażowych, aby szybko wytworzyć makietę reklamową dla swoich klientów bez angażowania zespołów produkcyjnych i kreatywnych na wczesnym etapie, ponieważ nasza sztuczna inteligencja może pisać kopię i w pełni produkować reklamy na zamówienie.

Jaka jest Twoja wizja przyszłości reklamy i marketingu z użyciem sztucznej inteligencji?

Rzeczywiście widzę przyszłość, w której klienci nie będą irytowani (lub wyłączali) reklamami, ponieważ każda z nich jest teraz istotna i bardziej interesująca dla nich, a marki są o wiele bardziej zdolne do dotarcia do odpowiednich audytoriów w odpowiednich momentach z idealnym komunikatem kontekstowym. To jest oczywiście zmiana paradygmatu w porównaniu z tym, gdzie znajduje się obecnie branża, ale wierzę, że to tam zmierzamy — i sztuczna inteligencja, wykorzystana strategicznie, to umożliwia. Reklamy kontekstowe będą również coraz lepiej przyciągać uwagę słuchaczy, ponieważ mówią one dokładnie do ich kontekstu i potrzeb, szczególnie w świecie pierwszeństwa prywatności, gdzie celowanie w użytkownika staje się coraz trudniejsze — więc celowanie kontekstowe jest jedynym wydajnym mechanizmem poprawy wydajności reklam. Nasza zaawansowana sztuczna inteligencja generatywna może tworzyć nieograniczoną liczbę nowych kreatywności, aby zaadresować każdego słuchacza jako osobę. Rezultatem jest wzrost zaangażowania słuchaczy, wyższy zwrot z inwestycji w reklamę i bardziej znaczące połączenia z klientami dla marek.

Dziękujemy za wspaniały wywiad, czytelnicy, którzy chcą dowiedzieć się więcej, powinni odwiedzić Instreamatic.

Antoine jest wizjonerskim liderem i współzałożycielem Unite.AI, z niezachwianą pasją do kształtowania i promowania przyszłości sztucznej inteligencji i robotyki. Jako serialowy przedsiębiorca, uważa, że sztuczna inteligencja będzie tak samo przełomowa dla społeczeństwa, jak elektryczność, i często zachwycany jest potencjałem technologie przełomowych i AGI. Jako futurysta, poświęca się badaniu, jak te innowacje ukształtują nasz świat. Ponadto jest założycielem Securities.io, platformy skupiającej się na inwestowaniu w najnowocześniejsze technologie, które przeobrażają przyszłość i zmieniają całe sektory.