Інтерв’ю
Стас Тушинський, CEO та співзасновник Instreamatic – Серія інтерв’ю

Стас Тушинський є CEO та співзасновником Instreamatic, платформи, яка пропонує рішення для маркетингу голосу та аудіо, що працюють на основі штучного інтелекту, щоб дозволити брендам краще взаємодіяти з споживачами.
Раніше ви співзаснували Unisound, агентство аудіореклами. Як цей досвід привів вас до концепції створення компанії з маркетингом голосу на основі штучного інтелекту?
Мій досвід у Unisound був фундаментальним для розуміння розвитку ландшафту цифрової аудіореклами. Ми були на передовій у визнанні зростаючого попиту та потенціалу аудіореклами в цифровому просторі.
Ключовим висновком з мого часу там було усвідомлення того, що персоналізація та контекстуалізація суттєво підвищують ефективність реклами, включаючи аудіорекламу. Це розуміння стало одним з основних елементів бачення за Instreamatic.
У Unisound ми спостерігали пробіл на ринку інтелектуальних, реактивних рішень для реклами. Ми бачили можливість використовувати штучний інтелект не лише для цілевого маркетингу, але й для створення більш інтерактивного та привабливого досвіду. Це привело до ідеї платформи маркетингу, що працює на основі штучного інтелекту, яка революціонізує те, як ми взаємодіємо з рекламою.
Чи можете ви поділитися історією створення Instreamatic?
Спочатку Instreamatic народився з бачення перетворити спосіб, у який аудіопублікатори монетизують свій контент. Спочатку наш фокус був на обслуговуванні аудіореклами для монетизації, що залишається суттєвою частиною наших операцій.
Когда ми глибше занурилися в галузь, ми визначили суттєву можливість у штучному інтелекті для творчої оптимізації. Це розуміння було вирішальним у формуванні нашого напрямку до інтеграції технологій штучного інтелекту глибше у наші послуги.
Збіг нашої експертизи в аудіорекламі та досягнень у технології штучного інтелекту став каталізатором для Instreamatic. Ми побачили можливість не лише обслуговувати публікаторів, але й поліпшувати загальний досвід реклами для користувачів та рекламодавців, прокладаючи шлях до більш динамічного та ефективного рекламного екосистеми.
Які були деякі з перших технологій штучного інтелекту/машинного навчання, які були використані?
Ми почали з простого класифікатора. Це метод машинного навчання з учителем, у якому модель намагається передбачити правильну мітку заданих даних. Потім ми поліпшили наш класифікатор, використовуючи вкладення. Зрештою, ми не обмежувалися лише технологіями обробки природної мови. Новітні ідеї та виклики представили нам нові перешкоди, і зараз наш арсенал включає синтез мовлення та генерацію голосу без зразків.
Як змінився ваш технологічний стек та як ви його розгортаєте?
Генеративний штучний інтелект приніс суттєві зміни до нашого технологічного стека та стратегій розгортання. Наш поточний технологічний стек включає передові бібліотеки та фреймворки машинного навчання, які підтримують генеративні моделі штучного інтелекту, особливо для синтезу мовлення та генерації голосу без зразків. Ми використовуємо високопродуктивні обчислювальні ресурси для навчання цих моделей, оскільки їм потрібна суттєва обчислювальна потужність. Це включає використання апаратного забезпечення з прискоренням на основі GPU для обробки інтенсивних вимог обробки.
Для розгортання ми сильно залежимо від хмарних рішень. Це пропонує нам масштабованість, необхідну для управління великими робочими навантаженнями застосунків генеративного штучного інтелекту. Ми використовуємо контейнеризацію, як Docker, та інструменти оркестрації, як Kubernetes, для управління та масштабування наших застосунків ефективно. Ця установка забезпечує, що наші моделі генеративного штучного інтелекту можуть бути розгорнуті швидко та масштабовані відповідно до попиту.
Наші конвеєри CI/CD оптимізовані для робочих потоків машинного навчання. Ми використовуємо інструменти, які дозволяють нам автоматизувати навчання та розгортання моделей, забезпечуючи, що вони завжди оновлені з останніми даними та алгоритмами. Ця автоматизація є важливою для підтримання ефективності наших застосунків генеративного штучного інтелекту.
У сфері обробки даних ми реалізували потужні потоки обробки даних. Ці потоки розроблені для ефективної обробки великих обсягів даних, що є суттєвим для навчання та експлуатації моделей генеративного штучного інтелекту. Ми забезпечуємо, що дані обробляються та зберігаються безпечно, дотримуючись найкращих практик безпеки даних та конфіденційності.
Загалом, інтеграція генеративного штучного інтелекту до нашого технологічного стека привела нас до прийняття високопродуктивних обчислювальних ресурсів, хмарних інфраструктур, контейнеризації для масштабування, автоматизованих конвеєрів CI/CD для машинного навчання та безпечних механізмів обробки даних. Ці технічні елементи є фундаментальними для підтримки передових можливостей наших застосунків генеративного штучного інтелекту.
Instreamatic спеціалізується на тому, що ви називаєте контекстною відео- та аудіорекламою — як ви визначаєте це?
Контекстна реклама використовує останні досягнення у генеративному штучному інтелекті, щоб суттєво змінити те, що можливо з відео- та аудіорекламою. Результат для бізнесу полягає у підвищенні взаємодії з брендом та поверненні інвестицій. Контекстна реклама пропонує практично необмежену можливість постійно генерувати та тестувати новий творчий контент, що відповідає конкретному контексту та середовищу слухача.
Факт полягає в тому, що рекламна індустрія давно стикається з проблемою зниження рівня взаємодії з рекламою різних типів. Це, ймовірно, не буде сюрпризом для нікого, оскільки споживачі демонструють підвищену втомленість від екранів та опір до загальної реклами, яка спирається на бомбардування аудиторії рекламою, щоб досягти конверсій. Хоча реклама, яка демонструє більш оригінальний контент та вищу релевантність для споживача, здобуває вищу взаємодію, часові та фінансові інвестиції, необхідні для ручного виробництва та управління окремим рекламним контентом для кожного індивідуального контексту споживача, є надзвичайно обмежувальними.
Наша контекстна аудіо-, відео- та реклама на підключених телевізорах (CTV) працюють на основі штучного інтелекту, щоб протидіяти цій низькій тенденції взаємодії, дозволяючи рекламодавцям зробити кожну рекламу гіпер-релевантною та точно націленою на споживача, який її чує. Розгляньте традиційний 30-секундний аудіоролик: актор, який записує кілька варіантів рекламного контенту, не достатньо, щоб слухач був особливо здивований або щоб захопити його увагу. Контекстна реклама здатна покращити традиційний рекламний контент, використовуючи генеративний штучний інтелект для синтезу голосу актора та автоматичної генерації тисяч варіантів реклами протягом кампанії.
Контекстна реклама особливо корисна для оживлення тривалих рекламних кампаній (у діапазоні 3-6 місяців). Традиційно, ці кампанії дуже вразливі до творчої втоми: аудиторія отримує той самий творчий контент знову і знову, що неминуче призводить до зниження взаємодії. Наша технологія вирішує цю проблему, роблячи простим оновлення творчого контенту щотижня. Наприклад, для рітейлерів з щотижневими оновленнями пропозицій товарів наша автоматична генерація реклами ідеально підходить для підтримання цих кампаній актуальними та свіжими.
Як реально очікувати, що штучний інтелект гіпер-персоналізує рекламу?
Це тепер повністю реально, як демонструє контекстна реклама, що працює на основі генеративного штучного інтелекту. Контекстна реклама може містити гіпер-персоналізовані деталі, включаючи місце розташування слухача, час доби, назву або тип застосунку чи платформи, яку він використовує, та діяльність, яку він здійснює, наприклад, слухання подкасту, гру тощо. Контекстна реклама навіть може включати змінні, такі як назви місцевих магазинів та адреси, місцеві акції в магазині, промо-коди (унікальні для кожного каналу для забезпечення вимірювання ефективності), місця призначення з конкретними пропозиціями тощо. Ці реклами також можуть назвати найближчий місцевий магазин, де слухач може взаємодіяти з брендом та реалізувати пропозицію, зазначену в рекламі. Ця ж можливість цілевого маркетингу забезпечує, що рекламні кампанії досягають перевірених аудиторій, які є найбільш сприйнятливими до продуктів та рішень, що пропонуються. Ці реклами генеруються та доставляються без запису нового голосу чи голосового контенту.
Чи можете ви обговорити основні пропозиції, до яких мають доступ ваші клієнти?
З точки зору бренду, наша платформа контекстної реклами бере один оригінальний зразок голосу та сценарій, визначає набір параметрів, унікальних для кожного окремого слухача, та використовує наші можливості штучного інтелекту з голосу для безшовного виробництва та обслуговування аудіо-, відео- чи реклами на підключених телевізорах (CTV), що відповідають цим параметрам. Наприклад, контекстна реклама, згенерована для конкретного користувача, могла б початися так: “Сподіваюсь, вам подобається ваш подкаст цього дощового ранку в Чикаго, я просто хотів швидко повідомити вам, що кава є купі одні – отримай одну безкоштовно в кав’ярні Джейка все місяць”. Хоча виробництво такого рекламного контенту з попередньо записаним аудіо та логікою розгалуження було б майже неможливим завданням, штучний інтелект за контекстною рекламою готує цей творчий контент на вимогу – автоматично та в реальному часі.
З точки зору публікатора, реклама на основі штучного інтелекту з контекстним голосом, відео та рекламою на підключених телевізорах (CTV) пропонує інноваційний прорив без складної інтеграції. Контекстна реклама працює з усіма платформами управління вимогою (DSP) та серверами реклами, що підтримують теги VAST, пропонуючи миттєву масштабованість. Публікатори також можуть використати нашу рекламну мережу, щоб досягти більш ніж 6 мільярдів показів по всьому світу без плати за платформу: технічні витрати включаються до витрат на медіа, коли публікуються у мережі.
Чи можете ви поділитися деякими деталями про процес запуску реклами на платформі?
Запуск реклами на нашій платформі займає буквально лише кілька хвилин. Користувач бренду або агентства просто пише рекламний текст з або без допомоги штучного інтелекту, потім вибирає безкоштовний голос з нашої бібліотеки голосів або клонує свій власний голосовий талант. Користувач також може завантажити будь-які додаткові активи, необхідні для цього (фонова музика, відеозаписи, банери тощо). Користувач завершує рекламу, та платформа пропонує версії, готові до обслуговування – або через тег VAST (галузевий стандарт для трафіку реклами), або як завантажувані медіафайли, готові до використання в будь-яких цифрових та мовних середовищах.
Ці реклами, збагачені штучним інтелектом, не лише підвищують ефективність відео- та аудіорекламних кампаній, дозволяючи гіпер-персоналізацію у масштабі, але також скорочують вартість виробництва кампаній та скорочують час створення реклами з тижнів до хвилин. Для кампаній з 50+ варіантами користувачі відчувають зменшення витрат у ~10 разів. Наша технологія пропонує подібні переваги для кампаній з одним творчим контентом. Платформа також є чудовим інструментом для команд продажів, щоб швидко створити рекламні макети для своїх клієнтів без залучення виробничих та творчих команд на ранній стадії, оскільки наш штучний інтелект може писати текст та повністю створювати рекламу.
Яка ваша бачення майбутнього реклами та маркетингу на основі штучного інтелекту?
Я справді бачу майбутнє, у якому клієнти не будуть розчаровані (або вимкнуті) рекламою, оскільки кожна з них тепер буде релевантною та цікавою для них, а бренди будуть ще більш здатні досягати правильних аудиторій у правильний момент з ідеальним контекстним повідомленням. Це, очевидно, суттєва зміна від того, де зараз знаходиться галузь, але я вірю, що саме туди ми рухаємось – і штучний інтелект, використаний стратегічно, робить це можливим. Контекстна реклама також буде продовжувати покращуватися у захопленні уваги слухачів, оскільки вона говорить точно про їхній контекст та потреби, особливо у світі, де перша позиція користувача стає все складнішою – так що контекстне націлювання є єдиним ефективним механізмом для підвищення ефективності реклами. Наша передова генерація реклами на основі штучного інтелекту може створити необмежену кількість нових творчих робіт, щоб звернутися до кожного слухача як до окремої особи. Результатом є підвищення взаємодії слухачів, більший повернення інвестицій у рекламу та більш значимі зв’язки клієнтів для брендів.
Дякуємо за велике інтерв’ю. Читачам, які бажають дізнатися більше, слід відвідати Instreamatic.












