Інтерв’ю
Йохан Ваденгольт Вретем, CEO у Voxo – Серія інтерв’ю

Йохан Ваденгольт Вретем має понад два десятиліття досвіду на перетині технологій та бізнесу, з фокусом на використанні штучного інтелекту для трансформації того, як організації працюють та взаємодіють зі своїми клієнтами. Він очолював великі цифрові ініціативи та програми для клієнтів у сфері банківської справи та фінансів у компанії CGI, перш ніж став співзасновником Voxo для розвитку інновацій у сфері конверсаційного аналізу та технологій проведення заходів.
У Voxo AI Йохан очолює доставку реального часу, штучного інтелекту, який отримує дані з живих дискусій на заходах та конференціях, що дозволяє командам швидко та точно переходити від даних до дії. Будучи приверженим як комерційному впливу, так і соціальному благу, він також очолював ініціативи з корпоративної соціальної відповідальності, спрямовані на запобігання експлуатації дітей в Інтернеті.
Voxo AI – це платформа інтелекту для проведення заходів, яка використовує штучний інтелект для захоплення та перетворення живих розмов з конференцій, панелей та сесій у структуровані, придатні для використання знання. Аналізуючи аудіо в реальному часі, вона генерує миттєві підсумки, ключові висновки та пост-події контент, такий як звіти та брендові активи, що дозволяє організаторам, учасникам, спонсорам та доповідачам витягувати тривалу цінність з дискусій без ручного ведення нотаток або подальшої роботи.
До заснування Voxo ви провели роки, очолюючи складні цифрові та штучно-інтелектуальні ініціативи в сфері банківської справи та фінансових послуг у компанії CGI. Які конкретні розчарування або прогалини в цьому досвіді переконали вас, що пора створити свою власну компанію, орієнтовану на конверсаційний інтелект?
Мій час у CGI був надзвичайно формативним. Це велика організація з сотнями активів інтелектуальної власності, окрім консалтингу, і я отримав можливість спостерігати за складними умовами доставки, управлінням та трансформацією підприємства у великому масштабі. Це було також фрагментарним, розкиданим по багатьох технологіях, зацікавлених сторонах та конкуруючих пріоритетах.
Я перейшов від бізнес-аналітика до директора за лише два роки, і на той момент я відчував себе готовим зосередитися. Коли я зустрів своїх співзасновників, стало зрозуміло, що ми могли створити щось гостріше, один шлях, який використовував би найкращу доступну технологію для вирішення дуже конкретної, високоцінної проблеми. Що багато людей не знають, так це те, що ми почали як фінтех-компанія, орієнтовану на документацію у фінансових консультаціях. Відтоді ми еволюціонували у сфері конверсаційного аналізу та, врешті-решт, розширилися до інтелекту проведення заходів після майже десяти років навчання, як витягувати справжній сенс з людської розмови.
На початку, які були найбільш складними технічними або комерційними викликами при створенні штучного інтелекту, який міг би надійно зрозуміти справжні розмови, а не контрольовані, написані входи?
У наших перших фінтех-продуктах технологія обмежувала нашу амбіцію. Автоматичне розпізнавання мовлення для північних мов, яке було нашим початковим фокусом, мало рівень помилок у словах у діапазоні 70-80 відсотків. На такому рівні ви просто не можете створити продукт, який замінив би людську документацію.
У той самий час сучасні можливості великих мовних моделей ще не існували, тому створення надійних підсумків було майже неможливим. Коли ми пізніше запустили наш сервіс проведення заходів, ландшафт змінився. Ми мали глибокі знання, накопичені за роки, і, нарешті, мали правильні будівельні блоки штучного інтелекту для розуміння ключових доповідей, дебатів та круглих столів таким чином, щоб це могло масштабуватися.
Voxo почалася з конверсаційного аналізу та пізніше розширилася до великомасштабного інтелекту проведення заходів. Які сигнали вказували вам, що живі заходи були наступним великим фронтиром для мови штучного інтелекту?
Цікаво, що ми спочатку почали працювати з заходами як способом швидшого досягнення керівників вищого рівня та демонстрації того, наскільки потужним міг бути конверсаційний інтелект. Але як тільки ми доставили на найбільшу технологічну подію Швеції, Techarenan, з більш ніж 10 000 учасників, ми побачили величезний зсув.
Вхідний попит був миттєвим і дуже чітким. Люди не просто були вражені, вони хотіли купити сервіс проведення заходів як продукт. Це був сигнал. Ми вирішили інвестувати час, фокус та ресурси, необхідні для доставки цього глобально та на найвищому можливому рівні якості.
З системи перспективи, що фундаментально змінюється, коли ви переходите від транскрипції однієї зустрічі до обробки сотень одночасних сесій по декілька днів заходу?
Складність швидко зростає. Ви не тільки підтримуєте стабільність та якість кожної окремої сесії, але також справляєтеся з реальною хаотичністю. Останньоминутні зміни графіка, заміни доповідачів та оновлення програми є нормальними на великих заходах.
Щоб доставляти без додаткової нагрузки на вже напружені команди проведення заходів, вам потрібні процеси, які є суворими та все ж гнучкими. Вам також потрібна доведена методологія для аналізу. Ви не можете просто кинути сотні годин аудіо у модель та попросити цікавий звіт. Щоб генерувати високоякісні виходи за хвилини, вам потрібно поєднувати декілька моделей, трубопроводів та шарів структури.
Багато інструментів штучного інтелекту підкреслюють автоматизацію понад усе інше. Чому ви вирішили включити людський огляд у циклі як核心ну частину платформи Voxo?
Довіра все ще є найбільшим бар’єром, особливо для клієнтів підприємства, таких як HubSpot, GitHub та Intuit. Страх публікації чогось неточного є дуже реальним. Це чому стабільні процеси, плюс поєднання штучного інтелекту та людської якості забезпечення, залишаються вимогою для багатьох клієнтів сьогодні.
Ми також даємо клієнтам контроль. Вони можуть переглянути та затвердити підсумки до того, як щось буде поширене, і ми робимо цей робочий процес ефективним. З часом я вважаю, що потреба у людському огляді зменшиться, оскільки технологія та заходи безпеки дозрівають. До тих пір нічого не має значення більше, ніж заслуга на довіру до того, щоб бути довіреним контентом, який представляє їхній бренд.
Як змінилося уявлення команд проведення заходів про графіки контенту та пост-подійну цінність завдяки майже реальному часу транскрипції та підсумкам?
Це фундаментально змінює графік. Замість того, щоб контент був чимось, що ви публікуєте через тижні пізніше, він стає тим, чого ви можете використовувати, поки захід все ще відбувається та відразу після кожної сесії.
Що ми бачимо, так це те, що клієнти раптом мають матеріал, який тримає участь живою протягом місяців. Учасники та доповідачі також набагато більш схильні до分享 контенту відразу після сесії, якщо це легко та виглядає кришенно. Якщо той самий контент прибуває через місяць, це зазвичай надто пізно, щоб стимулювати значиму дистрибуцію, особливо у соціальних мережах. Незабаром реальний час перетворює контент на розширення живого досвіду, а не лише на пост-подійний архів.
Заходи включають декілька зацікавлених сторін: організаторів, доповідачів, спонсорів та учасників. Як Voxo проектує виходи, які служать усім їм без розбавлення інсайту чи якості?
Ми проектуємо з зацікавленої сторони назовні, але зберігаємо одну й ту саму основну правду. Кожен виграє від одного й того самого захопленого контенту, потім ми адаптуємо виходи, щоб відповідати цілям зацікавленої сторони.
Учасники отримують миттєві, поширені підсумки сесій та можливість переглянути сесії, яких вони пропустили. Маркетингові команди отримують спонсор-брендовані активи, які створені для дистрибуції та вимірюваної вплину. Організатори отримують вищу цінність для учасників, довшу імпульс заходу та нові варіанти доходу. Доповідачі отримують один-клік-спосіб для поширення полішеного підсумку, і організатори виграють від цього мережевого ефекту.
Ключовим є те, що ми не розбавляємо якість. Ми будемо одним міцним двигуном контенту, потім упаковувати його по-різному для кожної зацікавленої сторони, залежно від того, що створює справжню цінність.
Заходи, які використовують Voxo, повідомляють про швидшу доставку контенту та вищу участь спонсорів. Що, на вашу думку, має значення більше для досягнення цього впливу: швидкість, структура, якість інсайту?
Це комбінація. Швидкість не має значення, якщо контент не має структури та якості. Водночас, навіть найкращий контент стає менш цінним, якщо він прибуває надто пізно.
Справжня перевага полягає у доставці всіх трьох разом. Високоякісні інсайти, упаковані у чітку структуру, доставлені досить швидко, щоб все ще відчуватися актуальним. Це те, що робить контент корисним, поширеним та комерційно вплинуvim.
Що означає “реальний час” для платформ штучного інтелекту, орієнтованих на контент, протягом наступних кількох років, і наскільки ми близькі до цієї реальності сьогодні?
У деяких випадках справжній реальний час вже тут. Ми доставили реальний час коментарів по декілька живих потоків, наприклад, з NHS у Манчестері миннього літа разом з First Sight Media та Lineup Ninja. Ми також ввели реальні часові досвіди як早 як 2023 року на Techarenan з доповідачами, такими як Аль Гор та Стів Возняк.
Тим не менше, є місце як для майже реального часу, так і для справжнього реального часу на заходах. Найважливіше є те, щоб бути намереним щодо того, що створює цінність. Реальний час словесного хмара, який оновлюється позаду доповідача, може бути більш дистрактивним, ніж корисним. Реальний час повинен підвищувати досвід учасника, а не конкурувати з ним.
Нарешті, яке одне поширене неправильне розуміння про підсумки або транскрипції, створені штучним інтелектом, яке ви регулярно повинні виправляти, коли спілкуєтеся з клієнтами підприємства?
Найбільше неправильне розуміння полягає у тому, що ви можете отримати надійні, послідовні, високоякісні підсумки, просто транскрибуючи аудіофайл та вставляючи його у ChatGPT. Люди також швидко розуміють, що це тривале та важке завдання для підтримання послідовності, особливо коли у вас велика кількість сесій. І навіть тоді транскрипція та підсумування становлять лише невелику частку того, що ми доставляємо. Це, можливо, 5 відсотків. Справжня робота полягає у швидкості, структури, контексті, бренд-готових упаковках, забезпеченні якості та форматах дистрибуції, які роблять контент придатним та цінним у масштабі підприємства.
Дякую за велике інтерв’ю, читачам, які бажають дізнатися більше, повинні відвідати Voxo AI.












