заглушки Джефф Кофман, основатель и генеральный директор Trint – Серия интервью – Unite.AI
Свяжитесь с нами:

Интервью

Джефф Кофман, основатель и генеральный директор Trint – серия интервью

mm
обновленный on

Джефф Кофман, основатель и генеральный директор Trint, после 30-летней карьеры в ABC, CBS и CBC News, Джеффу надоело упираться в стену ручной транскрипции и смотреть, как каждая история без необходимости останавливается на своем пути. В 2014 году Джефф и команда разработчиков использовали ИИ для выполнения тяжелой работы, и родился Тринт.

Сегодня Trint — это SaaS-платформа на базе искусственного интеллекта, которая выходит за рамки транскрипции и ускоряет каждый этап рабочего процесса создания контента.

От транскрипции до редакционных инструментов, совместной работы в режиме реального времени до экспорта и публикации – каждый шаг становится проще для редакций новостей, подкастеров, местных предприятий и глобальных организаций, позволяя делиться историями быстрее и проще, чем когда-либо.

У вас была выдающаяся 30-летняя карьера в ABC, CBS и CBC News. С какими проблемами вы столкнулись при традиционной ручной транскрипции?

Будучи журналистом, я каждый день переживал боль ручной транскрипции. Задолго до того, как у меня возникла идея изобрести и построить Тринт, я задавался вопросом, почему не существует лучшего способа.

Ручная транскрипция всегда была узким местом в моем рабочем процессе как тележурналиста. Я давал интервью, слушал пресс-конференцию, читал свои исследования, смотрел отснятый материал, а ЗАТЕМ... мой продюсер и я исчезали в темноте. Черная дыра транскрипции.

Я не могу писать свой сюжет для теленовостей, пока у меня не будет точных стенограмм цитат или звуковых фрагментов, которые я хочу использовать. Мне нужно знать, что они сказали и как долго длится этот фрагмент. Это означало, что мы сидели в кинозале или за столом в наушниках, нажимали «ВОСПРОИЗВЕСТИ», а затем «ПАУЗУ». Затем введите несколько слов. Тогда ИГРАЙТЕ. ПАУЗА. И повторите. Это может занять несколько часов. Так утомительно. Так важно.

Trint запущен в 2014 году. Можете ли вы рассказать, как родилась эта идея?

Я никогда не думал, что стану технарем. Это никогда не входило в мои жизненные планы. Это произошло случайно.

У меня был случайный разговор с разработчиками программного обеспечения, которые в 2013 году провели элементарные эксперименты со звуком и текстом (не транскрипцией).

Я невинно спросил: почему я не могу использовать автоматическое преобразование речи в текст для расшифровки своих интервью.

Помню, один из парней спросил меня: зачем тебе это делать?

Я ответил: поскольку ручная транскрипция — это болевая точка моей репортерской работы, я ее ненавижу.

Мы поддерживали связь и проводили некоторые эксперименты. Быстро стало ясно, что мы изобрели будущее. Год спустя я оставил работу лондонского корреспондента ABC News, и мы начали строить «Тринт».

Каковы были некоторые трудности при запуске службы транскрипции в те первые дни?

Автоматизированная транскрипция представляет собой отдельную проблему. Люди, которые не живут в рабочем процессе репортеров и создателей контента, понятия не имеют, как они создают истории. Я помню, как в первые дни встретил некоторых очень богатых инвесторов-ангелов, и они просто не могли понять, зачем репортерам вроде меня нужны стенограммы. Им пришлось долго объяснять, чтобы они поняли, как работает репортер.

Думаю, сегодня это проще. Мы все создатели контента.

Какие алгоритмы машинного обучения в настоящее время используются в Тринт?

У нас есть очень умная группа инженеров и специалистов по обработке данных, которые всегда работают над всем, что им под рукой, и куда бы их ни привело их воображение. Как вы понимаете, наше внимание сосредоточено на том, как автоматическая транскрипция может ускорить рабочие процессы для наших клиентов из СМИ, а это означает, что мы всегда работаем с речью, говорящими, языками и акустикой. НЛП и алгоритмы обработки речи являются частью нашей повседневной жизни, но мы будем исследовать любые творческие способы использования ИИ, чтобы помочь журналистам извлекать информацию из видео, аудио и изображений. Богатая транскрипция позволяет нам придать больше контекста их контенту, делает его более доступным для поиска и, в конечном итоге, позволяет им находить действительно важные моменты и как можно быстрее доносить их до своей аудитории.

Какие языки предлагаются в настоящее время и есть ли различия в качестве транскрипции между разными языками?

Мы предлагаем около 45 языков, которые вы можете транскрибировать, и постоянно добавляем новые. Некоторые из них находятся в стадии бета-тестирования, а другие гораздо более зрелые, что зависит от размера наборов обучающих данных, которые помогают строить модели. Мы постоянно измеряем точность наших моделей для каждого языка, чтобы постоянно совершенствовать наши модели и улучшать их производительность.

Мы всегда следим за тем, какие новые модели становятся доступными, чтобы понять, сможем ли мы внедрить их в нашу безопасную среду обработки ASR.

Но дело не только в языках, на которых мы расшифровываем: наши клиенты также могут перевести расшифровку практически на любой язык.

Помимо транскрипции, Trint — это SaaS-платформа на базе искусственного интеллекта, предназначенная для улучшения рабочего процесса создания контента. Можете ли вы обсудить некоторые другие предлагаемые инструменты?

Хотя в основе Trint лежит транскрипция с помощью искусственного интеллекта, мы больше всего озабочены тем, почему эти транскрипции полезны для наших пользователей и как мы можем помочь им получить пользу как можно быстрее и проще. Это означает глубокое понимание их рабочих процессов, чтобы мы могли постараться сделать каждый шаг максимально плавным.

В конечном счете, мы хотим, чтобы они записывали любую пресс-конференцию, интервью или мероприятие где угодно, в любое время, на любом языке и использовали их по мере их возникновения. Это означает, что им или их команде будет проще проверять и использовать живую транскрипцию по мере ее возникновения — проверку, обмен и перевод ключевых цитат через несколько секунд после их произнесения.

Наше мобильное приложение означает, что это может произойти, даже если у вас есть только телефон, и гарантирует, что все данные будут безопасно переданы вашей команде, даже если соединение нестабильно.

Наши Строитель историй разработан, чтобы позволить вам находить ключевые моменты во всем вашем контенте и превращать их в новое повествование, которое можно экспортировать в другие ключевые инструменты рабочего процесса создания контента. Будь то черновой монтаж видео, стенограмма подкаста или статья. Если вам нужно использовать текст аудио в качестве подписей, наш совместный редактор также может помочь в этом.

У вас также есть подкаст, который вы лично ведете, под названием СториТех, в котором рассматривается, как технологии формируют истории. Не могли бы вы рассказать, что это за подкаст, чего следует ожидать слушателям и почему им стоит его слушать?

StoryTech на самом деле представляет собой пересечение двух моих карьер: репортера и изобретателя технологий. В нем рассматривается, как технологии и инновации влияют на способ рассказывания историй.

В первых эпизодах рассказывается о том, как компьютерная графика использовалась для разрушения ледяной стены в «Игре престолов» и как изобретение 35-миллиметровой камеры Leica в 1920-х годах привело к распространению фотожурналистики и созданию журнала LIFE.

Меня восхищает влияние инноваций на повествование. В этом и заключается суть StoryTech.

Каким вы видите будущее Тринта?

Это проблема, с которой сегодня сталкивается каждый новатор. Как быстрый темп инноваций открывает возможности для моего продукта?

Нашим клиентам нужен продукт, который обеспечивает простые, интуитивно понятные функции, которые органично вписываются в их рабочий процесс. Это означает выход далеко за рамки транскрипции.

Тринт будет использовать ИИ для того, чтобы делать то, что было невообразимо всего несколько лет назад: распознавать голоса, лица, настроения, контекст, факты и ложь. Это произойдет на любом языке – при переводе с этого языка так, как на нем говорят. Главное — сделать это и многое другое таким образом, чтобы это можно было интегрировать в другие продукты и создать единый безболезненный рабочий процесс.

Я не вижу, чтобы Тринт заменил репортеров, писателей и создателей контента. Речь идет об освобождении их от рутинной работы и предоставлении им возможности сосредоточить свое время на творчестве. Интересно попытаться представить будущее. Не буду врать: это еще и утомительно.

Спасибо за отличное интервью, читатели, которые хотят узнать больше, должны посетить Trint или смотреть СториТех подкаст.

Партнер-основатель unite.AI и член Технологический совет Форбс, Антуан - это футурист который увлечен будущим искусственного интеллекта и робототехники.

Он также является основателем Ценные бумаги.io, веб-сайт, посвященный инвестициям в прорывные технологии.