インタビュー
Jeff Kofman, Trintの創設者&CEO – インタビュー・シリーズ

Jeff Kofmanは、ABC、CBS、CBC Newsでの30年のキャリアを経て、Trintの創設者&CEOです。ジェフは、手動での文字起こしの壁に当たるのをやりたくなくなり、2014年に開発チームと共にAIを利用してTrintを立ち上げました。
今日、Trintは、コンテンツの作成ワークフローを強化するために、文字起こしを超えたAIパワードのSaaSプラットフォームです。
文字起こしから編集ツール、リアルタイムコラボレーションからエクスポートおよび公開まで、毎ステップを容易にし、ニュースルーム、ポッドキャスター、地元のビジネス、グローバル組織が物語をより速く簡単に共有できるようにしています。
あなたはABC、CBS、CBC Newsでの30年のキャリアを経てきましたが、伝統的な手動文字起こしで直面した問題は何でしたか?
私は毎日、ジャーナリストとして手動文字起こしの痛みを体験しました。Trintを発明し、構築するというアイデアを持つ前から、より良い方法がないのかと疑問に思っていました。
手動文字起こしは、私のワークフローにおけるボトルネックでした。インタビューを収録し、ニュース会見議事録を読み、研究資料を調べ、映像を確認し、その後…私のプロデューサーと私は文字起こしのブラックホールに没入していました。
私は、使いたい引用文やサウンドバイトの正確な文字起こしを持たなければなりません。何を言ったのか、どのくらいの長さのサウンドバイトなのかを知る必要があります。そのためには、スクリーンルームや机でヘッドフォンをして、PLAYを押してPAUSEを押して、文字を入力して、PLAYを押してPAUSEを押して、繰り返す必要がありました。数時間かかることがありました。退屈で、しかも必要です。
Trintは2014年に立ち上げられましたが、アイデアの誕生について話してください。
私は、テクノロジーに関わることを想定していませんでした。偶然の結果でした。
2013年に、私はソフトウェア開発者たちと会い、オーディオとテキスト(文字起こしではありません)に関する初歩的な実験を行いました。
私は、無邪気に質問しました。なぜ自動音声テキストを使用してインタビューを文字起こしできないのか。
私は、一人の開発者が私に聞いたことを覚えています。なぜそんなことをしたいのか。
私は答えました。手動文字起こしが私の仕事における痛み点だからです。
私たちは連絡を取り合い、実験を行いました。すぐに、私たちが未来を発明したことが明らかになりました。私は、ABCニュースのロンドン特派員としての仕事を辞め、Trintの構築を始めました。
立ち上げ当初のTrintの課題について話してください。
自動文字起こしは、離れた問題です。リポーターとコンテンツクリエイターのワークフローに身を置いていない人々は、物語がどのように作られるのかを理解していません。初期の頃、私は非常に富裕なエンジェル投資家たちと会いましたが、彼らは、私のようなリポーターが文字起こしを必要とする理由を理解できませんでした。彼らに理解してもらうために、多くの説明をしました。
私は、それが今日ではより簡単であると思います。私たちはみんなコンテンツクリエイターです。
現在、Trintで使用されているさまざまな機械学習アルゴリズムについて説明してください。
私たちは、非常に優秀なエンジニアとデータサイエンティストを擁しています。彼らは、手がけることができるものや、想像力が及ぶ限り、常に実験しています。私の焦点は、自動文字起こしがメディア顧客のワークフローをどのように高速化できるかです。つまり、私たちは常に音声、話者、言語、音響について取り組んでいます。NLPや音声処理アルゴリズムは、私たちの日常的一部です。しかし、私たちは、ジャーナリストがビデオ、オーディオ、画像から情報を抽出するのを支援するためのAIの創造的な方法を探究します。リッチ文字起こしにより、私たちはコンテンツにさらに多くのコンテキストを提供し、それらをより検索可能にし、最終的に、最も重要な瞬間を見つけて、聴衆にできるだけ早く提示することができます。
現在、どの言語が提供されており、さまざまな言語間で文字起こしの品質に違いはありますか?
私たちは約45の言語を提供していますが、常に追加しています。いくつかの言語は「ベータ版」ですが、他の言語はより成熟しています。これは、モデルの構築に役立つトレーニングデータセットのサイズに依存します。私たちは、各言語のモデルの精度を常に測定し、モデルの開発とパフォーマンスの向上に努めています。
私たちは、新しいモデルが利用可能になるたびに、それらを私たちのセキュアなASR処理環境に取り入れる方法を探究しています。
しかし、それは私たちが提供する言語だけではありません。私たちの顧客は、文字起こしをほぼどの言語にも翻訳することができます。
文字起こし以外に、Trintはコンテンツ作成ワークフローを改善するために設計されたAIパワードのSaaSプラットフォームです。提供されている他のツールについて説明してください。
Trintの核となるのは、私たちのAIパワード文字起こしですが、私たちが執念しているのは、それらの文字起こしが私たちのユーザーにとってどのように有用であるか、そして私たちがどのようにしてそれらの価値をできるだけ迅速かつ簡単に提供できるかです。つまり、私たちが彼らのワークフローを深く理解し、毎ステップを可能な限りシームレスにする必要があります。
最終的には、私たちが会見、インタビュー、イベントをどこで、いつ、どの言語で収録し、それを利用できるようにすることを目指しています。つまり、ライブ文字起こしが起こるにつれて、それを検証し、共有し、翻訳することが容易になる必要があります。
私たちのモバイルアプリにより、それが起こります。つまり、電話だけがあれば、チームにすべてを安全に転送できます。
私たちのStory Builderは、あなたのすべてのコンテンツの中で重要な瞬間を見つけて、新しい物語を作成し、それをあなたのコンテンツ制作ワークフローで使用するための重要なツールにエクスポートするように設計されています。ビデオ編集のラフカット、ポッドキャスト文字起こし、記事などです。如果、あなたがオーディオのテキストをキャプションとして使用する必要がある場合、私たちのコラボレーションエディターはそこで役立ちます。
あなたは、StoryTechというポッドキャストをホストしています。これは、テクノロジーが物語をどのように形作るかを探究しています。ポッドキャストについて説明し、リスナーが何を期待するべきか、そしてなぜそれを聞くべきかについて説明してください。
StoryTechは、私の2つのキャリアの交差点です。リポーターとテクノロジー発明者です。テクノロジーとイノベーションが物語をどのように形作るかを探究しています。
初期のエピソードでは、Game of Thronesで氷の壁を下ろすためにCGIがどのように使用されたか、1920年代に35mmライカカメラが発明され、フォトジャーナリズムが広まり、LIFE誌が創刊されたことを探究しています。
私は、イノベーションが物語に与える影響に魅了されています。StoryTechはそれについてです。
Trintの将来のビジョンは何ですか?
それが、今日のイノベーターが格闘している課題です。イノベーションの迅速なペースが、私の製品にどのような機会をもたらすのか。
私たちの顧客は、ワークフローにシームレスに統合されるシンプルで直感的な効率性を生み出す製品を求めています。つまり、文字起こしを超えることです。
Trintは、AIを利用して、数年前では想像できなかったことを実現します。声、顔、センチメント、コンテキスト、事実、虚偽を識別します。これは、どの言語でも、翻訳されながら行われます。重要な点は、これらを実現し、さらに多くのことを行い、それらを他の製品に統合して、痛みのないワークフローを作成することです。
私は、Trintがリポーター、ライター、コンテンツクリエイターを置き換えることを見ています。彼らを仕事の苦労から解放し、創造性に集中できる時間を与えることです。将来を想像することは、興奮します。しかしそれは、同時に、難しい課題でもあります。
素晴らしいインタビュー、ありがとうございます。TrintやStoryTechポッドキャストについてもっと知りたい読者は、こちらを訪問してください。












