talon Jeff Kofman, fondateur et PDG de Trint - Série d'interviews - Unite.AI
Suivez nous sur

Interviews

Jeff Kofman, fondateur et PDG de Trint – Série d'entretiens

mm
Le kit de préparation mis à jour on

Jeff Kofman, est le fondateur et PDG de Trint, après une carrière de 30 ans chez ABC, CBS et CBC News, Jeff en a eu assez de se heurter au mur de la transcription manuelle et de regarder chaque histoire s'arrêter inutilement dans son élan. En 2014, Jeff et une équipe de développeurs ont exploité l’IA pour faire le gros du travail, et Trint est né.

Aujourd'hui, Trint est une plate-forme SaaS basée sur l'IA qui va au-delà de la transcription pour dynamiser chaque étape du flux de création de contenu.

De la transcription aux outils éditoriaux, en passant par la collaboration en temps réel jusqu'à l'exportation et la publication, chaque étape permet aux salles de rédaction, aux podcasteurs, aux entreprises locales et aux organisations mondiales de partager des histoires plus rapidement et plus facilement que jamais.

Vous avez mené une brillante carrière de 30 ans chez ABC, CBS et CBC News. Quels ont été les problèmes que vous avez rencontrés avec la transcription manuelle traditionnelle ?

J'ai vécu chaque jour la douleur de la transcription manuelle en tant que journaliste. Bien avant d'avoir l'idée d'inventer et de construire Trint, je me demandais pourquoi il n'y avait pas une meilleure solution.

La transcription manuelle a toujours été le goulot d'étranglement dans mon flux de travail en tant que journaliste de télévision. Je faisais mes interviews, écoutais une conférence de presse, lisais mes recherches, regardais mes images et ALORS… mon producteur et moi disparaissions dans le monde. Trou noir de la transcription.

Je ne peux pas écrire mon reportage télévisé tant que je n'ai pas de transcriptions précises des citations ou des extraits sonores que je souhaite utiliser. J'ai besoin de savoir ce qu'ils ont dit et combien de temps dure cette phrase. Cela signifiait s'asseoir dans une salle de projection ou à notre bureau avec des écouteurs, appuyer sur PLAY puis PAUSE. Tapez ensuite quelques mots. Puis JOUER. PAUSE. Et répétez. Cela pourrait prendre des heures. Tellement fastidieux. Tellement essentiel.

Trint a été lancé en 2014, pouvez-vous nous expliquer comment l'idée est née ?

Je n'aurais jamais imaginé que je serais un technicien. Cela n’a jamais fait partie de mon projet de vie. C'est arrivé par hasard.

J'ai eu une conversation informelle avec des développeurs de logiciels qui avaient réalisé des expériences rudimentaires avec l'audio et le texte (pas de transcription) en 2013.

J'ai innocemment demandé : pourquoi ne puis-je pas utiliser la synthèse vocale automatisée pour transcrire mes entretiens.

Je me souviens qu'un des gars m'a demandé : pourquoi voudriez-vous faire ça ?

J'ai répondu : parce que la transcription manuelle est le point sensible de mon travail de journaliste, je la déteste.

Nous sommes restés en contact et avons fait quelques expériences. Il est vite devenu évident que nous avions inventé le futur. J'ai quitté mon emploi de correspondant à Londres pour ABC News un an plus tard et nous avons commencé à construire Trint.

Quels ont été les défis liés au lancement d’un service de transcription à ces débuts ?

La transcription automatisée est un problème discret. Les personnes qui ne suivent pas le flux de travail des journalistes et des créateurs de contenu n'ont aucune idée de la manière dont ils créent des histoires. Je me souviens avoir rencontré des investisseurs providentiels très riches au début et ils ne comprenaient tout simplement pas pourquoi les journalistes comme moi avaient besoin de transcriptions. Il a fallu beaucoup d’explications pour leur faire comprendre le fonctionnement d’un journaliste.

Je pense que c'est plus facile aujourd'hui. Nous sommes tous des créateurs de contenu.

Quels sont les différents algorithmes de machine learning actuellement utilisés chez Trint ?

Nous avons un groupe d’ingénieurs et de data scientists super intelligents qui sont toujours en train de bricoler tout ce qu’ils peuvent utiliser et là où leur imagination peut les mener. Comme vous l'aurez compris, nous nous concentrons sur la manière dont la transcription automatisée peut accélérer les flux de travail de nos clients médias, ce qui signifie que nous travaillons toujours autour de la parole, des locuteurs, des langues et de l'acoustique. Les algorithmes de PNL et de traitement de la parole font partie de notre quotidien, mais nous étudierons toutes les façons créatives d'utiliser l'IA pour aider les journalistes à extraire des informations à partir de vidéos, d'audios et d'images. Une transcription riche nous permet de donner plus de contexte à leur contenu, de le rendre plus consultable et, en fin de compte, de leur permettre de trouver les moments qui comptent vraiment et de les diffuser à leur public le plus rapidement possible.

Quelles langues sont actuellement proposées et existe-t-il des différences de qualité de transcription entre les différentes langues ?

Nous proposons environ 45 langues que vous pouvez transcrire et nous en ajoutons toujours davantage. Certains sont en « version bêta » et d’autres sont beaucoup plus matures, ce qui dépend de la taille des ensembles de données de formation qui aident à construire les modèles. Nous mesurons constamment la précision de nos modèles pour chaque langue afin de développer constamment nos modèles et d'améliorer leurs performances.

Nous étudions toujours les nouveaux modèles qui deviennent disponibles pour voir si nous pouvons les intégrer dans notre environnement de traitement ASR sécurisé.

Mais il ne s'agit pas seulement des langues que nous transcrivons : nos clients peuvent également faire traduire cette transcription dans presque toutes les langues.

En dehors de la transcription, Trint est une plate-forme SaaS basée sur l'IA conçue pour améliorer le flux de travail de création de contenu. Pouvez-vous discuter de certains des autres outils proposés ?

Bien que notre transcription basée sur l'IA soit au cœur de Trint, nous sommes obsédés par la raison pour laquelle ces transcriptions sont utiles à nos utilisateurs et par la manière dont nous pouvons les aider à obtenir de la valeur aussi rapidement et facilement que possible. Cela signifie avoir une compréhension approfondie de leurs flux de travail, afin que nous puissions essayer de rendre chaque étape aussi fluide que possible.

En fin de compte, nous voulons qu'ils capturent n'importe quelle conférence de presse, interview ou événement n'importe où, à tout moment, dans n'importe quelle langue et qu'ils les utilisent au fur et à mesure qu'ils se produisent. Cela signifie qu'il est facile pour eux ou leur équipe de vérifier et d'utiliser la transcription en direct au fur et à mesure - en vérifiant, partageant et traduisant les citations clés quelques secondes après leur prononciation.

Notre application mobile signifie que cela peut se produire même si vous n'avez qu'un téléphone sur vous et garantit que tout est transmis en toute sécurité à votre équipe, même lorsque la connexion est inégale.

Notre Constructeur d'histoires est conçu pour vous permettre de trouver les moments clés de tout votre contenu et de les transformer en un nouveau récit pouvant être exporté vers d'autres outils clés de votre flux de production de contenu. Qu'il s'agisse d'un premier montage pour le montage vidéo, d'une transcription de podcast ou d'un article. Si vous devez utiliser le texte de l'audio comme légende, notre éditeur collaboratif peut également vous aider.

Vous disposez également d'un podcast que vous hébergez personnellement et qui s'appelle HistoireTech, qui examine comment la technologie façonne les histoires. Pourriez-vous nous expliquer ce qu'est ce podcast, à quoi les auditeurs doivent s'attendre et pourquoi ils devraient l'écouter ?

StoryTech est vraiment l'intersection de mes deux carrières : journaliste et inventeur technologique. Il examine comment la technologie et l’innovation façonnent la façon dont les histoires sont racontées.

Les premiers épisodes montrent comment CGI a été utilisé pour faire tomber le mur de glace dans Game of Thrones et comment l'invention de l'appareil photo Leica 35 mm dans les années 1920 a conduit à la diffusion du photojournalisme et à la création du magazine LIFE.

Je suis fasciné par l'impact de l'innovation sur la narration. C'est à cela que sert StoryTech.

Quelle est votre vision pour l’avenir de Trint ?

C’est le défi auquel tout innovateur est confronté aujourd’hui. Comment le rythme rapide de l’innovation ouvre-t-il des opportunités pour mon produit ?

Nos clients veulent un produit qui crée des efficacités simples et intuitives qui s'intègrent parfaitement à leur flux de travail. Cela signifie aller bien au-delà de la transcription.

Trint exploitera l’IA pour accomplir des choses qui étaient inimaginables il y a seulement quelques années : identifier les voix, les visages, les sentiments, le contexte, les faits et les mensonges. Cela se produira dans n'importe quelle langue – en traduisant cette langue telle qu'elle est parlée. La clé est de faire cela et bien plus encore d’une manière qui s’intègre à d’autres produits pour créer un flux de travail indolore.

Je ne vois pas Trint remplacer les journalistes, les écrivains et les créateurs de contenu. Il s’agit de les libérer de la pénibilité de leur travail et de leur permettre de consacrer leur temps à la créativité. C'est passionnant d'essayer d'imaginer l'avenir. Je ne vais pas mentir : c'est aussi intimidant.

Merci pour cette excellente interview, les lecteurs qui souhaitent en savoir plus devraient visiter Trint ou regarder la HistoireTech podcast.

Partenaire fondateur d'unite.AI et membre du Conseil technologique de Forbes, Antoine est un futuriste qui est passionné par l'avenir de l'IA et de la robotique.

Il est également le fondateur de Titres.io, un site Web axé sur l'investissement dans les technologies de rupture.