Stummel Jeff Kofman, Gründer und CEO von Trint – Interviewreihe – Unite.AI
Vernetzen Sie sich mit uns

Interviews

Jeff Kofman, Gründer und CEO von Trint – Interview Series

mm
Aktualisiert on

Jeff Kofman ist der Gründer und CEO von Trint, nach einer 30-jährigen Karriere bei ABC, CBS und CBC News, hatte Jeff es satt, immer wieder an die Grenzen der manuellen Transkription zu stoßen und dabei zuzusehen, wie jede Story unnötigerweise ins Stocken geriet. Im Jahr 2014 nutzten Jeff und ein Entwicklerteam KI, um die schwere Arbeit zu erledigen, und Trint war geboren.

Heute ist Trint eine KI-gestützte SaaS-Plattform, die über die Transkription hinausgeht und jede Phase des Content-Erstellungs-Workflows beschleunigt.

Von der Transkription über redaktionelle Tools, die Zusammenarbeit in Echtzeit bis hin zum Exportieren und Veröffentlichen – jeder Schritt wird für Nachrichtenredaktionen, Podcaster, lokale Unternehmen und globale Organisationen einfacher, um Geschichten schneller und einfacher als je zuvor zu teilen.

Sie haben eine herausragende 30-jährige Karriere bei ABC, CBS und CBC News hinter sich. Auf welche Probleme sind Sie bei der traditionellen manuellen Transkription gestoßen?

Als Journalist habe ich jeden Tag den Schmerz der manuellen Transkription erlebt. Lange bevor ich auf die Idee kam, Trint zu erfinden und zu bauen, fragte ich mich, warum es nicht einen besseren Weg gab.

Die manuelle Transkription war immer der Engpass in meinem Arbeitsablauf als Fernsehreporter. Ich gab meine Interviews, hörte einer Pressekonferenz zu, las meine Recherche, schaute mir mein Filmmaterial an und DANN verschwanden mein Produzent und ich im Dunkeln Schwarzes Loch der Transkription.

Ich kann meinen Fernsehnachrichtenbeitrag erst schreiben, wenn ich genaue Abschriften der Zitate oder O-Töne habe, die ich verwenden möchte. Ich muss wissen, was sie gesagt haben und wie lange dieser Kommentar läuft. Das bedeutete, dass wir mit Kopfhörern in einem Vorführraum oder an unseren Schreibtischen saßen und auf PLAY und dann auf PAUSE drückten. Geben Sie dann einige Wörter ein. Dann spiel. PAUSE. Und wiederholen. Es könnte Stunden dauern. So langweilig. So wichtig.

Trint wurde 2014 ins Leben gerufen. Können Sie uns erläutern, wie die Idee entstand?

Ich hätte nie gedacht, dass ich einmal ein Techniker sein würde. Es war nie in meinem Lebensplan. Es geschah zufällig.

Ich hatte ein lockeres Gespräch mit einigen Softwareentwicklern, die 2013 einige rudimentäre Experimente mit Audio und Text (nicht Transkription) durchgeführt hatten.

Ich habe unschuldig gefragt: Warum kann ich meine Interviews nicht mithilfe der automatisierten Sprachausgabe transkribieren?

Ich erinnere mich, dass mich einer der Jungs gefragt hat: Warum willst du das tun?

Ich antwortete: Weil die manuelle Transkription der Schmerzpunkt meiner Arbeit als Reporter ist, verabscheue ich sie.

Wir blieben in Kontakt und machten einige Experimente. Es war schnell klar, dass wir die Zukunft erfunden hatten. Ein Jahr später gab ich meinen Job als Londoner Korrespondent für ABC News auf und wir begannen mit dem Aufbau von Trint.

Was waren damals einige der Herausforderungen bei der Einführung eines Transkriptionsdienstes?

Die automatisierte Transkription ist ein diskretes Problem. Menschen, die den Arbeitsablauf von Reportern und Content-Erstellern nicht leben, haben keine Ahnung, wie sie Geschichten erstellen. Ich erinnere mich, dass ich in der Anfangszeit einige sehr wohlhabende Angel-Investoren getroffen habe und sie einfach nicht verstehen konnten, warum Reporter wie ich Transkripte benötigen. Es bedurfte vieler Erklärungen, um ihnen verständlich zu machen, wie ein Reporter arbeitet.

Ich denke, das ist heute einfacher. Wir sind alle Content-Ersteller.

Welche verschiedenen Algorithmen für maschinelles Lernen werden derzeit bei Trint verwendet?

Wir haben eine superschlaue Truppe von Ingenieuren und Datenwissenschaftlern, die ständig an allem herumbasteln, was sie handhaben können und wo auch immer ihre Fantasie sie hinführt. Wie Sie verstehen, liegt unser Fokus darauf, wie die automatisierte Transkription die Arbeitsabläufe für unsere Medienkunden beschleunigen kann. Das bedeutet, dass wir uns stets auf Sprache, Sprecher, Sprachen und Akustik konzentrieren. NLP- und Sprachverarbeitungsalgorithmen gehören zu unserem Alltag, aber wir werden alle kreativen Möglichkeiten untersuchen, KI zu nutzen, um Journalisten dabei zu helfen, Informationen aus Videos, Audios und Bildern zu extrahieren. Dank der umfassenden Transkription können wir ihren Inhalten mehr Kontext verleihen, alles besser durchsuchbar machen und letztendlich die Momente finden, die wirklich wichtig sind, und sie so schnell wie möglich ihrem Publikum zugänglich machen.

Welche Sprachen werden derzeit angeboten und gibt es Unterschiede in der Transkriptionsqualität zwischen den verschiedenen Sprachen?

Wir bieten etwa 45 Sprachen an, die Sie transkribieren können, und fügen ständig weitere hinzu. Einige befinden sich in der „Beta“-Phase, andere sind viel ausgereifter, was von der Größe der Trainingsdatensätze abhängt, die bei der Erstellung der Modelle helfen. Wir messen ständig die Genauigkeit unserer Modelle für jede Sprache, um unsere Modelle ständig weiterzuentwickeln und ihre Leistung zu verbessern.

Wir prüfen ständig, welche neuen Modelle verfügbar werden, um zu sehen, ob wir sie in unsere sichere ASR-Verarbeitungsumgebung integrieren können.

Aber es geht nicht nur um die Sprachen, die wir transkribieren – unsere Kunden können ihr Transkript auch in fast jede Sprache übersetzen lassen.

Abgesehen von der Transkription ist Trint eine KI-gestützte SaaS-Plattform, die den Workflow bei der Inhaltserstellung verbessern soll. Können Sie einige der anderen angebotenen Tools besprechen?

Obwohl das Herzstück von Trint unsere KI-gestützte Transkription ist, beschäftigen wir uns mit der Frage, warum diese Transkriptionen für unsere Benutzer nützlich sind und wie wir ihnen dabei helfen können, so schnell und einfach wie möglich einen Mehrwert zu schaffen. Das bedeutet, dass wir ein tiefes Verständnis ihrer Arbeitsabläufe haben, damit wir versuchen können, jeden Schritt so reibungslos wie möglich zu gestalten.

Letztendlich möchten wir, dass sie jede Pressekonferenz, jedes Interview oder jede Veranstaltung überall, jederzeit und in jeder Sprache aufzeichnen und während des Geschehens nutzen können. Das bedeutet, dass es für sie oder ihr Team einfacher ist, die Live-Transkription sofort zu überprüfen und zu verwenden – wichtige Zitate Sekunden nach dem Sprechen zu überprüfen, zu teilen und zu übersetzen.

Unsere mobile App ermöglicht dies auch dann, wenn Sie nur ein Telefon bei sich haben, und sorgt dafür, dass auch bei lückenhafter Verbindung alles sicher an Ihr Team übertragen wird.

Unser Story-Builder ist so konzipiert, dass Sie die Schlüsselmomente in all Ihren Inhalten finden und sie in eine neue Erzählung umwandeln können, die in andere wichtige Tools in Ihrem Content-Produktions-Workflow exportiert werden kann. Egal, ob es sich um einen Rohschnitt für die Videobearbeitung, ein Podcast-Transkript oder einen Artikel handelt. Wenn Sie den Text des Audios als Untertitel verwenden müssen, kann Ihnen unser kollaborativer Editor auch dabei helfen.

Sie haben auch einen Podcast mit dem Namen, den Sie persönlich moderieren StoryTech, in dem untersucht wird, wie Technologie Geschichten prägt. Könnten Sie näher erläutern, was dieser Podcast ist, was die Hörer erwarten sollten und warum sie einschalten sollten?

StoryTech ist wirklich die Schnittstelle meiner beiden Karrieren: Reporterin und Tech-Erfinderin. Es geht darum, wie Technologie und Innovation die Art und Weise prägen, wie Geschichten erzählt werden.

In den ersten Episoden geht es darum, wie CGI eingesetzt wurde, um die Eiswand in Game of Thrones zum Einsturz zu bringen, und wie die Erfindung der 35-mm-Leica-Kamera in den 1920er Jahren zur Verbreitung des Fotojournalismus und zur Gründung des LIFE-Magazins führte.

Ich bin fasziniert von den Auswirkungen von Innovationen auf das Geschichtenerzählen. Darum geht es bei StoryTech.

Was ist Ihre Vision für die Zukunft von Trint?

Das ist die Herausforderung, mit der heute jeder Innovator zu kämpfen hat. Wie eröffnet das schnelle Innovationstempo Chancen für mein Produkt?

Unsere Kunden wünschen sich ein Produkt, das einfache, intuitive Effizienz bietet und sich nahtlos in ihren Arbeitsablauf einfügt. Das bedeutet, weit über die Transkription hinauszugehen.

Trint wird KI nutzen, um Dinge zu tun, die noch vor ein paar Jahren unvorstellbar waren: Stimmen, Gesichter, Gefühle, Kontext, Fakten und Unwahrheiten zu identifizieren. Dies geschieht in jeder Sprache – indem aus dieser Sprache übersetzt wird, während sie gesprochen wird. Der Schlüssel liegt darin, dies und noch viel mehr auf eine Weise zu tun, die sich in andere Produkte integrieren lässt, um einen reibungslosen Arbeitsablauf zu schaffen.

Ich glaube nicht, dass Trint Reporter, Autoren und Content-Ersteller ersetzen wird. Es geht darum, sie von der Plackerei ihrer Arbeit zu befreien und ihnen die Möglichkeit zu geben, ihre Zeit auf die Kreativität zu konzentrieren. Es ist spannend, sich die Zukunft vorzustellen. Ich werde nicht lügen: Es ist auch entmutigend.

Vielen Dank für das tolle Interview, Leser, die mehr erfahren möchten, sollten vorbeischauen Trint oder beobachten Sie die StoryTech Podcast.

Ein Gründungspartner von unite.AI und Mitglied der Forbes Technology Council, Antoine ist ein Futurist der sich leidenschaftlich für die Zukunft von KI und Robotik interessiert.

Er ist auch der Gründer von Wertpapiere.io, eine Website, die sich auf Investitionen in bahnbrechende Technologien konzentriert.