Intervjuer
Jeff Kofman, Grunnlegger & CEO av Trint – Intervju-serie

Jeff Kofman er grunnlegger og CEO av Trint. Etter en 30-årig karriere med ABC, CBS og CBC News, ble Jeff lei av å møte veggen av manuell transkripsjon og se hvordan hver historie unødvendig stoppet opp. I 2014 tok Jeff og et team av utviklere i bruk AI for å gjøre det tungeste arbeidet, og Trint ble født.
I dag er Trint en AI-drevet SaaS-plattform som går langt utenfor transkripsjon for å øke hver fase av innholdsskapings-workflowen.
Fra transkripsjon til redigeringsverktøy, sanntids-samarbeid til eksport og publisering – og gjør hver fase enklere for nyhetsredaksjoner, podcastere, lokale bedrifter og globale organisasjoner for å dele historier raskere og enklere enn noensinne.
Du hadde en merittert 30-årig karriere med ABC, CBS og CBC News, hva var noen av problemene du møtte med tradisjonell manuell transkripsjon?
Jeg levde smerten av manuell transkripsjon hver dag som journalist. Langt før jeg fikk ideen om å oppfinne og bygge Trint, lurte jeg på hvorfor det ikke var en bedre måte.
Manuell transkripsjon var alltid flaskenhalen i min arbeidsflyt som TV-reporter. Jeg ville gjøre mine intervjuer, lytte til en pressekonferanse, lese min forskning, se på mine opptak og DERETTER… min produsent og jeg ville forsvinne inn i Black Hole of Transcription.
Jeg kan ikke skrive min TV-nyhetsartikkel før jeg har nøyaktige transkript av sitatene eller lydklippene jeg vil bruke. Jeg må vite hva de sa og hvor lenge det lydklippet varer. Det betød å sitte i en visningsrom eller ved skrivebordet med hodetelefoner på, trykke på AVSPILLING, deretter PAUSE. Deretter skrive noen ord. Deretter AVSPILLING. PAUSE. Og gjenta. Det kunne ta timer. Så kjedelig. Så essensielt.
Trint ble lansert i 2014, kan du diskutere hvordan ideen ble født?
Jeg hadde aldri tenkt at jeg skulle bli en teknologi-mann. Det skjedde ved en tilfeldighet.
Jeg hadde en uformell samtale med noen programvare-utviklere som hadde gjort noen rudimentære eksperimenter med lyd og tekst (ikke transkripsjon) i 2013.
Jeg spurte uskyldig: hvorfor kan jeg ikke bruke automatisert tale-til-tekst for å transkribere mine intervjuer.
Jeg husker at en av guttene spurte meg: hvorfor ville du ønske å gjøre det?
Jeg svarte: fordi manuell transkripsjon er smerten i mitt arbeid som reporter, jeg avskyr det.
Vi holdt kontakten og gjorde noen eksperimenter. Det ble raskt klart at vi hadde oppfunnet fremtiden. Jeg sluttet i jobben min som London-korrespondent for ABC News ett år senere og vi begynte å bygge Trint.
Hva var noen av utfordringene med å lansere en transkripsjonstjeneste i de tidlige dagene?
Automatisert transkripsjon er et diskret problem. Folk som ikke lever i arbeidsflyten til reportere og innholdsskapere, har ingen idé om hvordan de skaper historier. Jeg husker å ha møtt noen meget rike engel-investorer i de tidlige dagene og de forstod ikke hvorfor reportere som meg trenger transkript. Det tok mye forklaring for å få dem til å forstå hvordan en reporter arbeider.
Jeg tror det er enklere i dag. Vi er alle innholdsskapere.
Hva er de forskjellige maskinlærings-algoritmene som for tiden brukes i Trint?
Vi har en super smart gruppe ingeniører og data-vitenskapsmenn som alltid leker med hva de kan være hånd-til-hånd med og hvor deres fantasier kan ta dem. Som du ville forstå, er vårt fokus på hvordan automatisert transkripsjon kan øke arbeidsflyten for våre mediekunder, som betyr at vi alltid arbeider med tale, talere, språk og akustikk. NLP og tale-prosesserings-algoritmer er en del av vår dag-til-dag, men vi vil undersøke kreative måter å bruke AI for å hjelpe journalister med å trekke ut informasjon fra videoer, lyd og bilder. Rich-transkripsjon lar oss gi mer kontekst til deres innhold, gjør det mer søkbart og lar dem finne de øyeblikkene som virkelig betyr noe og få dem ut til deres publikum så raskt som mulig.
Hvilke språk tilbys for tiden, og er det noen forskjeller i transkripsjonskvalitet mellom de forskjellige språkene?
Vi tilbyr omtrent 45 språk som du kan transkribere og legger alltid til flere. Noen er i “beta” og andre som er mye mer modne, som avhenger av størrelsen på trenings-datasett som hjelper med å bygge modellene. Vi måler alltid nøyaktigheten av våre modeller for hvert språk for å kunne utvikle modellene våre og forbedre deres ytelse.
Vi ser alltid på hva nye modeller som blir tilgjengelige for å se om vi kan bringe dem inn i vår sikre ASR-prosesserings-miljø.
Men det er ikke bare om språkene vi transkriberer – våre kunder kan også få transkriptet oversatt til nesten hvilket som helst språk.
Utenom transkripsjon er Trint en AI-drevet SaaS-plattform som er designet for å forbedre innholdsskapings-workflowen, kan du diskutere noen av de andre verktøyene som tilbys?
Selv om hjertet av Trint er vår AI-drevne transkripsjon, er det vi besetter oss med hvorfor disse transkripsjonene er nyttige for våre brukere og hvordan vi kan hjelpe dem med å få verdi så raskt og enkelt som mulig. Det betyr å ha en dyp forståelse av deres arbeidsflyt, så vi kan prøve å gjøre hver fase så sømløs som mulig.
Til slutt vil vi at de skal kunne fange enhver pressekonferanse, intervju eller hendelse hvor som helst, når som helst, på hvilket som helst språk og gjøre bruk av det mens det skjer. Det betyr å gjøre det enkelt for dem eller deres team å verifisere og bruke den live-transkripsjonen mens den skjer – verifisere, dele og oversette nøkkel-sitater sekunder etter de er sagt.
Vår mobil-app betyr at det kan skje selv om du bare har en telefon på deg, og sikrer at alt blir trygt overført til ditt team selv når forbindelsen er dårlig.
Vår Story Builder er designet for å la deg finne de viktigste øyeblikkene i all din innhold og omdanne dem til en ny fortelling som kan eksporteres til andre nøkkel-verktøy i din innholdsskapings-workflow. Uansett om det er en grov klipp for video-redigering, en podcast-transkript eller en artikkel. Hvis du trenger å bruke tekst fra lyden som undertekster, kan vår samarbeids-redaktør hjelpe der også.
Du har også en podcast som du personlig er vert for, kalt StoryTech, som ser på hvordan teknologi former historier. Kan du forklare hva denne podcasten er, hva lyttere kan forvente og hvorfor de bør lytte?
StoryTech er virkelig krysningspunktet mellom mine to karrierer: en reporter og en teknologi-oppfinner. Det ser på hvordan teknologi og innovasjon former måten historier fortelles på.
De tidlige episodene ser på hvordan CGI ble brukt til å bringe ned is-muren i Game of Thrones, og hvordan oppfinnelsen av 35mm Leica-kameraet i 1920-årene ledet til spredningen av foto-journalistikk og skapelsen av LIFE-magasin.
Jeg er fascinert av innvirkningen av innovasjon på fortelling. Det er hva StoryTech handler om.
Hva er din visjon for fremtiden av Trint?
Det er utfordringen hver innovator slåss med i dag. Hvordan åpner den raske innvirkningen av innovasjon muligheter for mitt produkt?
Våre kunder ønsker et produkt som skaper enkle, intuitive effektiviteter som passer sømløst inn i deres arbeidsflyt. Det betyr å gå langt utenfor transkripsjon.
Trint vil bruke AI til å gjøre ting som var utenkelige for bare noen få år siden: identifisere stemmer, ansikter, mening, kontekst, fakta og feil. Dette vil skje på hvilket som helst språk – oversatt fra det språket mens det tales. Nøkkel er å gjøre dette og mye mer på en måte som integrerer i andre produkter for å skape en smertefri arbeidsflyt.
Jeg ser ikke Trint som en erstatning for reportere, skribenter og innholdsskapere. Det handler om å frigjøre dem fra slit og slit i arbeidet og la dem fokusere tiden på kreativitet. Det er spennende å prøve å forestille seg fremtiden. Jeg lyver ikke: det er også skremmende.
Takk for det flotte intervjuet, lesere som ønsker å lære mer bør besøke Trint eller se på StoryTech-podcasten.












