interviste
Jeff Kofman, fondatore e CEO di Trint – Serie di interviste

Jeff Kofman, fondatore e CEO di Trint, dopo una carriera trentennale con ABC, CBS e CBC News, si è stancato di sbattere contro il muro della trascrizione manuale e di vedere ogni notizia interrompersi inutilmente. Nel 30, Jeff e un team di sviluppatori hanno sfruttato l'intelligenza artificiale per fare il lavoro pesante, e così è nato Trint.
Oggi Trint è una piattaforma SaaS basata sull'intelligenza artificiale che va oltre la trascrizione per potenziare ogni fase del flusso di lavoro di creazione di contenuti.
Dalla trascrizione agli strumenti editoriali, dalla collaborazione in tempo reale all'esportazione e alla pubblicazione, rendendo ogni passaggio più semplice per redazioni, podcaster, aziende locali e organizzazioni globali per condividere storie più velocemente e più facilmente che mai.
Hai avuto una brillante carriera di 30 anni con ABC, CBS e CBC News, quali sono stati alcuni dei problemi che hai riscontrato con la tradizionale trascrizione manuale?
Ho vissuto ogni giorno il dolore della trascrizione manuale come giornalista. Molto prima che mi venisse l'idea di inventare e costruire Trint, mi chiedevo perché non esistesse un modo migliore.
La trascrizione manuale è sempre stata il collo di bottiglia nel mio flusso di lavoro come reporter televisivo. Facevo le mie interviste, ascoltavo una conferenza stampa, leggevo le mie ricerche, guardavo i miei filmati e POI... io e il mio produttore sparivamo nel nulla Buco nero della trascrizione.
Non posso scrivere il mio telegiornale televisivo finché non avrò le trascrizioni precise delle citazioni o dei brani che voglio utilizzare. Devo sapere cosa hanno detto e quanto dura quella frase. Ciò significava sedersi in una sala di proiezione o alla nostra scrivania con le cuffie, premere PLAY e poi PAUSA. Quindi digita alcune parole. Quindi GIOCA. PAUSA. E ripeti. Potrebbero volerci ore. Così noioso. Così essenziale.
Trint è stato lanciato nel 2014, puoi raccontarci come è nata l'idea?
Non avrei mai immaginato di essere un tecnico. Non è mai stato nel mio progetto di vita. È successo per caso.
Ho avuto una conversazione casuale con alcuni sviluppatori di software che avevano fatto alcuni esperimenti rudimentali con audio e testo (non con la trascrizione) nel 2013.
Ho chiesto innocentemente: perché non posso utilizzare la sintesi vocale automatizzata per trascrivere le mie interviste.
Ricordo che uno dei ragazzi mi chiese: perché vorresti farlo?
Ho risposto: poiché la trascrizione manuale è il punto dolente del mio lavoro di reporter, la detesto.
Siamo rimasti in contatto e abbiamo fatto alcuni esperimenti. È diventato subito chiaro che avevamo inventato il futuro. Un anno dopo lasciai il mio lavoro come corrispondente da Londra per ABC News e iniziammo a costruire Trint.
Quali erano alcune delle sfide legate al lancio di un servizio di trascrizione in quei primi giorni?
La trascrizione automatizzata è un problema discreto. Le persone che non vivono il flusso di lavoro di reporter e creatori di contenuti non hanno idea di come creano storie. Ricordo di aver incontrato alcuni angel investor molto ricchi nei primi giorni e non riuscivano a capire perché i giornalisti come me avessero bisogno delle trascrizioni. Ci sono volute molte spiegazioni per far loro capire come lavora un giornalista.
Penso che oggi sia più facile. Siamo tutti creatori di contenuti.
Quali sono i diversi algoritmi di machine learning attualmente utilizzati in Trint?
Abbiamo un gruppo super intelligente di ingegneri e data scientist che armeggiano sempre con qualunque cosa abbiano a portata di mano e ovunque la loro immaginazione possa portarli. Come capirai, il nostro focus è su come la trascrizione automatizzata può accelerare i flussi di lavoro per i nostri clienti nel settore dei media, il che significa che lavoriamo sempre attorno al parlato, agli oratori, alle lingue e all'acustica. Gli algoritmi di PNL e di elaborazione vocale fanno parte della nostra quotidianità, ma esploreremo eventuali modi creativi per utilizzare l'intelligenza artificiale per aiutare i giornalisti a estrarre informazioni da video, audio e immagini. La ricca trascrizione ci consente di dare più contesto ai loro contenuti, rendendoli tutti più ricercabili e, infine, consente loro di trovare i momenti che contano davvero e di presentarli al loro pubblico il più rapidamente possibile.
Quali lingue sono attualmente offerte e ci sono differenze nella qualità della trascrizione tra le diverse lingue?
Offriamo circa 45 lingue che puoi trascrivere e ne aggiungiamo sempre di più. Alcuni sono in “beta” e altri sono molto più maturi, il che dipende dalla dimensione dei set di dati di addestramento che aiutano a costruire i modelli. Misuriamo costantemente l'accuratezza dei nostri modelli per ciascuna lingua per sviluppare costantemente i nostri modelli e migliorarne le prestazioni.
Osserviamo costantemente quali nuovi modelli stanno diventando disponibili per vedere se possiamo inserirli nel nostro ambiente di elaborazione ASR sicuro.
Ma non si tratta solo delle lingue che trascriviamo: i nostri clienti possono anche far tradurre la trascrizione in quasi tutte le lingue.
Al di fuori della trascrizione, Trint è una piattaforma SaaS basata sull'intelligenza artificiale progettata per migliorare il flusso di lavoro di creazione di contenuti, puoi parlare di alcuni degli altri strumenti offerti?
Sebbene al centro di Trint ci sia la nostra trascrizione basata sull'intelligenza artificiale, ciò che ci ossessiona è il motivo per cui tali trascrizioni sono utili ai nostri utenti e come possiamo aiutarli a ottenere valore nel modo più rapido e semplice possibile. Ciò significa avere una conoscenza approfondita dei loro flussi di lavoro, in modo da poter provare a rendere ogni passaggio il più fluido possibile.
In definitiva, vogliamo che catturino qualsiasi conferenza stampa, intervista o evento ovunque, in qualsiasi momento, in qualsiasi lingua e lo utilizzino mentre accade. Ciò significa rendere più semplice per loro o per il loro team verificare e utilizzare la trascrizione in tempo reale, verificando, condividendo e traducendo le citazioni chiave pochi secondi dopo che sono state pronunciate.
La nostra app mobile fa sì che ciò possa accadere anche se hai solo un telefono con te e garantisce che tutto venga trasmesso in modo sicuro al tuo team anche quando la connessione è discontinua.
Costruttore di storie è progettato per consentirti di trovare i momenti chiave in tutti i tuoi contenuti e trasformarli in una nuova narrativa che può essere esportata in altri strumenti chiave nel flusso di lavoro di produzione dei contenuti. Che si tratti di un montaggio preliminare per l'editing video, di una trascrizione di un podcast o di un articolo. Se hai bisogno di utilizzare il testo dell'audio come didascalie, il nostro editor collaborativo può aiutarti anche in questo caso.
Hai anche un podcast chiamato che ospiti personalmente StoriaTech, che esamina il modo in cui la tecnologia modella le storie. Potresti spiegare cos'è questo podcast, cosa dovrebbero aspettarsi gli ascoltatori e perché dovrebbero sintonizzarsi?
StoryTech è davvero l'intersezione delle mie due carriere: reporter e inventore tecnologico. Esamina come la tecnologia e l'innovazione modellano il modo in cui le storie vengono raccontate.
I primi episodi mostrano come è stata utilizzata la CGI per abbattere il muro di ghiaccio in Game of Thrones e come l'invenzione della fotocamera Leica da 35 mm negli anni '1920 ha portato alla diffusione del fotogiornalismo e alla creazione della rivista LIFE.
Sono affascinato dall'impatto dell'innovazione sulla narrazione. Questo è ciò di cui parla StoryTech.
Qual è la tua visione per il futuro di Trint?
Questa è la sfida con cui ogni innovatore si confronta oggi. In che modo il ritmo veloce dell’innovazione apre nuove opportunità per il mio prodotto?
I nostri clienti desiderano un prodotto che crei efficienza semplice e intuitiva che si adatti perfettamente al loro flusso di lavoro. Ciò significa andare ben oltre la trascrizione.
Trint sfrutterà l’intelligenza artificiale per fare cose inimmaginabili solo pochi anni fa: identificare voci, volti, sentimenti, contesto, fatti e falsità. Ciò accadrà in qualsiasi lingua, traducendo da quella lingua così come viene parlata. La chiave è fare questo e molto altro ancora in un modo che si integri in altri prodotti per creare un flusso di lavoro indolore.
Non vedo Trint sostituire giornalisti, scrittori e creatori di contenuti. Si tratta di liberarli dalla fatica del loro lavoro e permettere loro di concentrare il loro tempo sulla creatività. È emozionante provare a immaginare il futuro. Non mentirò: è anche scoraggiante.
Grazie per la fantastica intervista, i lettori che desiderano saperne di più dovrebbero visitare Trint o guardare il StoriaTech podcast.












