talón Jeff Kofman, fundador y director ejecutivo de Trint - Serie de entrevistas - Unite.AI
Contáctanos

Entrevistas

Jeff Kofman, fundador y director ejecutivo de Trint - Serie de entrevistas

mm
Actualizado on

Jeff Kofman, es el fundador y director ejecutivo de Trint, después de una carrera de 30 años en ABC, CBS y CBC News, Jeff se cansó de chocar contra el muro de la transcripción manual y ver cómo cada historia se detenía innecesariamente en seco. En 2014, Jeff y un equipo de desarrolladores aprovecharon la IA para hacer el trabajo pesado y nació Trint.

Hoy Trint es una plataforma SaaS impulsada por IA que va más allá de la transcripción para impulsar cada etapa del flujo de trabajo de creación de contenido.

Desde la transcripción hasta las herramientas editoriales, la colaboración en tiempo real hasta la exportación y la publicación, lo que facilita cada paso para que las salas de redacción, los podcasters, las empresas locales y las organizaciones globales compartan historias de forma más rápida y sencilla que nunca.

Tuvo una distinguida carrera de 30 años en ABC, CBS y CBC News. ¿Cuáles fueron algunos de los problemas que encontró con la transcripción manual tradicional?

Viví el dolor de la transcripción manual todos los días como periodista. Mucho antes de que se me ocurriera la idea de inventar y construir Trint, me preguntaba por qué no había una manera mejor.

La transcripción manual siempre fue el cuello de botella en mi flujo de trabajo como reportero de televisión. Hacía mis entrevistas, escuchaba una conferencia de prensa, leía mi investigación, miraba mis imágenes y ENTONCES... mi productor y yo desaparecíamos en el Agujero negro de la transcripción.

No puedo escribir mi noticia de televisión hasta que tenga transcripciones precisas de las citas o fragmentos de sonido que quiero utilizar. Necesito saber qué dijeron y cuánto dura ese fragmento. Eso significaba sentarnos en una sala de proyección o en nuestros escritorios con los auriculares puestos, presionar REPRODUCIR y luego PAUSAR. Luego escribe algunas palabras. Entonces JUEGA. PAUSA. Y repetir. Podría llevar horas. Tan tedioso. Tan esencial.

Trint se lanzó en 2014, ¿puedes contarnos cómo nació la idea?

Nunca imaginé que sería un técnico. Nunca estuvo en mi plan de vida. Sucedió por casualidad.

Tuve una conversación informal con algunos desarrolladores de software que habían realizado algunos experimentos rudimentarios con audio y texto (no transcripción) en 2013.

Pregunté inocentemente: ¿por qué no puedo utilizar la conversión de voz a texto automatizada para transcribir mis entrevistas?

Recuerdo que uno de los chicos me preguntó: ¿por qué querrías hacer eso?

Respondí: debido a que la transcripción manual es el punto débil de mi trabajo como reportero, la detesto.

Nos mantuvimos en contacto e hicimos algunos experimentos. Rápidamente quedó claro que habíamos inventado el futuro. Dejé mi trabajo como corresponsal de ABC News en Londres un año después y comenzamos a construir Trint.

¿Cuáles fueron algunos de los desafíos de lanzar un servicio de transcripción en aquellos primeros días?

La transcripción automatizada es un problema discreto. Las personas que no viven el flujo de trabajo de los reporteros y creadores de contenido no tienen idea de cómo crean historias. Recuerdo haber conocido a algunos inversores ángeles muy ricos en los primeros días y simplemente no podían entender por qué los periodistas como yo necesitan transcripciones. Fueron necesarias muchas explicaciones para que entendieran cómo trabaja un periodista.

Creo que hoy es más fácil. Todos somos creadores de contenido.

¿Cuáles son los diferentes algoritmos de aprendizaje automático que se utilizan actualmente en Trint?

Contamos con un grupo de ingenieros y científicos de datos súper inteligentes que siempre están jugando con todo lo que pueden hacer y dondequiera que su imaginación los lleve. Como comprenderá, nos centramos en cómo la transcripción automatizada puede acelerar los flujos de trabajo para nuestros clientes de medios, lo que significa que siempre trabajamos en torno al habla, los hablantes, los idiomas y la acústica. La PNL y los algoritmos de procesamiento del habla son parte de nuestro día a día, pero investigaremos formas creativas de utilizar la IA para ayudar a los periodistas a extraer información de vídeos, audios e imágenes. La transcripción enriquecida nos permite dar más contexto a su contenido, hace que sea más fácil de buscar y, en última instancia, les permite encontrar los momentos que realmente importan y difundirlos ante su audiencia lo más rápido posible.

¿Qué idiomas se ofrecen actualmente? ¿Existen diferencias en la calidad de la transcripción entre los distintos idiomas?

Ofrecemos alrededor de 45 idiomas que puede transcribir y siempre estamos agregando más. Algunos están en “beta” y otros son mucho más maduros, lo que depende del tamaño de los conjuntos de datos de entrenamiento que ayudan a construir los modelos. Medimos constantemente la precisión de nuestros modelos para cada idioma para desarrollar constantemente nuestros modelos y mejorar su rendimiento.

Siempre estamos analizando qué nuevos modelos están disponibles para ver si podemos incorporarlos a nuestro entorno seguro de procesamiento ASR.

Pero no se trata solo de los idiomas que transcribimos: nuestros clientes también pueden traducir esa transcripción a casi cualquier idioma.

Además de la transcripción, Trint es una plataforma SaaS impulsada por IA que está diseñada para mejorar el flujo de trabajo de creación de contenido. ¿Puede hablarnos sobre algunas de las otras herramientas que se ofrecen?

Aunque el núcleo de Trint es nuestra transcripción impulsada por IA, lo que nos obsesiona es por qué esas transcripciones son útiles para nuestros usuarios y cómo podemos ayudarlos a obtener valor de la manera más rápida y sencilla posible. Eso significa tener un conocimiento profundo de sus flujos de trabajo, para que podamos intentar que cada paso sea lo más fluido posible.

En última instancia, queremos que capturen cualquier conferencia de prensa, entrevista o evento en cualquier lugar, en cualquier momento, en cualquier idioma y lo utilicen mientras sucede. Eso significa facilitarles a ellos o a su equipo la verificación y el uso de la transcripción en vivo a medida que sucede: verificar, compartir y traducir citas clave segundos después de que se pronuncien.

Nuestra aplicación móvil significa que esto puede suceder incluso si solo tiene un teléfono y garantiza que todo se transmita de forma segura a su equipo incluso cuando la conexión sea irregular.

Nuestra Creador de historias está diseñado para permitirle encontrar los momentos clave en todo su contenido y convertirlos en una nueva narrativa que puede exportarse a otras herramientas clave en su flujo de trabajo de producción de contenido. Ya sea un borrador para la edición de video, una transcripción de un podcast o un artículo. Si necesita utilizar el texto del audio como subtítulos, nuestro editor colaborativo también puede ayudarle.

También tienes un podcast que presentas personalmente llamado HistoriaTecnología, que analiza cómo la tecnología da forma a las historias. ¿Podría explicarnos qué es este podcast, qué deben esperar los oyentes y por qué deberían sintonizarlo?

StoryTech es realmente la intersección de mis dos carreras: reportera e inventora de tecnología. Analiza cómo la tecnología y la innovación dan forma a la forma en que se cuentan las historias.

Los primeros episodios analizan cómo se utilizó CGI para derribar la pared de hielo en Juego de Tronos y cómo la invención de la cámara Leica de 35 mm en la década de 1920 condujo a la difusión del fotoperiodismo y la creación de la revista LIFE.

Me fascina el impacto de la innovación en la narración. De eso se trata StoryTech.

¿Cuál es su visión para el futuro de Trint?

Ése es el desafío al que se enfrenta todo innovador hoy en día. ¿Cómo el rápido ritmo de la innovación abre oportunidades para mi producto?

Nuestros clientes quieren un producto que cree eficiencias simples e intuitivas que se adapten perfectamente a su flujo de trabajo. Eso significa ir mucho más allá de la transcripción.

Trint aprovechará la IA para hacer cosas que eran inimaginables hace apenas unos años: identificar voces, rostros, sentimientos, contexto, hechos y falsedades. Esto sucederá en cualquier idioma: traducir de ese idioma tal como se habla. La clave es hacer esto y mucho más de una manera que se integre con otros productos para crear un flujo de trabajo sencillo.

No veo a Trint reemplazando a reporteros, escritores y creadores de contenido. Se trata de liberarlos de la monotonía de su trabajo y permitirles centrar su tiempo en la creatividad. Es emocionante intentar imaginar el futuro. No voy a mentir: también es desalentador.

Gracias por la gran entrevista, los lectores que deseen obtener más información deben visitar Trint o ver el HistoriaTecnología podcast.

Socio fundador de unite.AI y miembro de la consejo de tecnología de forbes, antoine es un futurista apasionado por el futuro de la IA y la robótica.

También es el fundador de Valores.io, un sitio web que se centra en invertir en tecnología disruptiva.