Entrevistas
Jeff Kofman, Fundador y CEO de Trint – Serie de Entrevistas

Jeff Kofman, es el Fundador y CEO de Trint, después de una carrera de 30 años con ABC, CBS y CBC News, Jeff se cansó de chocar con la pared de la transcripción manual y ver cómo cada historia se detenía innecesariamente en seco. En 2014, Jeff y un equipo de desarrolladores aprovecharon la IA para hacer el trabajo pesado, y nació Trint.
Hoy en día, Trint es una plataforma de SaaS con tecnología de IA que va más allá de la transcripción para mejorar cada etapa del flujo de trabajo de creación de contenido.
Desde la transcripción hasta las herramientas editoriales, la colaboración en tiempo real hasta la exportación y publicación – haciendo que cada paso sea más fácil para los departamentos de noticias, podcasters, empresas locales y organizaciones globales para compartir historias más rápido y fácilmente que nunca.
Usted tuvo una carrera distinguida de 30 años con ABC, CBS y CBC News, ¿cuáles fueron algunos de los problemas que enfrentó con la transcripción manual tradicional?
Viví el dolor de la transcripción manual todos los días como periodista. Mucho antes de que tuviera la idea de inventar y construir Trint, me preguntaba por qué no había una mejor manera.
La transcripción manual siempre fue el cuello de botella en mi flujo de trabajo como reportero de televisión. Hacía mis entrevistas, escuchaba una conferencia de prensa, leía mi investigación, miraba mi material fílmico y luego… mi productor y yo desaparecían en el Agujero Negro de la Transcripción.
No puedo escribir mi historia de noticias de televisión hasta que tenga transcripciones precisas de las citas o sonidos que quiero usar. Necesito saber qué dijeron y cuánto tiempo duró ese sonido. Eso significaba sentarme en una sala de proyección o en nuestros escritorios con auriculares, presionar REPRODUCIR y luego PAUSAR. Luego teclear algunas palabras. Luego REPRODUCIR. PAUSAR. Y repetir. Podría tomar horas. Tan tedioso. Tan esencial.
Trint se lanzó en 2014, ¿puede discutir cómo surgió la idea?
Nunca imaginé que sería un tipo de tecnología. No estaba en mi plan de vida. Sucedió por casualidad.
Tuve una conversación casual con algunos desarrolladores de software que habían realizado algunos experimentos rudimentarios con audio y texto (no transcripción) en 2013.
Inocentemente pregunté: ¿por qué no puedo usar la tecnología de voz a texto automatizada para transcribir mis entrevistas.
Recuerdo que uno de los chicos me preguntó: ¿por qué querrías hacer eso?
Respondí: porque la transcripción manual es el punto doloroso en mi trabajo como reportero, la detesto.
Seguimos en contacto y realizamos algunos experimentos. Pronto quedó claro que habíamos inventado el futuro. Dejé mi trabajo como corresponsal en Londres para ABC News un año después y comenzamos a construir Trint.
¿Cuáles fueron algunos de los desafíos de lanzar un servicio de transcripción en esos primeros días?
La transcripción automatizada es un problema discreto. Las personas que no viven el flujo de trabajo de los reporteros y creadores de contenido no tienen idea de cómo crean historias. Recuerdo haber conocido a algunos inversores ángeles muy ricos en los primeros días y no podían entender por qué los reporteros como yo necesitamos transcripciones. Tomó mucho explicar para que entendieran cómo trabaja un reportero.
Creo que es más fácil hoy en día. Todos somos creadores de contenido.
¿Cuáles son los diferentes algoritmos de aprendizaje automático que se utilizan actualmente en Trint?
Tenemos un grupo de ingenieros y científicos de datos muy inteligentes que siempre están experimentando con lo que pueden y donde pueden llevar su imaginación. Como entenderías, nuestro enfoque es en cómo la transcripción automatizada puede agilizar los flujos de trabajo para nuestros clientes de medios, lo que significa que siempre trabajamos con voz, oradores, idiomas y acústica. Los algoritmos de NLP y procesamiento de habla son parte de nuestro día a día, pero investigaremos cualquier forma creativa de usar la IA para ayudar a los periodistas a extraer información de videos, audios e imágenes. La transcripción enriquecida nos permite dar más contexto a su contenido, hacer que todo sea más buscable y, en última instancia, les permite encontrar los momentos que realmente importan y llevarlos a sus audiencias lo más rápido posible.
¿Qué idiomas se ofrecen actualmente, y ¿hay alguna diferencia en la calidad de la transcripción entre los diferentes idiomas?
Ofrecemos alrededor de 45 idiomas que puedes transcribir y siempre estamos agregando más. Algunos están en “beta” y otros que son mucho más maduros, lo que depende del tamaño de los conjuntos de datos de entrenamiento que ayudan a construir los modelos. Constantemente medimos la precisión de nuestros modelos para cada idioma para desarrollar constantemente nuestros modelos y mejorar su rendimiento.
Estamos siempre buscando qué nuevos modelos están disponibles para ver si podemos incorporarlos a nuestro entorno de procesamiento de ASR seguro.
Pero no se trata solo de los idiomas que transcribimos – nuestros clientes también pueden tener esa transcripción traducida a casi cualquier idioma.
Fuera de la transcripción, Trint es una plataforma de SaaS con tecnología de IA diseñada para mejorar el flujo de trabajo de creación de contenido, ¿puede discutir algunas de las otras herramientas que se ofrecen?
Aunque en el corazón de Trint está nuestra transcripción con tecnología de IA, lo que nos obsesiona es por qué esas transcripciones son útiles para nuestros usuarios y cómo podemos ayudarlos a obtener valor lo más rápido y fácilmente posible. Eso significa tener una comprensión profunda de sus flujos de trabajo, para que podamos tratar de hacer que cada paso sea lo más fluido posible.
En última instancia, queremos que capturen cualquier conferencia de prensa, entrevista o evento en cualquier lugar, en cualquier momento, en cualquier idioma y que puedan aprovecharlo a medida que sucede. Eso significa hacer que sea fácil para ellos o su equipo verificar y usar la transcripción en vivo a medida que sucede – verificando, compartiendo y traduciendo citas clave segundos después de que se pronuncian.
Nuestra aplicación móvil significa que puede suceder incluso si solo tiene un teléfono contigo, y garantiza que todo se transmite de forma segura a tu equipo incluso cuando la conexión es irregular.
Nuestro Story Builder está diseñado para que puedas encontrar los momentos clave en todo tu contenido y convertirlos en una nueva narrativa que se puede exportar a otras herramientas clave en tu flujo de trabajo de producción de contenido. Ya sea que necesites un corte brusco para edición de video, una transcripción de podcast o un artículo. Si necesitas usar el texto del audio como subtítulos, nuestro editor colaborativo puede ayudar allí también.
También tiene un podcast que usted personalmente presenta llamado StoryTech, que analiza cómo la tecnología da forma a las historias. ¿Podría elaborar sobre qué es este podcast, qué pueden esperar los oyentes y por qué deberían sintonizar?
StoryTech es realmente la intersección de mis dos carreras: reportero y inventor de tecnología. Analiza cómo la tecnología y la innovación dan forma a la forma en que se cuentan las historias.
Los primeros episodios analizan cómo se utilizó la CGI para derribar la pared de hielo en Game of Thrones, y cómo la invención de la cámara Leica de 35 mm en la década de 1920 llevó a la difusión del periodismo fotográfico y la creación de la revista LIFE.
Me fascina el impacto de la innovación en la narración de historias. Eso es lo que StoryTech es.
¿Cuál es su visión para el futuro de Trint?
Ese es el desafío con el que todos los innovadores están luchando hoy en día. ¿Cómo abre el ritmo rápido de la innovación oportunidades para mi producto?
Nuestros clientes quieren un producto que cree eficiencias simples e intuitivas que se integren de forma fluida en su flujo de trabajo. Eso significa ir mucho más allá de la transcripción.
Trint aprovechará la IA para hacer cosas que eran inimaginables hace solo unos años: identificar voces, caras, sentimiento, contexto, hechos y falsedades. Esto sucederá en cualquier idioma – traduciendo desde ese idioma a medida que se habla. La clave es hacer esto y mucho más de una manera que se integre en otros productos para crear un flujo de trabajo sin dolor.
No veo que Trint reemplace a los reporteros, escritores y creadores de contenido. Se trata de liberarlos de la monotonía de su trabajo y permitirles centrar su tiempo en la creatividad. Es emocionante tratar de imaginar el futuro. No voy a mentir: también es aterrador.
Gracias por la gran entrevista, los lectores que deseen aprender más deben visitar Trint o ver el podcast StoryTech.












