stub Jeff Kofman, założyciel i dyrektor generalny Trint – seria wywiadów – Unite.AI
Kontakt z nami

Wywiady

Jeff Kofman, założyciel i dyrektor generalny Trint – seria wywiadów

mm
Zaktualizowano on

Jeff Kofman jest założycielem i dyrektorem generalnym firmy Trint, po 30 latach kariery w ABC, CBS i CBC News, Jeffowi znudziło się uderzanie w ścianę ręcznej transkrypcji i obserwowanie, jak każda historia niepotrzebnie zatrzymuje się w miejscu. W 2014 roku Jeff wraz z zespołem programistów wykorzystał sztuczną inteligencję do wykonania ciężkich zadań i tak narodził się Trint.

Dziś Trint to platforma SaaS oparta na sztucznej inteligencji, która wykracza poza transkrypcję i usprawnia każdy etap przepływu pracy podczas tworzenia treści.

Od transkrypcji po narzędzia redakcyjne, współpracę w czasie rzeczywistym po eksport i publikację – dzięki czemu redakcje, podcasterzy, lokalne firmy i organizacje globalne mogą na każdym kroku dzielić się historiami szybciej i łatwiej niż kiedykolwiek.

Miałeś wybitną 30-letnią karierę w ABC, CBS i CBC News. Jakie problemy napotkałeś podczas tradycyjnej ręcznej transkrypcji?

Jako dziennikarz na co dzień doświadczałem bólu ręcznej transkrypcji. Na długo zanim wpadłem na pomysł wynalezienia i zbudowania Trinta, zastanawiałem się, dlaczego nie ma lepszego sposobu.

Ręczna transkrypcja zawsze była wąskim gardłem w mojej pracy jako reportera telewizyjnego. Udzielałem wywiadów, słuchałem konferencji prasowych, czytałem wyniki moich badań, oglądałem nagrania i WTEDY… mój producent i ja znikaliśmy w Czarna dziura transkrypcji.

Nie mogę pisać wiadomości telewizyjnych, dopóki nie będę mieć dokładnych transkrypcji cytatów lub fragmentów dźwiękowych, których chcę użyć. Muszę wiedzieć, co powiedzieli i jak długo trwa ten fragment. Oznaczało to siedzenie w sali kinowej lub przy biurku ze słuchawkami i naciśnięcie przycisku PLAY, a następnie PAUZA. Następnie wpisz kilka słów. Następnie GRAJ. PAUZA. I powtórz. To może zająć wiele godzin. Takie nudne. Tak istotne.

Trint powstał w 2014 roku. Czy możesz opowiedzieć, jak narodził się ten pomysł?

Nigdy nie wyobrażałem sobie, że będę technikiem. To nigdy nie było w moim planie życiowym. Stało się to przez przypadek.

Odbyłem luźną rozmowę z kilkoma twórcami oprogramowania, którzy w 2013 roku przeprowadzili podstawowe eksperymenty z dźwiękiem i tekstem (nie transkrypcją).

Niewinnie zapytałem: dlaczego nie mogę używać automatycznej zamiany mowy na tekst do transkrypcji wywiadów.

Pamiętam, jak jeden z chłopaków zapytał mnie: dlaczego chcesz to zrobić?

Odpowiedziałem: ponieważ ręczna transkrypcja jest utrapieniem w mojej pracy reportera, nienawidzę tego.

Utrzymywaliśmy kontakt i przeprowadzaliśmy pewne eksperymenty. Szybko stało się jasne, że wymyśliliśmy przyszłość. Rok później rzuciłem pracę jako korespondent londyński dla ABC News i zaczęliśmy budować Trint.

Jakie wyzwania wiązały się z uruchomieniem usługi transkrypcji w tamtych czasach?

Automatyczna transkrypcja jest problemem dyskretnym. Ludzie, którzy nie żyją pracą reporterów i twórców treści, nie mają pojęcia, jak tworzą historie. Pamiętam, że na początku spotkałem kilku bardzo bogatych aniołów biznesu, którzy po prostu nie mogli zrozumieć, dlaczego reporterzy tacy jak ja potrzebują transkrypcji. Trzeba było wiele wyjaśnień, aby zrozumieli, jak pracuje reporter.

Myślę, że dzisiaj jest to łatwiejsze. Wszyscy jesteśmy twórcami treści.

Jakie różne algorytmy uczenia maszynowego są obecnie stosowane w Trint?

Mamy super inteligentną grupę inżynierów i analityków danych, którzy zawsze majsterkują przy tym, czym mogą się zająć i gdziekolwiek zaprowadzi ich wyobraźnia. Jak zapewne rozumiesz, skupiamy się na tym, jak automatyczna transkrypcja może przyspieszyć przepływ pracy dla naszych klientów z branży mediów, co oznacza, że ​​zawsze pracujemy nad mową, głośnikami, językami i akustyką. Algorytmy NLP i przetwarzania mowy są częścią naszej codziennej pracy, ale zbadamy wszelkie kreatywne sposoby wykorzystania sztucznej inteligencji, aby pomóc dziennikarzom w wydobywaniu informacji z filmów, plików audio i obrazów. Bogata transkrypcja pozwala nam nadać więcej kontekstu ich treściom, ułatwia ich przeszukiwanie, a ostatecznie pozwala znaleźć momenty, które są naprawdę ważne i jak najszybciej udostępnić je odbiorcom.

Jakie języki są obecnie oferowane i czy istnieją różnice w jakości transkrypcji pomiędzy różnymi językami?

Oferujemy około 45 języków, które możesz przepisać i zawsze dodajemy więcej. Niektóre są w wersji „beta”, inne są znacznie bardziej dojrzałe, co zależy od rozmiaru zbiorów danych szkoleniowych, które pomagają w budowaniu modeli. Stale mierzymy dokładność naszych modeli dla każdego języka, aby stale rozwijać nasze modele i poprawiać ich wydajność.

Zawsze przyglądamy się, jakie nowe modele stają się dostępne, aby sprawdzić, czy możemy wprowadzić je do naszego bezpiecznego środowiska przetwarzania ASR.

Ale nie chodzi tylko o języki, które transkrybujemy – nasi klienci mogą również zlecić tłumaczenie transkrypcji na niemal każdy język.

Poza transkrypcją Trint jest platformą SaaS opartą na sztucznej inteligencji, zaprojektowaną w celu usprawnienia przepływu pracy podczas tworzenia treści. Czy możesz omówić inne oferowane narzędzia?

Chociaż sercem Trint jest nasza transkrypcja oparta na sztucznej inteligencji, mamy obsesję na punkcie tego, dlaczego te transkrypcje są przydatne dla naszych użytkowników i jak możemy pomóc im uzyskać wartość tak szybko i łatwo, jak to możliwe. Oznacza to głębokie zrozumienie ich przepływów pracy, dzięki czemu możemy starać się, aby każdy krok był jak najbardziej płynny.

Docelowo chcemy, aby uchwycili każdą konferencję prasową, wywiad lub wydarzenie w dowolnym miejscu, w dowolnym czasie, w dowolnym języku i wykorzystali to na bieżąco. Oznacza to ułatwienie im lub ich zespołowi weryfikacji i wykorzystania transkrypcji na żywo na bieżąco – weryfikacja, udostępnianie i tłumaczenie kluczowych cytatów kilka sekund po ich wypowiedzeniu.

Nasza aplikacja mobilna oznacza, że ​​jest to możliwe nawet wtedy, gdy masz przy sobie tylko telefon, i gwarantuje, że wszystko jest bezpiecznie przesyłane do Twojego zespołu, nawet jeśli połączenie jest niestabilne.

Autonomiczne Konstruktor historii został zaprojektowany tak, aby umożliwić Ci znalezienie kluczowych momentów we wszystkich Twoich treściach i przekształcenie ich w nową narrację, którą można wyeksportować do innych kluczowych narzędzi w procesie tworzenia treści. Niezależnie od tego, czy jest to wstępna wersja edycji wideo, transkrypcja podcastu czy artykuł. Jeśli chcesz użyć tekstu ścieżki dźwiękowej jako napisów, nasz współpracujący edytor również może w tym pomóc.

Masz także podcast, który osobiście prowadzisz StoryTech, który przygląda się, jak technologia kształtuje historie. Czy mógłbyś wyjaśnić, czym jest ten podcast, czego powinni się spodziewać słuchacze i dlaczego powinni go włączyć?

StoryTech to tak naprawdę skrzyżowanie moich dwóch karier: reportera i wynalazcy technologii. Przygląda się, jak technologia i innowacje kształtują sposób opowiadania historii.

Wczesne odcinki opowiadają o tym, jak wykorzystano CGI do obalenia ściany lodu w „Grze o tron” i jak wynalezienie 35-milimetrowego aparatu Leica w latach dwudziestych XX wieku doprowadziło do rozpowszechnienia fotoreportażu i powstania magazynu LIFE.

Fascynuje mnie wpływ innowacji na opowiadanie historii. O to właśnie chodzi w StoryTech.

Jaka jest Twoja wizja przyszłości Trint?

To wyzwanie, z którym zmaga się dziś każdy innowator. W jaki sposób szybkie tempo innowacji otwiera możliwości dla mojego produktu?

Nasi klienci chcą produktu, który zapewnia proste, intuicyjne rozwiązania, które płynnie wpasowują się w ich przepływ pracy. Oznacza to wyjście daleko poza transkrypcję.

Trint wykorzysta sztuczną inteligencję do robienia rzeczy, które jeszcze kilka lat temu były niewyobrażalne: identyfikowania głosów, twarzy, nastrojów, kontekstu, faktów i kłamstw. Stanie się to w każdym języku – przy tłumaczeniu z tego języka, w jakim się go używa. Kluczem jest zrobienie tego i wielu innych rzeczy w sposób integrujący się z innymi produktami w celu stworzenia jednego, bezbolesnego przepływu pracy.

Nie widzę, żeby Trint miał zastąpić reporterów, pisarzy i twórców treści. Chodzi o wyzwolenie ich od trudu pracy i umożliwienie skupienia czasu na kreatywności. Próba wyobrażenia sobie przyszłości jest ekscytująca. Nie będę kłamać: to także zniechęcające.

Dziękuję za wspaniały wywiad. Czytelnicy chcący dowiedzieć się więcej powinni odwiedzić nas Trint lub obejrzyj StoryTech podcast.

Partner-założyciel unite.AI i członek Rada Technologiczna Forbesa, Antoine jest futurysta który jest pasjonatem przyszłości sztucznej inteligencji i robotyki.

Jest także Założycielem Securities.io, witryna internetowa skupiająca się na inwestowaniu w przełomowe technologie.