Rozhovory
Tomer Aharoni, CEO a spoluzakladatel Nagish – Rozhovorová série

Tomer Aharoni, CEO a spoluzakladatel Nagish, spojuje silný technický základ ze své práce jako softwarový inženýr v Bloombergu, výzkum v NLP a IoT na Kolumbijské univerzitě a dřívější zkušenosti v technologických zpravodajských rolích v Izraelských obranných silách, vše poháněné jeho vášní pro přístupnost a průsečík technologie a komunikace.
Nagish je komunikační platforma poháněná umělou inteligencí, navržená tak, aby dělala telefonní hovory plně přístupné pro lidi, kteří jsou hluchí nebo mají sluchové postižení. Aplikace poskytuje přepis v reálném čase a text-to-speech schopnosti, zatímco umožňuje uživatelům zachovat si stávající telefonní číslo, udržet kompletní soukromí a spravovat konverzace pomocí funkcí, jako jsou personalizované slovníky, uložené přepisy a bezproblémová integrace zařízení.
Jaký okamžik nebo vhled vás vedl k tomu, abyste své zkušenosti z Bloombergu a výzkumu v NLP na Kolumbijské univerzitě využili k vytvoření Nagish?
Během svých vysokoškolských studií na Kolumbijské univerzitě jsem jednou seděl ve třídě, když jsem dostal telefonní hovor. Nemohl jsem ho zvednout, protože by to přerušilo celou třídu, a to mě vedlo k zamyšlení nad tím, jak lze uskutečnit telefonní hovor, pokud člověk neslyší nebo nemluví? To mě vedlo k širší otázce: jak komunikují hluchí a sluchově postižení lidé po telefonu?
To bylo v roce 2019 a my (Alon Ezer, můj spoluzakladatel, a já) jsme zjistili, že komunita hluchých lidí silně závisí na tlumočnících a přepisovačích. Považovali jsme to za šílené, a tak jsme začali kontaktovat lidi z místní komunity hluchých a to, co jsme slyšeli, nás opravdu překvapilo. „Jen zavěsíme, když někdo zavolá,“ „Nepoužívám telefon,“ nebo „Požádám svého bratra, aby zavolal za mě,“ to byly jen některé odpovědi, které jsme dostali, když jsme se ptali lidí, jak používají telefon.
Později toho léta jsem pracoval jako stážista softwarového inženýra v Bloombergu. V našem týmu jsme měli jiného stážistu, který byl hluchý. Každýkrát, když jsem s ním chtěl mluvit, musel jsem sladit naše rozvrhy s ním a se dvěma tlumočníky. Jednoduché „pojďme se rychle spojit, abychom to vyřešili“ bylo prostě nemožné. Po rozhovoru s HR jsem se dozvěděl, že najít tyto dva tlumočníky, kteří byli seznámeni s technickým žargónem, bylo téměř nemožné a že je používáme, kdykoli jsou k dispozici, ale nejsou k dispozici na plný úvazek.
Můžete sdílet, jaké byly rané dny Nagish a jaké výzvy jste čelili při spojení cílů přístupnosti s nejmodernější technologií AI?
Rané dny Nagish byly během pandemie, takže se toho ve našich životech nedělo mnoho jiného než práce. Alon a já jsme bydleli kousek od sebe a měli jsme spoustu času na brainstorming, prototypování a implementaci nejnovějších technologií. Pracovali jsme z našich bytů 12 a více hodin denně po několik měsíců.
Mít tolik času na našich rukou nám umožnilo strávit spoustu času mluvením s našimi uživateli a porozuměním jejich potřebám. Nechtěli jsme dělat žádné předpoklady. V té době jsme ještě neměli v úmyslu založit společnost. Co nás hnalo, bylo slyšet od uživatelů o jejich problémech a vědět, že máme šanci je vyřešit pomocí technologie.
Jak technologie Nagish mostí komunikační mezery mezi hluchými nebo sluchově postiženými jedinci a slyšícím světem způsobem, který stávající nástroje nemohou?
Nagish používá umělou inteligenci k mostění komunikačních mezer. Naše motory převádějí řeč na text, text zpět na řeč a znakovou řeč na text (a naopak) v reálném čase. To znamená, že hluchý nebo sluchově postižený člověk může jednoduše vidět, co je řečeno během hovoru, a odpovědět psaním nebo mluvením, zatímco slyšící osoba na druhém konci prožívá standardní telefonní hovor. Předtím, než existovala tato umělá inteligence, lidé museli spoléhat na lidské přepisovače, kteří seděli na lince a dělali veškeré přepisování.
S Nagish není potřeba žádný přepisovač, žádný tlumočník, kterého je třeba naplánovat, a není třeba čekat na někoho jiného, aby byl k dispozici. Aplikace vrací okamžitost, soukromí a nezávislost do telefonních hovorů, něco, co tradiční přepisovačské služby nemohou nabídnout.
Jak vaše platforma jde za hranice standardního přepisu nebo titulkování, aby interakce byly více přirozené a inkluzivní?
Víme, že jazyk není pouze slovy, ale také kulturou, identitou a nuancemi. To je especialmente pravdivé pro znakové jazyky, které se spoléhají na mimiku, emoce a regionální variace. Abychom udělali interakce cítit přirozeně a ne mechanicky, spolupracujeme přímo se znakovými lingvisty a odborníky. Oni pomáhají tvarovat, jak naše umělá inteligence učí a chová, takže technologie je postavena s komunitou, ne pouze trénována na jejich datech.
Jaká je role přirozeného jazykového zpracování při zajišťování, že vaše platforma zachycuje nejen slova, ale také záměr a tón?
Přirozené jazykové zpracování a přirozené jazykové pochopení jsou v jádru toho, jak Nagish zachycuje nejen to, co někdo říká, ale také to, co míní. Řeč je plná signálů, které přidávají kontext, jako je tón, důraz a další, a naše modely NLP jsou navrženy tak, aby zachytili tyto vrstvy, takže uživatelé dostanou více než základní přepis. Cílem je udělat titulkování cítit co nejpřirozeněji.
Jak Nagish pomáhá zaměstnavatelům budovat více inkluzivní pracovní prostředí a řešit finanční a logistické bariéry, které omezovaly přístupnost?
Na Nagish pomáháme zaměstnavatelům budovat více inkluzivní pracovní prostředí odstraňováním finančních a logistických bariér, které činily přístupnost obtížnou. Tradičně vytváření přístupného pracovního prostředí znamenalo spoléhat se na naplánované tlumočníky, kteří jsou nezbytní, ale nejsou vždy praktičtí pro každodenní komunikaci, jako jsou rychlé hovory, neplánované schůzky nebo časově citlivé úkoly. Tyto omezení vytvářejí zpoždění, přidávají náklady a mohou neúmyslně vyloučit hluché a sluchově postižené zaměstnance z pracovního procesu.
Nagish mění tuto dynamiku, poskytujíc zaměstnancům schopnost komunikovat nezávisle a na vyžádání. Když společnosti odstraní tyto bariéry, lidé mohou plně participovat, což vede k silnějším týmům, lepší retenci a více rovnému pracovnímu prostředí.
Jakou zpětnou vazbu jste dostali od hluchých a sluchově postižených uživatelů a jak ovlivnila vývoj produktu?
Postavili jsme Nagish s komunitou hluchých od samého začátku a od té doby jsme dostávali mix emocí, zvědavosti a v některých případech jisté váhavosti, což je přesně tak, jak by to mělo být. Komunita hluchých je velmi uvědomělá a zvědavá ohledně nové technologie a my se snažíme vyhnout přecenění. Prioritizujeme pokrok nad dokonalostí, což vyžaduje čas, ale náš konečným cílem je dokonalost.
Tato komunitně orientovaná mentalita je posílena tím, co jsme se dozvěděli v naší nedávné zprávě. Po přijetí asistivní technologie uživatelé ukázali významný nárůst denní nezávislosti: počet lidí, kteří mohli komunikovat nezávisle, se zvýšil z 37 % na 60 % pro hluché uživatele a z 32,9 % na 63 % pro sluchově postižené uživatele. Tato změna odráží zpětnou vazbu, kterou slyšíme každý den: lidé chtějí nástroje, které usnadňují komunikaci, činí ji konzistentnější a dostupnější v okamžicích, kdy nejsou k dispozici tlumočníci nebo kdy někdo preferuje soukromí.
Jak vidíte budoucnost umělé inteligence v přístupnosti v příštím desetiletí a jaké mezery stále zůstávají, aby je technologie mohla zaplnit?
Jedním z největších problémů s digitální přístupností je nedostatek vzdělávání a pozorovatelnosti: inženýři neimplementují alt-text, designéři vybírají nepřístupné barvy, protože vypadají dobře, a produktoví manažeři dělají produktová rozhodnutí pro KPI. Když se umělá inteligence stává více zapojena do každého aspektu produktového vývoje, od inženýrství po design a copywriting, vidíme proaktivní přístup k přístupnosti.
Jak si představujete spolupráci mezi lidskými tlumočníky a umělou inteligencí – jedna nakonec nahradí druhou, nebo se vzájemně posílí?
ZNakoví tlumočníci dělají úžasnou práci. Jsou nezbytní pro komunitu, přístupnost a komunikaci. Ale realita je taková, že prostě nejsou dostatečně nombreux. V USA je například přes 500 000 lidí, kteří používají americkou znakovou řeč jako svůj primární jazyk, a pouze asi 10 000 certifikovaných tlumočníků. To znamená, že obrovské množství situací – od návštěv u lékaře, schůzek rodičů a učitelů, pohovorů a dalších – často postrádá přístupnou komunikaci.
Děkuji vám za skvělý rozhovor, čtenáři, kteří chtějí se dozvědět více, by měli navštívit Nagish.












