Interviuri
Tomer Aharoni, CEO și Co-Fondator al Nagish – Seria de Interviuri

Tomer Aharoni, CEO și Co-Fondator al Nagish, reunește o bază tehnică solidă din experiența sa ca inginer de software la Bloomberg, cercetare în NLP și IoT la Universitatea Columbia, și experiența anterioară în roluri de intelligence tehnologică în cadrul Forțelor de Apărare ale Israelului, toate conduse de pasiunea sa pentru accesibilitate și intersecția dintre tehnologie și comunicare.
Nagish este o platformă de comunicare bazată pe inteligență artificială, proiectată pentru a face apelurile telefonice complet accesibile pentru persoanele surde sau cu deficiențe de auz. Aplicația oferă transcrieri în timp real și capacități de text-la-vorbire, permițând utilizatorilor să-și păstreze numărul de telefon existent, să mențină confidențialitatea și să gestioneze conversațiile prin funcții precum dicționare personalizate, transcrieri salvate și integrare cu dispozitive.
Ce moment sau insight v-a condus să canalizați această experiență în crearea Nagish?
În timpul studiilor mele de licență la Columbia, eram în clasă când am primit un apel telefonic. Nu puteam răspunde pentru că aș fi întrerupt întreaga clasă, și asta m-a făcut să mă gândesc cum poți purta o conversație telefonică dacă nu poți auzi sau vorbi? Acest gând m-a condus la o întrebare mai mare: cum comunică persoanele surde sau cu deficiențe de auz la telefon?
A fost în 2019, și noi (Alon Ezer, co-fondatorul meu, și eu) am descoperit că comunitatea surdă se baza puternic pe interpreți și asistenți de transcriere. Ne-am gândit că este absurd, așa că am început să contactăm oameni din comunitatea surdă locală, și ceea ce am auzit a fost cu adevărat surprinzător pentru noi. „Mă retrag când cineva mă sună”, „Nu folosesc telefonul”, sau „Îi cer fratelui meu să sune pentru mine” au fost doar câteva dintre răspunsurile pe care le-am primit când am întrebat oamenii cum folosesc telefonul.
Mai târziu, în acea vară, am făcut un stagiu ca inginer de software la Bloomberg. În echipa mea, aveam un alt stagiar care era surd. De fiecare dată când voiam să mă întâlnesc cu ea, trebuia să coordonez programările cu ea și cu doi interpreți. Ideea de a „sări într-un apel rapid pentru a rezolva lucrurile” era pur și simplu imposibilă. După ce am discutat cu Resursele Umane despre asta, am aflat că găsirea acestor doi interpreți care erau familiarizați cu jargonul tehnic era aproape imposibilă și că îi folosim ori de câte ori sunt disponibili, dar nu sunt disponibili pe tot parcursul zilei.
Cu cât am învățat mai mult, a devenit clar că acestea nu erau inconveniențe izolate, ci parte a unui model mult mai larg. Chiar și astăzi, cu progresele care au îmbunătățit accesibilitatea, există încă multe provocări și domenii care necesită a fi abordate. La Nagish, am efectuat recent un sondaj și am lansat un raport, Impactul tehnologiei de comunicare în împuternicirea persoanelor surde și cu deficiențe de auz, care a arătat că 65% dintre persoanele surde au declarat că au nevoie de asistență din partea unei persoane care aude cel puțin o dată pe săptămână pentru a comunica eficient. Această dependență creează bariere reale în mediul profesional, reflectate în faptul că 62% dintre respondenții surzi au declarat că provocările de comunicare au influențat deciziile lor de carieră și le-au limitat capacitatea de a urma sau avansa în anumite roluri.
Aceste experiențe, împreună cu legăturile mele tot mai strânse cu persoane surde, m-au condus să construiesc prima versiune a Nagish. Avem o singură convingere care nu s-a schimbat – comunicarea ar trebui să fie accesibilă și privată.
Alon și eu am construit un prototip, și răspunsul a fost incredibil. Am realizat cât de schimbător de viață putea fi Nagish. Apoi a venit COVID, și nevoia a explodat pe măsură ce lumea a devenit remote, și lipsa de accesibilitate în modul în care oamenii comunică a devenit realmente evidentă.
Puteți împărtăși ce a fost în zilele de început ale Nagish și ce provocări ați întâmpinat în combinarea obiectivelor de accesibilitate cu tehnologia de inteligență artificială de ultimă generație?
Zilele de început ale Nagish au fost în timpul pandemiei, așa că nu prea era nimic altceva în viața noastră în afara muncii. Alon și eu locuiam la un bloc distanță unul de celălalt și am avut mult timp pentru a brainstorma, crea prototipuri și implementa tehnologii de ultimă oră. Am lucrat din apartamentele noastre timp de 12 ore sau mai mult pe zi, timp de luni.
Acest timp ne-a permis să petrecem mult timp vorbind cu utilizatorii noștri și înțelegând nevoile lor. Nu am vrut să facem presupuneri. La acel moment, încă nu aveam intenția de a face din Nagish o companie. Ce ne-a dat impulsul a fost auzind de la utilizatori despre provocările lor și știind că aveam o șansă de a le rezolva cu tehnologia.
Cum funcționează tehnologia de inteligență artificială a Nagish pentru a conecta comunicarea între persoanele surde sau cu deficiențe de auz și lumea care aude, în moduri în care uneltele existente nu pot?
Nagish utilizează inteligența artificială pentru a conecta lacunele de comunicare. Motoarele noastre transformă vorbirea în text, textul înapoi în vorbire și limba semnelor în text (și invers) în timp real. Acest lucru înseamnă că o persoană surdă sau cu deficiențe de auz poate pur și simplu vedea ce se spune într-un apel și răspunde prin tastare sau vorbire, în timp ce persoana care aude de cealaltă parte experimentează un apel telefonic standard. Înainte de a exista acest tip de inteligență artificială, oamenii trebuiau să se bazeze pe servicii de relais operate de oameni, unde o a treia persoană stătea pe linie și făcea toată transcrierea.
Cu Nagish, nu există operator de relais, nu există interpret de programat și nu există așteptare pentru ca altcineva să fie disponibil. Aplicația readuce imediatețea, confidențialitatea și independența în apelurile telefonice, ceea ce serviciile de relais tradiționale nu pot oferi.
Deoarece Nagish este alimentat de inteligență artificială, poate scala la orice tip de apel: întâlniri de lucru, verificări ale familiei, situații de urgență și apeluri de asistență pentru clienți. Aplicația este proiectată pentru a se integra ușor în viața de zi cu zi: utilizatorii își pot păstra propriul număr, pot obține transcrieri în timp real și pot utiliza aceeași aplicație pentru apeluri telefonice și conversații față în față. Întreaga experiență este proiectată pentru a reduce fricțiunea și a face comunicarea să se simtă cât mai naturală și lipsită de efort posibil.
În ce mod platforma dvs. merge dincolo de transcrierea standard sau titrarea pentru a face interacțiunile mai naturale și incluzive?
Știm că limba nu este doar cuvinte, ci și cultură, identitate și nuanță. Acest lucru este valabil mai ales pentru limbile semnelor, care se bazează pe expresia facială, emoție și variație regională. Pentru a face interacțiunile să se simtă naturale și nu mecanice, colaborăm direct cu lingviști surzi și experți în limbajul semnelor. Ei ne ajută să modelăm modul în care inteligența noastră artificială învață și se comportă, astfel încât tehnologia să fie construită împreună cu comunitatea, și nu doar antrenată pe datele lor.
Uneltele standard de transcriere adesea se opresc la „iată cuvintele care au fost spuse”. Scopul nostru este de a sprijini o conversație reală. Implementăm agenți de inteligență artificială care pot oferi context și gestiona fluxul apelului dincolo de simpla furnizare de transcrieri sau citire de text în vorbire. În plus, Nagish oferă transcrieri în timp real optimizate pentru fluxul conversației, cu funcții precum fonturi ajustabile, filtrare spam, transcriere de voicemail și capacitatea de a salva și revizui transcrieri pe dispozitivul dvs. atunci când alegeți să o faceți. Toate acestea creează o experiență echivalentă cu cea a persoanelor care aud în apelurile telefonice.
Care este rolul procesării limbajului natural în asigurarea faptului că platforma dvs. captează nu doar cuvinte, ci și intenție și ton?
Procesarea limbajului natural și înțelegerea limbajului natural sunt la baza modului în care Nagish captează nu doar ceea ce spune cineva, ci și ceea ce înseamnă. Vorbirea este plină de indicii care adaugă context, precum ton, accent și multe altele, și modelele noastre de procesare a limbajului natural sunt proiectate pentru a prinde aceste straturi, astfel încât utilizatorii să primească mai mult decât o transcriere de bază. Scopul este de a face transcrierile să se simtă cât mai aproape de o conversație naturală posibil.
Deoarece Nagish este construit pentru situații din lumea reală, cum ar fi apeluri medicale, întâlniri de lucru și chiar situații de urgență, modelele noastre sunt antrenate pentru a gestiona vorbire rapidă, voci suprapuse și nuanțe emoționale. Conștientizarea contextului este un motiv mare pentru care adesea depășim atât transcriptorii umani, cât și alte unelte de inteligență artificială. Sistemul nu doar ghicește cuvinte; folosește fluxul conversației pentru a înțelege intenția.
Cum ajută Nagish angajatorii să creeze locuri de muncă mai incluzive, abordând în același timp barierele financiare și logistice care au limitat accesibilitatea de mult timp?
La Nagish, ne ajutăm angajatorii să creeze locuri de muncă mai incluzive prin înlăturarea barierelor financiare și logistice care au făcut accesibilitatea dificil de scalat. În mod tradițional, crearea unui loc de muncă accesibil a însemnat să te bazezi pe interpreți programați, care sunt esențiali dar nu întotdeauna practici pentru comunicarea de zi cu zi, cum ar fi apeluri rapide, întâlniri impromptu sau sarcini cu termen limită. Aceste limitări creează întârzieri, adaugă costuri și pot exclude în mod neintenționat angajații surzi sau cu deficiențe de auz de la fluxul de lucru.
Nagish lucrează pentru a schimba această dinamică, oferind angajaților capacitatea de a comunica în mod independent și la cerere. Când companiile înlătură aceste bariere, oamenii pot participa pe deplin, conducând la echipe mai puternice, o retenție mai bună a angajaților și un loc de muncă mai echitabil.
Conform unui sondaj recent pe care l-am efectuat, peste 60% dintre respondenții surzi sau cu deficiențe de auz au declarat că barierele de comunicare au afectat deciziile lor de carieră și creșterea profesională. Este o provocare gravă care, chiar și cu toate progresele făcute în ultimii ani, arată că încă există mult de lucru de făcut.
Noi îi permitem angajatorilor să treacă de la măsuri de adaptare reactive la incluziune proactivă, creând locuri de muncă în care fiecare angajat poate contribui în mod independent și cu încredere.
Care a fost feedback-ul pe care l-ați primit de la utilizatorii surzi sau cu deficiențe de auz, și cum a influențat evoluția produsului?
Am construit Nagish împreună cu comunitatea surdă de la început, și de atunci, am primit un amestec de entuziasm, curiozitate și, în rare cazuri, o anumită ezitare, ceea ce este exact așa cum ar trebui să fie. Comunitatea surdă este foarte conștientă și curioasă cu privire la noi tehnologii, și cu bună dreptate. Ei au auzit atâtea promisiuni exagerate în trecut, și încercăm să evităm asta. Ne concentrăm pe progres în loc de perfecțiune, ceea ce necesită timp – dar obiectivul nostru final este perfecțiunea.
Acest mindset centrat pe comunitate este întărit de ceea ce am învățat din raportul nostru recent. După adoptarea tehnologiei asistive, utilizatorii au arătat o creștere semnificativă a independenței zilnice: numărul de persoane care puteau comunica în mod independent a crescut de la 37% la 60% pentru utilizatorii surzi, și de la 32,9% la 63% pentru utilizatorii cu deficiențe de auz. Această schimbare reflectă feedback-ul pe care îl primim în fiecare zi: oamenii doresc unelte care fac comunicarea mai ușoară, mai consistentă și disponibilă în momente în care interpreții nu sunt accesibili sau atunci când preferă confidențialitatea.
Când vine vorba de cercetarea noastră pentru a crea tehnologii de interpretare a limbajului semnelor mai bune, obiectivul nostru nu este de a înlocui interpreții umani sau metodele de comunicare existente, ci de a adăuga o altă opțiune, un instrument care face accesibilitatea mai consistentă și disponibilă oriunde, oricând. Feedback-ul de la utilizatori a întărit cât de importantă este „o altă opțiune”, mai ales în momente în care un interpret nu este disponibil sau atunci când cineva dorește pur și simplu confidențialitate și independență. Pentru mulți, creează situații în care comunicarea ar fi altfel fost incomodă, întârziată sau inaccesibilă.
Suntem implicați într-o abordare centrată pe comunitate pentru a ne asigura că tehnologia se simte autentică, precisă și respectuoasă. Atâta timp cât vom continua să construim împreună cu utilizatorii limbajului semnelor, credem că acesta va fi perceput ca un pas împuternicitor înainte.
Confidențialitatea este o preocupare cheie în tehnologia de accesibilitate — cum gestionează Nagish conversații sensibile și menține încrederea utilizatorilor?
Confidențialitatea este esențială pentru misiunea Nagish de a împuternici utilizatorii surzi sau cu deficiențe de auz. Primul lucru de menționat este că, cu Nagish, puteți elimina deja nevoia de un transcriitor live, așa că, de la început, există deja o senzație de confidențialitate care nu a fost posibilă înainte.
Pe partea tehnică, Nagish este proiectat pentru a fi privat. Nu înregistrăm apeluri și nu stocăm transcrieri de apeluri pe serverele noastre dincolo de durata unui apel. Nu folosim datele apelurilor pentru antrenarea modelelor noastre. Atunci când utilizatorii aleg să salveze transcrieri, acestea sunt stocate local pe dispozitivul lor, în loc de a fi stocate într-un cloud partajat. Funcții precum titrarea securizată de la capăt la capăt și stocarea locală a transcrierilor sunt acolo în mod special pentru a proteja conversații extrem de sensibile – fie că sunt despre sănătate, angajare sau relații personale.
Cum vedeți inteligența artificială schimbând accesibilitatea în următorul deceniu, și care sunt lacunele care încă trebuie umplute de tehnologie?
Una dintre cele mai mari probleme cu accesibilitatea digitală este lipsa de educație și vizibilitate: inginerii nu implementează text alternativ, designerii aleg culori inaccesibile pentru că arată bine, și managerii de produs iau decizii de produs pentru indicatori de performanță.
Pe măsură ce inteligența artificială devine tot mai implicată în fiecare aspect al dezvoltării de produse, de la inginerie la design și la scrierea de conținut, vedem o abordare proactivă a accesibilității. Inteligența artificială ar putea transforma accesibilitatea din ceva reactiv și „îmbunătățit” în ceva proactiv și ambiental. Vom vedea, de asemenea, o nouă valură de unelte care vor îmbunătăți comunicarea în diverse medii – nu doar apeluri, ci și locuri de muncă, săli de clasă, transport și servicii publice – astfel încât persoanele cu dizabilități, și în special cele surde sau cu deficiențe de auz, să nu fie nevoite să ceară în mod constant adaptări; acestea vor fi acolo din start.
Cum vă imaginați colaborarea dintre interpreții umani și inteligența artificială evoluând — va înlocui una dintre ele pe cealaltă, sau se vor întări reciproc?
Interpreții de limbaj semnelor fac o muncă incredibilă. Ei sunt esențiali pentru comunitate, accesibilitate și comunicare. Dar realitatea este că, pur și simplu, nu există suficienți interpreți. În Statele Unite, de exemplu, există peste 500.000 de oameni care folosesc limba americană a semnelor ca limbă principală, și doar aproximativ 10.000 de interpreți certificați. Acest lucru înseamnă că un număr imens de situații – de la vizite medicale, întâlniri ale părinților și profesorilor, interviuri de angajare și multe altele – adesea lipsesc comunicarea accesibilă.
Chiar și atunci când interpreții sunt disponibili, există provocări legate de programare, cost și geografie. Cineva care trăiește într-o zonă rurală ar avea mult mai multă dificultate în a găsi un interpret, și această întârziere poate avea consecințe reale, mai ales în domeniul sănătății sau în situații de urgență.
Inteligența artificială poate ajuta la bridarea acestei lacune. Ceea ce construim nu este menit să înlocuiască interpreții, ci să completeze munca lor și să facă accesibilitatea mai scalabilă. Gândiți-vă la asta ca la un instrument care intervine atunci când un interpret uman nu este disponibil.
Google Translate nu a înlocuit traducătorii profesioniști, dar a făcut posibilă podirea lacunelor de comunicare în viața de zi cu zi.
Cu progresele în domeniul viziunii computerizate și al procesării limbajului natural, inteligența artificială deține promisiunea de a începe să interpreteze limba semnelor în timp real. Acest lucru înseamnă că mai multe persoane pot comunica instantaneu, fie că este prin apel video, un kiosk public sau un serviciu de urgență.
Mulțumim pentru acest interviu minunat; cititorii care doresc să afle mai multe despre Nagish ar trebui să viziteze Nagish.












