Intervjuer
Tomer Aharoni, administrerende direktør og medgrunnlegger av Nagish – Intervju-serie

Tomer Aharoni, administrerende direktør og medgrunnlegger av Nagish, bringer sammen en sterk teknisk grunnlag fra hans arbeid som programvareingeniør i Bloomberg, forskning i NLP og IoT ved Columbia University, og tidligere erfaring i teknologi-intelligensroller innen Israel Defense Forces, alt drevet av hans lidenskap for tilgjengelighet og skjæringspunktet mellom teknologi og kommunikasjon.
Nagish er en AI-drevet kommunikasjonsplattform designet for å gjøre telefonopptak fullstendig tilgjengelige for mennesker som er døve eller har hørselsskader. Appen tilbyr sanntids-tekstning og tekst-til-tale-funksjoner samtidig som brukerne kan beholde sin eksisterende telefonnummer, opprettholde fullstendig personvernbeskyttelse og håndtere samtaler gjennom funksjoner som personlige ordbøker, lagrede transkript og ubrutt enhetsintegrering.
Hva var det som førte deg til å kanalisere denne erfaringen inn i å lage Nagish?
Under min bachelorstudie ved Columbia satt jeg en dag i timen da jeg fikk en telefon. Jeg kunne ikke svare fordi det ville ha forstyrret hele klassen, og det fikk meg til å tenke på hvordan man kan håndtere en telefonopptak hvis man ikke kan høre eller snakke? Denne tanken ledet til en større spørsmål: hvordan kommuniserer døve og hørselshemmede mennesker på telefonen?
Dette var i 2019, og vi (Alon Ezer, min medgrunnlegger, og jeg) oppdaget at døvesamfunnet var sterkt avhengig av tolker og tekstningassistenter. Vi syntes det var galskap, så vi begynte å kontakte folk fra det lokale døvesamfunnet, og hva vi hørte var virkelig overraskende for oss. “Jeg legger på når noen ringer meg”, “Jeg bruker ikke telefonen”, eller “Jeg ber min bror om å ringe for meg”, var bare noen av svarene vi fikk når vi spurte mennesker hvordan de bruker telefonen.
Senere samme sommer var jeg praktikant som programvareingeniør i Bloomberg. På mitt team hadde vi en annen praktikant som var døv. Hver gang jeg ville møte med henne, måtte jeg koordinere tidene med henne og to tolker. Den uformelle “la oss hoppe på et raskt oppkall for å løse dette” var bare umulig. Etter å ha talt med HR om det, lærte jeg at å finne disse to tolkene som var kjent med teknisk jargon var nesten umulig, og at vi bruker dem når de er tilgjengelige, men de er ikke tilgjengelige hele tiden.
Jo mer vi lærte, ble det klart at disse ikke var isolerte ubekvemmeligheter, men en del av et mye større mønster. Selv i dag, med fremgangen som har forbedret tilgjengeligheten, er det fortsatt mange utfordringer og områder som må håndteres. Hos Nagish har vi nylig gjennomført en undersøkelse og publisert en rapport, Virkningen av kommunikasjonsteknologi på å gi døve og hørselshemmede mennesker makt, som fant at 65% av døve mennesker sa at de trenger assistanse fra en hørende person minst en gang i uken for å kommunisere effektivt. Denne avhengigheten skaper reelle barrierer i profesjonelle sammenhenger, reflektert i det faktum at 62% av døve respondenter sa at kommunikasjonsutfordringer påvirkte deres karrierevalg og begrensede deres evne til å søke eller fremme i visse roller.
Disse erfaringene, og mine økende forbindelser med døve mennesker, ledet meg til å bygge den første iterasjonen av Nagish. Vi har en enkelt tro som ikke har endret seg – kommunikasjon skal være tilgjengelig og privat.
Alon og jeg bygget en prototype, og responsen var fantastisk. Vi innsett at Nagish kunne være livsforvandrende. Deretter kom COVID, og behovet eksploderte da verden gikk remote, og mangelen på tilgjengelighet i hvordan mennesker kommuniserer ble virkelig tydelig.
Kan du dele hva de tidlige dagene med Nagish var som, og hvilke utfordringer du møtte i å kombinere tilgjengelighetsmål med banebrytende AI-teknologi?
De tidlige dagene med Nagish var under pandemien, så det skjedde ikke mye i våre liv utenfor arbeid. Alon og jeg bodde rundt hjørnet fra hverandre og hadde mye tid til å brainstorme, lage prototyper og implementere de nyeste teknologiene. Vi arbeidet utenfor våre leiligheter i 12+ timer om dagen i måneder.
Å ha denne mengden tid på våre hender lot oss bruke mye av den til å snakke med våre brukere og forstå deres behov. Vi ønsket ikke å gjøre antagelser. På dette tidspunktet hadde vi fortsatt ingen intensjon om å lage det til et selskap. Det som ga oss drivkraften var å høre fra brukerne om deres kamp og vite at vi hadde en sjanse til å løse dem med teknologi.
Hvordan fungerer Nagish sin AI-teknologi for å brygge kommunikasjon mellom døve eller hørselshemmede mennesker og den hørende verden på måter som eksisterende verktøy ikke kan?
Nagish bruker AI til å brygge kommunikasjonsgap. Våre motorer omgjør tale til tekst, tekst tilbake til tale og tegnspråk til tekst (og vice versa) i sanntid. Det betyr at et døvt eller hørselshemmet menneske kan se hva som blir sagt i et oppkall og svare ved å skrive eller snakke, mens den hørende personen på den andre enden bare opplever et standard oppkall. Før denne typen AI eksisterte, måtte mennesker avhenge av menneske-drevne relætjenester hvor en tredje person satt på linjen og gjorde all transkripsjon.
Med Nagish, er det ingen relæoperatør, ingen tolk å koordinere, og ingen venting på at noen andre skal være tilgjengelige. Appen setter umiddelbarhet, personvernbeskyttelse og uavhengighet tilbake i telefonopptak, noe tradisjonelle relætjenester bare ikke kan tilby.
Siden Nagish er AI-drevet, kan det skaleres til hver type oppkall: arbeidsmøter, familiensjekker, nødsituasjoner og kundeservice-opptak. Appen er designet for å enkelt integrere i vanlig liv: brukerne kan beholde sitt eget nummer, få sanntids-tekstning og bruke samme app på telefonopptak og i personlige samtaler. Hele opplevelsen er designet for å redusere friksjon og gjøre kommunikasjon føle seg like naturlig og ubrutt som mulig.
På hvilke måter går din plattform utover standard transkripsjon eller tekstning for å gjøre interaksjoner mer naturlige og inkluderende?
Vi vet at språk ikke bare er ord, men også kultur, identitet og nuanser. Dette er spesielt sant for tegnspråk, som avhenger av ansiktsuttrykk, emosjon og regionale variasjoner. For å gjøre interaksjoner føle seg naturlige i stedet for mekaniske, samarbeider vi direkte med døve lingvister og tegnspråksekspertene. De hjelper å forme hvordan vår AI lærer og oppfører seg, så teknologien er bygget med samfunnet, ikke bare trenet på deres data.
Standard transkripsjonsverktøy stopper ofte ved “her er ordene som ble sagt”. Vårt mål er å støtte en faktisk samtale. Vi implementerer AI-agenter som kan gi kontekst og håndtere flyten av oppkallet utover bare å gi tekstning eller lese tekst til tale. I tillegg tilbyr Nagish sanntids-tekstning optimalisert for samtaleflyt, med funksjoner som justerbare fonter, spam-filtering, voicemail-transkripsjon og mulighet til å lagre og gjennomgå transkript på din egen enhet når du velger å. All dette skaper en ekvivalent opplevelse til den hørende mennesker har på telefonopptak.
Hva rolle spiller naturlig språkbehandling i å sikre at din plattform fanger ikke bare ord, men også intensjon og tone?
Naturlig språkbehandling og naturlig språkforståelse er i hjertet av hvordan Nagish fanger ikke bare hva noen sier, men hva de mener. Tale er fullt av hint som legger til kontekst, som tone, betoning og mer, og våre NLP-modeller er designet for å fange opp disse lagene så brukerne får mer enn en grunnleggende transkript. Målet er å gjøre tekstningen føle seg like naturlig som mulig.
Fordi Nagish er bygget for virkelige situasjoner, som medisinske oppkall, arbeidsmøter og selv nødsituasjoner, er våre modeller trenet for å håndtere rask tale, overlappende stemmer og emosjonell nuanser. Kontekstbevissthet er en stor grunn til at vi ofte overstiger både menneskelige transkriptere og andre AI-verktøy. Systemet gjetter ikke bare på ord; det bruker flyten av samtalen til å forstå intensjon.
Hvordan hjelper Nagish arbeidsgivere med å bygge mer inkluderende arbeidsplasser samtidig som de håndterer de finansielle og logistiske barrierene som lenge har begrenset tilgjengelighet?
Hos Nagish hjelper vi arbeidsgivere med å bygge mer inkluderende arbeidsplasser ved å fjerne de finansielle og logistiske barrierene som har gjort tilgjengelighet vanskelig å skalerer. Tradisjonelt har å lage en tilgjengelig arbeidsplass betydd å avhenge av planlagte tolker, som er essensielle men ikke alltid praktiske for hverdagskommunikasjon, som raske oppkall, uventede møter eller tidskritiske oppgaver. Disse begrensningene skaper forsinkelser, legger til kostnader og kan ufrivillig ekskludere døve og hørselshemmede ansatte fra arbeidsflyten.
Nagish arbeider for å endre denne dynamikken, og gir ansatte mulighet til å kommunisere uavhengig og på forespørsel. Når selskaper fjerner disse barrierene, kan mennesker delta fullt ut, noe som leder til sterkere team, bedre opphold og en mer likestilt arbeidsplass.
Ifølge en nylig undersøkelse vi har gjennomført, sa over 60% av døve og hørselshemmede respondenter at kommunikasjonsbarrierer hadde påvirket deres karrierevalg og profesjonelle fremme. Dette er en alvorlig utfordring som, selv med all fremgangen som er gjort de siste årene, viser at det fortsatt er mye arbeid igjen.
Vi muliggjør at arbeidsgivere kan gå fra reaktive tilpasninger til proaktive inklusjoner, og skape arbeidsplasser hvor hver ansatt kan bidra uavhengig og med tillit.
Hva type tilbakemelding har du mottatt fra døve og hørselshemmede brukere, og hvordan har det påvirket produktets utvikling?
Vi bygget Nagish med døvesamfunnet fra dag én, og siden da har vi mottatt en blanding av begeistring, nysgjerrighet og i sjeldne tilfeller, noen tøffhet, som er helt forventet. Døvesamfunnet er svært bevisst og nysgjerrig på ny teknologi, og med god grunn. De har hørt så mange over-lofter tidligere, og vi prøver å unngå det. Vi prioriterer fremgang over perfeksjon, som tar tid – men vårt endelige mål er perfeksjon.
Dette samfunnsfokusert synspunkt forsterkes av hva vi lærte i vår nylige rapport. Etter å ha adoptert hjelpemidler, viste brukerne en betydelig økning i daglig uavhengighet: antallet mennesker som kunne kommunisere uavhengig økte fra 37% til 60% for døve brukere, og fra 32,9% til 63% for hørselshemmede brukere. Denne endringen speiler tilbakemeldingen vi hører hver dag: mennesker ønsker verktøy som gjør kommunikasjon lettere, mer konsistent og tilgjengelig i øyeblikk når tolker ikke er tilgjengelige eller når de foretrekker personvernbeskyttelse.
Når det gjelder vår forskning på å lage bedre tegnspråktolkningsteknologier, er vårt mål ikke å erstatte menneskelige tolker eller eksisterende kommunikasjonsmetoder, men å legge til et annet alternativ, et verktøy som gjør tilgjengelighet mer konsistent og tilgjengelig overalt, når som helst. Tilbakemelding fra brukerne har forsterket hvor viktig et “tillegg” er, spesielt i øyeblikk når en tolk ikke er tilgjengelig eller når noen bare ønsker personvernbeskyttelse og uavhengighet. For mange skaper det situasjoner hvor kommunikasjon ellers ville ha følt seg ubekvem, forsinket eller utilgjengelig.
Vi tar en samfunnsfokusert tilnærming for å sikre at teknologien føles ekte, nøyaktig og respektfull. Så lenge vi fortsetter å bygge med tegnspråkbrukere, tror vi dette vil bli mottatt som et empowermentsskritt fremover.
Personvernbeskyttelse er en nøkkelbekymring i tilgjengelighetsteknologi – hvordan håndterer Nagish følsomme samtaler og opprettholder brukertillit?
Personvernbeskyttelse er kritisk for Nagish sin misjon om å gi døve og hørselshemmede brukere makt. Først og fremst kan Nagish eliminere behovet for en live-transkript. Det skaper allerede en følelse av personvernbeskyttelse som ikke var mulig tidligere.
På den tekniske siden er Nagish privat ved design. Vi recorder ikke oppkall, og lagrer aldri oppkallstranskript på våre servere utover varigheten av et oppkall. Vi bruker heller ikke noen oppkall-data for trening. Når brukerne velger å lagre transkript, lagres de lokalt på deres enhet i stedet for i en delt sky. Funksjoner som slutt-til-slutt-sikker tekstning og lokal lagring av transkript er der for å beskytte svært følsomme samtaler – enten det er om helse, arbeid eller personlige forhold.
Hvordan ser du på AI som omdefinerer tilgjengelighet i det kommende tiåret, og hvilke gap fortsatt må teknologien fylle?
En av de største problemene med digital tilgjengelighet er mangelen på utdanning og observasjon: Ingeniører implementerer ikke alt-tekst, designere velger utilgjengelige farger fordi de ser bra ut, og produktledere tar produktbeslutninger for KPI-er.
Så lenge AI blir mer og mer involvert i hver enkelt fase av produktutvikling, fra ingeniørarbeid til design til kopi, ser vi en proaktiv tilnærming til tilgjengelighet. AI kunne endre tilgjengelighet fra noe reaktivt og “patchet på” til noe proaktivt og omgivende. Vi vil også se en ny bølge av verktøy som vil augmentere kommunikasjon i ulike sammenhenger – ikke bare oppkall, men arbeidsplasser, klasserom, transport og offentlige tjenester – så at mennesker med funksjonsnedsettelser, og døve og hørselshemmede mennesker i særlig, ikke må stadig be om tilpasninger; de vil bare være der som standard.
Hvordan ser du på samarbeidet mellom menneskelige tolker og AI som utvikler seg – vil en av dem til slutt erstatte den andre, eller styrker de hverandre?
Tegnspråktolkere gjør fantastisk arbeid. De er essensielle for samfunnet, tilgjengelighet og kommunikasjon. Men virkeligheten er at det bare ikke finnes nok av dem. I USA, for eksempel, er det over 500 000 mennesker som bruker amerikansk tegnspråk som sitt primære språk, og bare om lag 10 000 sertifiserte tolker. Det betyr at det er et stort antall situasjoner – fra legebesøk, foreldre-lærermøter, jobbintervjuer og mer – ofte mangler tilgjengelig kommunikasjon.
Even når tolker er tilgjengelige, er det utfordringer rundt planlegging, kostnad og geografi. Noen som bor i et rural område ville ha mye vanskeligere å få en tolk, og den forsinkelsen kan ha virkelige konsekvenser, spesielt i helse- eller nødsituasjoner.
AI kan hjelpe med å brygge dette gapet. Det vi bygger, er ikke ment å erstatte tolker, men å komplementere deres arbeid og gjøre tilgjengelighet mer skalerbar. Tenk på det som et verktøy som trer inn når en menneskelig tolk ikke er tilgjengelig.
Google Translate erstattet ikke profesjonelle oversettere, men gjorde det mulig å brygge kommunikasjonsgap på en dag-til-dag-basis.
Med fremgang i datavisning og naturlig språkbehandling, har AI løftet løftet om å kunne begynne å tolke tegnspråk i sanntid. Dette betyr at flere mennesker kan kommunisere umiddelbart, enten det er gjennom et videoopptak, et offentlig skilt eller en nødservice.
Takk for det flotte intervjuet, lesere som ønsker å lære mer bør besøke Nagish.












