Connect with us

Intervjuer

Yotam Oren, CEO & Cofounder of Mona Labs – Intervju-serie

mm

Yotam Oren, er CEO & Cofounder av Mona Labs, en plattform som gjør det mulig for bedrifter å transformere AI-initiativer fra laboratorieeksperimenter til skalerbare forretningsoperasjoner ved å forstå hvordan ML-modeller oppfører seg i virkelige forretningsprosesser og applikasjoner.

Mona analyserer automatisk atferden til dine maskinlæringsmodeller over beskyttede datasegmenter og i sammenheng med forretningsfunksjoner, for å oppdage potensiell AI-forvrengning. Mona tilbyr muligheten til å generere fullstendige rettferdighetsrapporter som møter bransjestandarder og reguleringer, og gir tillit til at AI-applikasjonen er kompatibel og fri for forvrengning.

Hva var det som først tiltalte deg til datavitenskap?

Datavitenskap er en populær karrierevei i min familie, så det var alltid et mulig alternativ. Selvfølgelig er den israelske kulturen svært pro-teknologi. Vi feirer innovative teknologer, og jeg hadde alltid oppfatningen av at datavitenskap ville gi meg en mulighet for vekst og prestasjon.

Til tross for dette, ble det først en personlig lidenskap når jeg nådde universitetsalder. Jeg var ikke en av de barna som startet å kode i ung alder. I min ungdom var jeg for opptatt av å spille basketball til å bry meg om datamaskiner. Etter videregående skole, tilbrakte jeg nære 5 år i militæret, i operative/kampledelsesroller. Så, på en måte, begynte jeg først å lære om datavitenskap når jeg måtte velge en akademisk hovedfag på universitetet. Det som fanget min oppmerksomhet umiddelbart, var at datavitenskap kombinerte løsning av problemer og læring av et språk (eller språk). To ting jeg var spesielt interessert i. Fra da av, var jeg hooked.

Fra 2006 til 2008 arbeidet du med kartlegging og navigasjon for en liten startup, hva var noen av dine viktigste erfaringer fra denne perioden?

Min rolle hos Telmap var å bygge en søkemotor på toppen av kart- og plasseringsdata.

Dette var de aller første dagene med “big data” i bedrifter. Vi kalte det ikke det, men vi samlet inn enorme datamengder og prøvde å trekke ut de mest betydningsfulle og relevante innsiktene for å vise til våre sluttbrukere.

En av de slående realisasjonene jeg hadde, var at bedrifter (inkludert oss) brukte så lite av deres data (la alene offentlig tilgjengelig ekstern data). Det var så mye potensiale for nye innsikter, bedre prosesser og erfaringer.

Den andre erfaringen var at å få tak i mer av vår data, avhengig av å ha bedre arkitektur, bedre infrastruktur og så videre.

Kunne du dele historien bak Mona Labs?

De tre av oss, medgrunnleggere, har vært omkring dataprodukter gjennom hele vår karriere.

Nemo, teknologidirektøren, er min collegevenn og klasskamerat, og en av de første ansatte i Google Tel Aviv. Han startet et produkt der som heter Google Trends, som hadde mye avansert analyse og maskinlæring basert på søkemotordata. Itai, den andre medgrunnleggeren og produktansvarlig, var på Nemos team i Google (og han og jeg møttes gjennom Nemo). De to var alltid frustrert over at AI-drevne systemer ble forlatt uten overvåking etter initial utvikling og testing. Til tross for vanskeligheter med å teste disse systemene før produksjon, visste teamene ikke hvordan godt deres prediktive modeller fungerte over tid. I tillegg syntes det som om de bare fikk tilbakemelding om AI-systemer når ting gikk dårlig og utviklingsteamet ble kalt inn for en “brannøvelse” for å fikse katastrofale problemer.

Rundt samme tid var jeg konsulent i McKinsey & Co, og en av de største barrierene jeg så for AI- og Big Data-programmer som skalerer i store bedrifter, var mangelen på tillit som forretningsstakeholdere hadde til disse programmene.

Den felles tråden her ble tydelig for Nemo, Itai og meg i samtaler. Industrien trengte infrastrukturen for å overvåke AI/ML-systemer i produksjon. Vi kom opp med visjonen om å gi denne visibiliteten for å øke tilliten til forretningsstakeholdere, og å enable AI-team å alltid ha hånd om hvordan deres systemer fungerte og å iterere mer effektivt.

Og det var da Mona ble grunnlagt.

Hva er noen av de nåværende problemene med mangelen på AI-gjennomsiktighet?

I mange bransjer har organisasjoner allerede brukt titalls millioner dollar på sine AI-programmer, og har sett noen initial suksess i laboratoriet og i små skala-utrollinger. Men å skalerer opp, å oppnå bred adopsjon og å få forretningsvirksomheten til å faktisk stole på AI, har vært en massiv utfordring for nesten alle.

Hvorfor skjer dette? Vel, det starter med det faktum at god forskning ikke automatisk oversettes til gode produkter (En kunde sa en gang til oss: “ML-modeller er som biler, det øyeblikk de forlater laboratoriet, mister de 20% av sin verdi”). Gode produkter har støttesystemer. Det finnes verktøy og prosesser for å sikre at kvaliteten opprettholdes over tid, og at problemer oppdages tidlig og håndteres effektivt. Gode produkter har også en kontinuerlig tilbakemeldingsloop, de har en forbedringscyklus og en veikart. Følgelig, gode produkter krever dyp og konstant ytelsesgjennomsiktighet.

Når det er mangelen på gjennomsiktighet, ender du opp med:

  • Problemer som forblir skjult i en periode og så plutselig dukker opp og forårsaker “brannøvelser”
  • Lange og manuelle undersøkelser og håndtering
  • Et AI-program som ikke er tillit til av forretningsbrukere og sponsorer og til slutt feiler i å skalerer

Hva er noen av utfordringene bak å gjøre prediktive modeller gjennomsiktige og pålitelige?

Gjennomsiktighet er en viktig faktor for å oppnå tillit, selvfølgelig. Gjennomsiktighet kan komme i mange former. Det finnes enkelt-prediksjons-gjennomsiktighet som kan inkludere å vise nivået av tillit til brukeren, eller å gi en forklaring/rationale for prediksjonen. Enkelt-prediksjons-gjennomsiktighet er hovedsakelig rettet mot å hjelpe brukeren å bli komfortabel med prediksjonen. Og så, det finnes en generell gjennomsiktighet som kan inkludere informasjon om prediktiv nøyaktighet, uventede resultater og potensielle problemer. Generell gjennomsiktighet er nødvendig for AI-teamet.

Det mest utfordrende delen av generell gjennomsiktighet er å oppdage problemer tidlig, å varsle den relevante teammedlemmet så de kan ta korrektive tiltak før katastrofer skjer.

Hvorfor det er utfordrende å oppdage problemer tidlig:

  • Problemer begynner ofte små og simmer, før de til slutt dukker opp og forårsaker katastrofer.
  • Problemer begynner ofte på grunn av ukontrollerbare eller eksterne faktorer, som datakilder.
  • Det finnes mange måter å “dele verden” og å utforske problemer i små lommer kan resultere i mye støy (varslingstrøt), når dette gjøres på en naiv måte.

En annen utfordrende del av å gi gjennomsiktighet er den enorme spredningen av AI-bruksområder. Dette gjør en “one-size-fits-all”-tilnærming nesten umulig. Hvert AI-bruksområde kan inkludere forskjellige datastrukturer, forskjellige forretningscykler, forskjellige suksesskriterier og ofte forskjellige tekniske tilnærminger og selv stacker.

Så, det er en monumental oppgave, men gjennomsiktighet er så grunnleggende for suksessen til AI-programmene, så du må gjøre det.

Kunne du dele noen detaljer om løsningene for NLU / NLP-modeller og chatbots?

Konversasjons-AI er en av Mona’s kjerneområder. Vi er stolte av å støtte innovative selskaper med en rekke konversasjons-AI-bruksområder, inkludert språkmodeller, chatbots og mer.

En felles faktor over disse bruksområdene er at modellene opererer nær (og noen ganger synlig) kunder, så risikoen for inkonsistent ytelse eller dårlig atferd er høyere. Det blir så viktig for konversasjons-AI-team å forstå systematferd på en detaljert nivå, som er et område av styrke for Mona’s overvåkingsløsning.

Hva Mona’s løsning gjør som er ganske unikt, er å systematisk si gjennom grupper av samtaler og finne lommer hvor modellene (eller botene) mislykkes. Dette lar konversasjons-AI-teamene identifisere problemer tidlig og før kundene legger merke til dem. Denne funksjonaliteten er en kritisk beslutningsfaktor for konversasjons-AI-team når de velger overvåkingsløsninger.

For å summerer det opp, Mona tilbyr en løsning for konversasjons-AI-overvåking. Den starter med å sikre at det finnes en enkelt kilde for informasjon om systemets atferd over tid, og fortsetter med kontinuerlig sporing av nøkkel-ytelsesindikatorer og proaktive innsikter om lommer av misatferd – som lar teamene ta forbyggende, effektive korrektive tiltak.

Kunne du tilby noen detaljer om Mona’s innsikt-motor?

Ja. La oss begynne med motivasjonen. Målet med innsikt-motoren er å fremheve anomalier til brukerne, med bare nok kontekstinformasjon og uten å skape støy eller føre til varslingstrøt.

Innsikt-motoren er en enestående analytisk arbeidsflyt. I denne arbeidsflyten, søker motoren etter anomalier i alle segmenter av data, for å oppdage problemer tidlig når de fortsatt er “små”, og før de påvirker hele datamengden og nedstrøms forretnings-KPI-er. Den bruker så en proprietær algoritme for å oppdage årsakene til anomalier og sikrer at hver anomali varsles bare en gang, så støy unngås. Anomali-typer som støttes inkluderer: Tidsserie-anomalier, drifter, outliers, modell-degradering og mer.

Innsikt-motoren er høyt tilpassbar via Mona’s intuitive no-code/low-code-konfigurasjon. Tilpassbarheten til motoren gjør Mona til den mest fleksible løsningen på markedet, som dekker et bredt spekter av bruksområder (f.eks. batch og strømming, med/uten forretnings-tilbakemelding / grunn-sannhet, over modellversjoner eller mellom trening og inferens, og mer).

Til slutt er innsikt-motoren støttet av en visualiseringsdashbord, hvor innsikter kan vises, og en rekke undersøkelsesverktøy for å muliggjøre årsak- og videre utforskning av kontekstinformasjonen. Innsikt-motoren er også fullt integrert med en varsling-motor som lar deg mata innsikter til dine egne arbeidsmiljøer, inkludert e-post, samarbeidsplattformer og så videre.

Den 31. januar, Mona avduket sin nye AI-rettferdighetsløsning, kunne du dele noen detaljer om hva denne funksjonaliteten er og hvorfor den er viktig?

AI-rettferdighet handler om å sikre at algoritmer og AI-drevne systemer generelt tar ubiasede og rettferdige beslutninger. Å håndtere og forebygge forvrengning i AI-systemer er avgjørende, da de kan resultere i betydelige virkelige konsekvenser. Med AI’s økende fremtreden, ville påvirkningen på folks daglige liv bli synlig i flere og flere steder, inkludert å automatisere vår kjøring, å oppdage sykdommer mer nøyaktig, å forbedre vår forståelse av verden og til og med å skape kunst. Hvis vi ikke kan stole på at det er rettferdig og ubiast, hvordan kan vi tillate det å fortsette å spre?

En av de største årsakene til forvrengning i AI er enkelt og greit evnen til modell-trening-data å representere den virkelige verden fullstendig. Dette kan stamme fra historisk diskriminering, under-representasjon av bestemte grupper eller selv bevisst manipulering av data. For eksempel, et ansikts-gjenkjennelsessystem trent på hovedsakelig lys-hudede individer, er sannsynligvis å ha en høyere feilrate i å gjenkjenne individer med mørkere hudtoner. Tilsvarende, et språk-modell trent på tekst-data fra en smal sett av kilder, kan utvikle forvrengning hvis data er skjev mot bestemte verdensbilder, på tema som religion, kultur og så videre.

Mona’s AI-rettferdighetsløsning gir AI- og forretnings-teamene tillit til at deres AI er fri for forvrengning. I regulerte sektorer, kan Mona’s løsning forberede teamene for overholdelse-klarhet.

Mona’s rettferdighetsløsning er spesiell fordi den sitter på Mona-plattformen – en bro mellom AI-data og modeller og deres virkelige verdens implikasjoner. Mona ser på alle deler av forretningsprosessen som AI-modellen betjener i produksjon, for å korrelere mellom trening-data, modell-atferd og faktiske virkelige resultater for å gi den mest omfattende vurderingen av rettferdighet.

For det andre, har den en enestående analytisk motor som lar seg fleksible segmentering av data for å kontrollere relevante parametre. Dette lar korrekte korrelasjons-vurderinger i riktig kontekst, unngår Simpson’s Paradox og gir en dyp, virkelig “forvrengnings-score” for enhver ytelses-måling og på enhver beskyttet funksjon.

Så, totalt sett ville jeg si at Mona er et grunnleggende element for team som må bygge og skalerer ansvarlig AI.

Hva er din visjon for fremtiden av AI?

Dette er et stort spørsmål.

Jeg tror det er rett fremt å forutsi at AI vil fortsette å vokse i bruk og påvirkning over en rekke bransjer og aspekter av folks liv. Men det er vanskelig å ta seriøst en visjon som er detaljert og samtidig prøver å dekke alle bruksområdene og implikasjonene av AI i fremtiden. Fordi ingen virkelig vet nok til å male et slikt bilde troverdig.

Det som vi vet sikkert, er at AI vil være i hendene på flere mennesker og tjene flere formål. Behovet for styring og gjennomsiktighet vil derfor øke betydelig.

Ekte synlighet inn i AI og hvordan det fungerer, vil spille to primære roller. Først, vil det hjelpe å innstille tillit hos mennesker og løfte motstandsbarrerene for raskere adopsjon. For det andre, vil det hjelpe hvem som helst som opererer AI å sikre at det ikke kommer ut av kontroll.

Takk for det flotte intervjuet, lesere som ønsker å lære mer, bør besøke Mona Labs.

Antoine er en visjonær leder og grunnleggende partner i Unite.AI, drevet av en urokkelig lidenskap for å forme og fremme fremtiden for AI og robotikk. En seriegründer, han tror at AI vil være like disruptiv for samfunnet som elektrisitet, og blir ofte tatt i å tale om potensialet for disruptiv teknologi og AGI.
Som en futurist, er han dedikert til å utforske hvordan disse innovasjonene vil forme vår verden. I tillegg er han grunnleggeren av Securities.io, en plattform som fokuserer på å investere i banebrytende teknologier som omdefinerer fremtiden og omformer hele sektorer.