Connect with us

Roshanak Houmanfar, VP of Machine Learning Products at Integrate.ai – Haastattelusarja

Haastattelut

Roshanak Houmanfar, VP of Machine Learning Products at Integrate.ai – Haastattelusarja

mm

Roshanak (Ro) Houmanfar on Integrate.ai:n konenäöoppien tuotteiden varapresidentti, yhtiössä joka auttaa kehittäjiä ratkaisemaan maailman tärkeimmät ongelmat ilman herkkien tietojen vaarantamista. Ro:lla on erityinen kyky löytää uusia keinoja yksinkertaistaa monimutkaisia tekoälykäsitteitä ja kytkeä ne käyttäjien tarpeisiin. Hyödyntäen tätä asiantuntemusta, hän on Integrate.ai:n tehtävänä demokratisoida pääsy yksityisyyttä parantavaan teknologiaan.

Mikä alun perin veti sinut data-tieteeseen ja konenäköön?

Aloin matkani robotiikassa. Kokeiltuani eri kulmia robotiikassa ja polttanutani yhden hitsaustyöpajan, tulin siihen tulokseen, että olin enemmän kiinnostunut tekoälyn puolesta alallani, ja se vei minut konenäön maailmaan.

Voitko kuvata nykyistä rooliaasi ja mitä tyypillinen päiväsi näyttää?

Olen Integrate.ai:n tuotepuolen varapresidentti, SaaS-yrityksessä, joka auttaa kehittäjiä ratkaisemaan maailman tärkeimmät ongelmat ilman herkkien tietojen vaarantamista. Rakennamme työkaluja yksityisyyden suojaavalle konenäölle ja analytiikalle hajautetun tulevaisuuden datalle.

Arkityössäni työskentelen tiimien kanssa eri osastojen yli saavuttaaksesi kolme asiaa:

Mietin, miltä tulevaisuuden äly voisi näyttää ja miten voimme muokata tätä tulevaisuutta, jotta äly ratkaisee kriittisimmät ongelmat

Ymmärrän asiakkaiden haasteet ja miten voimme innovoida tehdäksemme heidän työstään vaikuttavampaa ja tehokkaampaa.

Varmistan, että visiomme ja asiakaspalautteet otetaan aina huomioon tuotekehityksessä, työskennellessäni yhteistyössä tiimien kanssa toimittamaan parhaat ominaisuudet.

Synteettinen data on tällä hetkellä kaikki konenäön buumi, mutta Integrate.ai ottaa hieman vastakkaisen lähestymistavan. Mitkä sovellukset eivät välttämättä ole synteettisen datan haluttuja vaihtoehtoja?

Ymmärtääksesi, milloin synteettinen data ei ole paras ratkaisu, on ensin ymmärrettävä, milloin se on. Synteettinen data on parhaimmillaan, kun mallin kohde on joko vähän todellista dataa tai ei lainkaan – esimerkiksi kylmässä käynnistyksessä ja teksti- ja kuvapohjaisessa mallin koulutuksessa. Joskus yksinkertaisesti ei ole tarpeeksi dataa kouluttamaan mallia, jolloin synteettinen data loistaa ratkaisuna.

Kuitenkin synteettinen data on yhä enenevissä määrin käytössä tilanteissa, joissa on runsaasti oikeaa dataa, mutta data on eristetty yksityisyydensuojan, keskittämiskustannusten tai muiden väyläesteiden vuoksi. Tämä on ilmiselvä väärinkäyttö synteettistä dataa. Näissä käyttötarkoituksissa on vaikea määritellä oikea abstraktiotaso synteettisen datan luomiseksi, mikä johtaa matalalaatuisiin synteettisiin datoihin, jotka voivat aiheuttaa sisäänrakennettua harhaa tai muita ongelmia, jotka ovat vaikeita debugata. Lisäksi mallit, jotka on koulutettu synteettisellä datalla, eivät vertaudu malleihin, jotka on koulutettu oikealla, laadukkaalla, yksityiskohtaisella lähdeaineistolla.

Mitä on federated learning, johon Integrate.ai erikoistuu?

Perinteisessä konenäössä kaikki mallin koulutusdata on keskitettävä yhteen tietokantaan. Federated learningissä mallit voivat kouluttaa hajautettuja, keskitettyjä tietoja – tai tietoa, joka sijaitsee kahdessa tai useammassa erillisessä tietokannassa eikä sitä voida helposti siirtää. Se toimii siten, että konenäön mallin osia koulutetaan siellä, missä data sijaitsee, ja mallin parametreja jaetaan osallistuvien tietokantojen välillä tuottaaksesi parannetun globaalin mallin. Ja koska dataa ei siirretä järjestelmässä, organisaatiot voivat kouluttaa malleja ilman esteitä, kuten yksityisyyden ja turvallisuuden sääntöjä, kustannuksia tai muita keskittämiseen liittyviä huolenaiheita.

Yleensä federated learningissä käytettävissä oleva koulutusdata on huomattavasti laadukkaampaa, koska keskitetty data menettää osan yksityiskohtaisuudestaan helpottamalla pääsyä yhteen paikkaan.

Miten yritys tunnistaa parhaat käyttötarkoitukset federated learningille?

Federated learning on konenäön teknologiapinoa, joka on suunniteltu tilanteisiin, joissa datan käyttäminen tai sen tuominen perinteiseen konenäön infrastruktuuriin on vaikeaa. Jos kohtaat yhtä seuraavista oireista, federated learning on sinulle:

  • Tarjoat älykkäitä tuotteita, joissa on analytiikkaa ja konenäköä, ja et voi luoda verkkovaikutuksia tuotteidesi kanssa, koska data kuuluu asiakkaillesi.
  • Työskentelet pitkien pääpalvelusopimusten tai data-jakosopimusten parissa päästäksesi käsiksi dataan kumppaneiltasi.
  • Viitat usein yhteistyösopimuksiin kumppaniesi kanssa, erityisesti tilanteissa, joissa tällaisen datakumppanuuden tulos on epäselvä sinulle.
  • Sinulla on runsaasti dataa ja haluat rahdata tietokantojasi, mutta pelkäät maineesi vaikutuksia.
  • Jo rahdat dataasi, mutta käytät paljon aikaa, vaivaa ja rahaa varmistaaksesi, että data on turvallista jakaa.
  • Infrastruktuurisi on jäänyt jälkeen pilveen siirtymisen aikana, mutta sinun on edelleen tarve analytiikkaan ja konenäköön.
  • Sinulla on useita tytäryhtiöitä, jotka kuuluvat samaan organisaatioon, mutta et voi suoraan jakaa tietoja heidän kanssaan.
  • Tiedot, joita käsittelet, ovat liian suuria tai kalliita siirtää, joten olet päättänyt joko olla käyttämättä niitä tai ETL-putkiviemärisi maksavat sinulle paljon.
  • Sinulla on sovellus tai mahdollisuus, josta uskot, että se voi vaikuttaa merkittävästi, mutta sinulla ei ole itse dataa, jotta se voisi toteutua.
  • Konenäömallisi ovat tasapainossa eivätkä tiedä, miten parantaa niitä edelleen.

Mitä on differentiaalinen yksityisyys, jota usein käytetään yhdessä federated learningin kanssa?

Differentiaalinen yksityisyys on tekniikka, joka varmistaa yksityisyyden samalla hyödyntäen konenäön voimaa. Käyttäen erilaisia matemaattisia menetelmiä kuin standardin de-identifioimismenetelmät, differentiaalinen yksityisyys lisää melua paikallisen mallin koulutuksen aikana, säilyttäen suurimman osan tietojoukon tilastollisista ominaisuuksista samalla rajoittaen riskiä, että yksittäisen henkilön data voidaan tunnistaa.

Ideaalisissa toteutuksissa differentiaalinen yksityisyys tuo riskin lähelle nollaa, kun taas konenäömallit säilyttävät saman suorituskyvyn – tarjoten kaiken tarvittavan turvallisuuden datan de-identifioimiseksi ilman mallin tuloksien laadun heikentämistä.

Differentiaalinen yksityisyys on sisällytetty integrate.ai:n alustaan oletusarvoisesti, jotta kehittäjät voivat varmistaa, ettei yksittäisen datan voi päätellä heidän malliparametreistaan.

Voitko kuvata, miten Integrate.ai:n federated learning -alusta toimii?

Meidän alustamme hyödyntää federated learning – ja differentiaalisen yksityisyyden teknologioita lukitakseen monia konenäön ja analytiikan ominaisuuksia, joita muuten olisi vaikea tai mahdoton käyttää yksityisyyden, luottamuksellisuuden tai teknisten esteiden vuoksi. Toiminnot, kuten mallin koulutus ja analytiikka, suoritetaan paikallisesti, ja vain lopputulokset kerätään turvallisessa ja luottamuksellisessa muodossa.

Integrate.ai on pakattu kehittäjätyökaluksi, joka mahdollistaa kehittäjien helpon integroimisen nämä ominaisuudet lähes mihin tahansa ratkaisuun helppokäyttöisen ohjelmointirajapinnan (SDK) ja pilvipalvelun avulla, joka tarjoaa lopusta loppuun hallinnan. Kun alusta on integroitu, loppukäyttäjät voivat tehdä yhteistyötä herkkien tietojoukkien kanssa, kun taas tietojen haltijat säilyttävät täydellisen hallinnan. Ratkaisut, jotka sisällyttävät Integrate.ai:n, voivat toimia sekä tehokkaina kokeilutyökaluina että valmiina tuotantopalveluina.

Mitkä ovat esimerkkejä siitä, miten tämä alusta voidaan käyttää tarkkuusdiagnostiikassa?

Yksi kumppaniverkosto, jonka kanssa työskentelemme, Autism Sharing Initiative, kerää tietoja autismidiagnooseista sekä genomiikanäytteitä ymmärtääkseen yhteyksiä eri genotyyppien ja fenotyyppien välillä autismidiagnooseihin. Kunkin yksittäisen datapaikan ei ole tarpeeksi tietoja, jotta konenäömallit toimisivat, mutta yhdessä ne muodostavat merkittävän otoksen. Kuitenkin datan siirtäminen aiheuttaa suuren riskin turvallisuudelle ja yksityisyydelle, ja koska sääntöjä ja sairaalapolitiikkaa, nämä tutkimuslaitokset ovat aina olettaneet, ettei dataa jaeta.

Toisessa verkostossa, jossa on samanlainen asetelma, tutkijat ovat kiinnostuneita parantamaan kliinisten tutkimusten määräämistä potilaille holistisemmalla näkemyksellä kunkin potilaan historiasta.

Eri tutkimuslaitokset, jotka osallistuvat, ovat päässeet eri tietoihin kustakin potilaasta – yksi laboratorio pääsee heidän lääketieteellisiin skannauksiinsa, toinen laboratorio pääsee heidän genomiikkaansa ja toinen laitos pääsee heidän kliinisten tutkimustuloksiinsa. Mutta nämä eri organisaatiot eivät voi suoraan jakaa tietoja toistensa kanssa.

Integrate.ai:n ratkaisun avulla kunkin organisaation voi päästä toistensa tietoihin heidän tarkoituksiinsa ilman datan siirtämistä tietojen haltijoiden luota ja siten noudattaen heidän sisäisiä käytäntöjään.

Voitko keskustella yksityisyyden merkityksestä ja miten Integrate.ai mahdollistaa sen?

Yksityisyyden tekeminen ymmärrettäväksi avaa monia ovia yrityksille ja organisaatioille, jotka historiallisesti ovat olleet suljettuja yksityisyyden riskin epäselvän luonteen vuoksi. Yksityisyydensäännöt, kuten GDPR, CCPA ja HIPPA, ovat erittäin monimutkaisia ja voivat vaihdella riippuen toimialasta, alueesta ja tietotyyppiä, mikä tekee vaikeaksi organisaatioille määritellä, mitkä dataprojektien on yksityisyydeltään turvallisia. Sen sijaan, että haaskaatte aikaa ja voimavaroja tarkistamalla jokaista ruutua, Integrate.ai:n federated learning -alusta tarjoaa sisäänrakennetun differentiaalisen yksityisyyden, homomorfisen salauksen ja turvallisen monen osapuolen laskennan, jotta kehittäjät ja tietojen haltijat voivat olla varmoja, että heidän projektinsa noudattavat sääntövaatimuksia ilman vaivaa kussakin kategoriassa.

Onko jotain muuta, mitä haluaisit jakaa Integrate.ai:sta?

Integrate.ai:n ratkaisu on erittäin kehittäjäystävällinen työkalu, joka mahdollistaa sääntöjenmukaisen, yksityisyyttä suojaavan ja turvallisen konenäön ja analytiikan herkkien tietolähteiden päällä. Yksinkertaisten API:iden kautta kaikki herkkien tietojen monimutkaisuus ja sopimukset on abstrahoidtu pois. Integrate.ai:n ratkaisu mahdollistaa data- ja ohjelmistokehittäjille hallita työkuormiaan turvallisesti vähäisimmällä vaikutuksella nykyiseen infrastruktuuriin ja työnkulkuihin.

Kiitos haastattelusta, lukijat, jotka haluavat oppia lisää, kannattaa vierailla integrate.ai:lla.

Antoine on visionäärinen johtaja ja Unite.AI:n perustajakumppani, jota ohjaa horjumaton intohimo muokata ja edistää tulevaisuuden tekoälyä ja robottiikkaa. Sarjayrittäjänä hän uskoo, että tekoäly tulee olemaan yhtä mullistava yhteiskunnalle kuin sähkö, ja hänestä usein kuuluu ylistyksiä mullistavien teknologioiden ja AGI:n mahdollisuuksista.
Hänen ollessaan futuristi, hän on omistautunut tutkimiseen, miten nämä innovaatiot muokkaavat maailmaamme. Lisäksi hän on Securities.io:n perustaja, joka on alusta, joka keskittyy sijoittamiseen uraauurtaviin teknologioihin, jotka määrittelevät uudelleen tulevaisuuden ja muokkaavat koko sektoreita.