Stumm Roshanak Houmanfar, VP of Machine Learning Products bei Integrate.ai - Interview Series - Unite.AI
Connect mat eis

Interviewen

Roshanak Houmanfar, VP of Machine Learning Products bei Integrate.ai - Interview Series

mm
aktualiséiert on

Roshanak (Ro) Houmanfar ass de VP vu Maschinnléiereprodukter fir integréieren.ai, eng Firma déi Entwéckler hëlleft déi wichtegst Problemer vun der Welt ze léisen ouni sensibel Donnéeën ze riskéieren. Ro huet e besonnesche Geschéck fir nei Weeër ze fannen fir komplex AI Konzepter ze vereinfachen an se mat de Benotzerbedürfnisser ze verbannen. Mat dëser Expertise ass si un der Spëtzt vun der Missioun integrate.ai fir den Zougang zu Privatsphär-verbesserend Technologie ze demokratiséieren.

Wat huet Iech ufanks un Datenwëssenschaft a Maschinnléieren ugezunn?

Ech hunn meng Rees an der Robotik ugefaang. Nodeems ech mat de verschiddene Wénkel vun der Robotik experimentéiert hunn, an e Schweesslabo ofbrennen, sinn ech zur Conclusioun komm, datt ech méi op d'kënschtlech Intelligenz Säit vu mengem Feld ugezunn sinn, an dat huet mech an déi wonnerbar Welt vum Maschinnléieren gefouert.

Kënnt Dir Är aktuell Roll beschreiwen a wéi en Duerchschnëttsdag fir Iech ausgesäit?

Ech sinn de VP vum Produkt bei integréieren.ai, eng SaaS Firma déi Entwéckler hëlleft déi wichtegst Problemer vun der Welt ze léisen ouni sensibel Donnéeën ze riskéieren. Mir bauen Tools fir Privatsphär-sécher Maschinnléieren an Analyse fir déi verdeelt Zukunft vun Daten.

A mengem Alldag schaffen ech mat eisen Teams iwwer Funktiounen fir dräi Saachen z'erreechen:

Denkt duerch wéi d'Zukunft vun der Intelligenz kéint ausgesinn a wéi mir dës Zukunft kënne gestalten sou datt d'Intelligenz déi kriteschst Problemer léist

Verstinn de Schmerzpunkte vun eise Clienten a wéi mir kënnen innovéieren fir hir Aarbecht méi beaflosst an effizient ze maachen.

Vergewëssert Iech datt eis Visioun a Client Feedback ëmmer an der Produktentwécklung berücksichtegt ginn, zesumme mat eisen Teams schaffen fir déi bescht Features ze liwweren.

Synthetesch Donnéeën sinn am Moment all Roserei am Maschinnléieren, awer integrate.ai hëlt e bëssen contraire Approche. Wat sinn e puer Uwendungen wou synthetesch Daten vläicht net eng wënschenswäert Optioun sinn?

Fir ze verstoen wann synthetesch Donnéeën net déi bescht Léisung sinn, ass et wichteg als éischt allgemeng ze verstoen wann et ass. Synthetesch Donnéeën sinn am beschten benotzt wann d'Modelléierungsziel entweder eng kleng Quantitéit vun realen Daten verfügbar ass oder guer keng - zum Beispill bei Kältstartproblemer an Text-= a Bild-baséiert Modelltraining. Heiansdo sinn et einfach net genuch Daten néideg fir e Modell ze trainéieren, dat ass wann synthetesch Daten als Léisung blénken.

Wéi och ëmmer, synthetesch Donnéeën ginn ëmmer méi a Situatiounen benotzt wou vill reell Daten existéieren, awer dës Donnéeën si verschleeft wéinst Privatsphärreglementer, Zentraliséierungskäschten oder aner Interoperabilitéit Stroossespären. Dëst ass e flagrante Mëssbrauch vu syntheteschen Daten. An dëse Benotzungsfäll ass et schwéier de richtege Abstraktiounsniveau fir synthetesch Datekreatioun ze bestëmmen, wat zu niddereg-Qualitéit syntheteschen Donnéeën resultéiert, déi gebierteg Bias oder aner Probleemer op der Linn verursaache kënnen, déi schwéier ze debuggen sinn. Zousätzlech, Modeller, déi op syntheteschen Daten trainéiert sinn, vergläichen just net mat deenen, déi op realen, héichqualitativen, granuläre Quelldaten trainéiert sinn.

Integrate.ai spezialiséiert sech fir federéiert Léierléisungen ze bidden, kënnt Dir beschreiwen wat federéiert Léieren ass?

Am traditionelle Maschinnléiere mussen all Modelltrainingsdaten an enger Datebank zentraliséiert ginn. Mat federéierte Léieren kënnen Modeller op dezentraliséierter, verdeelt Datesätz trainéieren - oder Daten déi an zwou oder méi getrennten Datenbanken wunnen a kënnen net einfach geréckelt ginn. Wéi et funktionnéiert ass datt Portioune vun engem Maschinnléiermodell trainéiert ginn wou d'Daten lokaliséiert sinn, a Modellparameter ginn ënner deelhuelende Datesätz gedeelt fir e verbesserte globale Modell ze produzéieren. A well keng Daten am System bewegt, kënnen Organisatiounen Modeller trainéieren ouni Stroossespären wéi Privatsphär a Sécherheetsreglementer, Käschten oder aner Zentraliséierungsbedenken.

Allgemeng sinn d'Trainingsdaten, déi mat federéiertem Léieren zougänglech sinn, och vill méi héich Qualitéit, well zentraliséiert Daten tendéieren e puer vu senge Granularitéit op Käschte vun der Liichtegkeet op enger Plaz ze verléieren.

Wéi identifizéieren eng Entreprise déi bescht Benotzungsfäll fir federéiert Léieren?

Federated Learning ass e Maschinnléieren Tech Stack gebaut fir Situatiounen wou Zougang zu Daten oder an déi traditionell Infrastruktur vu Maschinnléiere mat zentraliséierten Dateséen bréngt schmerzhaft ass. Wann Dir ee vun de folgende Symptomer erliewt, ass federéiert Léieren fir Iech:

  • Dir liwwert Smart Produkter ugedriwwen duerch Analyse a Maschinnléieren an Dir kënnt net Netzwierkeffekter fir Är Produkter erstellen well d'Donnéeën vun Äre Clienten gehéiert.
  • Dir schafft duerch laang Master-Serviceverträg oder Datenaustauschverträg fir Zougang zu Daten vun Äre Partner ze kréien.
  • Dir verbréngt vill Zäit fir Zesummenaarbechtskontrakter mat Äre Partner ze bilden, besonnesch a Situatiounen wou d'Resultat vun dëser Datepartnerschaft Iech net kloer ass.
  • Dir sëtzt op e Räichtum vun Donnéeën a wëllt Är Datesätz monetiséieren, awer Dir hutt Angscht virun den Implikatioune fir Äre Ruff.
  • Dir monetiséiert schonn Är Donnéeën, awer Dir verbréngt vill Zäit, Effort a Suen fir d'Donnéeën sécher ze deelen.
  • Är Infrastruktur ass während der Bewegung an d'Wollek hannerlooss ginn, awer Dir braucht nach ëmmer Analyse a Maschinnléieren.
  • Dir hutt vill Filialen déi zu der selwechter Organisatioun gehéieren, awer net direkt Daten mateneen deelen.
  • D'Datesätz, mat deenen Dir beschäftegt, sinn ze grouss oder deier fir ronderëm ze réckelen, sou datt Dir entweder decidéiert hutt se net ze benotzen oder Är ETL Pipelines kaschten Iech vill.
  • Dir hutt eng Applikatioun oder eng Chance, déi Dir mengt, e wesentlechen Impakt ka maachen, awer Dir hutt net d'Donnéeën selwer fir et ze maachen.
  • Är Maschinn Léieren Modeller hunn plateau an Dir wësst net wéi se weider ze verbesseren.

Differential Privatsphär gëtt dacks a Verbindung mat federéierte Léieren benotzt, wat ass dëst spezifesch?

Differential Privatsphär ass eng Technik fir Privatsphär ze garantéieren a gläichzäiteg d'Kraaft vum Maschinnléieren ze profitéieren. Mat enger anerer Mathematik wéi Standard De-Identifikatiounstechniken, differenzéierend Privatsphär füügt Kaméidi wärend der lokaler Modelltraining derbäi, déi meescht vun de statistesche Fonctiounen vun der Dataset erhalen, wärend de Risiko limitéiert datt d'Donnéeën vun engem Individuum identifizéiert ginn.

An idealen Implementatiounen bréngt d'Differential Privatsphär Risiko no bei Null, wärend Maschinnléiere Modeller ähnlech Leeschtung behalen - déi all néideg Sécherheet fir Datende-Identifikatioun ubidden, ouni d'Qualitéit vun de Modellresultater ze reduzéieren.

Differential Privatsphär ass abegraff integréieren.ai's Plattform par défaut, sou datt d'Entwéckler kënnen suergen, datt individuell Donnéeën net aus hire Modellparameter ofgeleet kënne ginn.

Kënnt Dir beschreiwen wéi d'integréiert.ai federéiert Léierplattform funktionnéiert?

Eis Plattform profitéiert federéiert Léieren an differenziell Privatsphär Technologien fir eng Rei vu Maschinnléieren an Analysefäegkeeten op Daten opzemaachen, déi soss schwéier oder onméiglech wieren zougänglech ze kréien wéinst Privatsphär, Vertraulechkeet oder techneschen Hürden. Operatiounen wéi Modelltraining an Analyse ginn lokal ausgefouert, an nëmmen Ennresultater ginn op eng sécher a vertraulech Manéier aggregéiert.

integrate.ai ass als Entwéckler-Tool verpackt, wat d'Entwéckler erlaabt dës Fäegkeeten nahtlos a bal all Léisung ze integréieren mat engem einfach ze benotzen Softwareentwécklungskit (SDK) an Ënnerstëtzung Cloud Service fir End-to-End Management. Wann d'Plattform integréiert ass, kënnen d'Endbenotzer iwwer sensibel Datesets kollaboréieren, während d'Depoter voll Kontroll behalen. Léisungen déi integrate.ai integréieren kënnen als effektiv Experimentatiounsinstrumenter a Produktiounsfäeg Servicer déngen.

Wat sinn e puer Beispiller vu wéi dës Plattform a Präzisiounsdiagnostik benotzt ka ginn?

Ee vun den Netzwierker vu Partner mat deenen mir schaffen, de Autism Sharing Initiative, sammelt Informatioun am Zesummenhang mat Autismusdiagnostik wéi och Proben vu Genomdaten fir d'Verbindunge vun de verschiddene Genotypen a Phänotypen zu Autismusdiagnosen ze verstoen. All eenzel daten Site huet net genuch Datesätz fir d'Maschinn Léiermodeller ze maachen, awer kollektiv erstellen se eng sënnvoll Probegréisst. Wéi och ëmmer, d'Bewegung vun Donnéeën stellt en héije Risiko fir Sécherheet a Privatsphär, a wéinst Reglementer a Spidolspolitik hunn dës Fuerschungsinstituter ëmmer default net deelen.

An engem anere Netzwierk, mat engem ähnlechen Setup, sinn d'Fuerscher interesséiert fir d'Verzeechnung vu klineschen Studien u Patienten ze verbesseren andeems se eng méi holistesch Vue op d'Geschicht vun all Patient benotzen.

Déi verschidde Fuerschungsinstituter involvéiert hunn Zougang zu variéierend Informatioun iwwer all Patient - ee Labo huet Zougang zu hire medizinesche Scans, deen aneren Labo huet Zougang zu hir genomesch Informatioun, an en aneren Institut huet hir klinesch Studieresultater. Awer dës verschidden Organisatiounen kënnen net direkt Informatioun matenee deelen.

Mat der integrate.ai Léisung kann all Organisatioun op all aner Daten fir hir Ziler zougräifen ouni d'Donnéeën vun den Dateschutzer ze verschwannen an dofir un hir intern Politik ze halen.

Kënnt Dir iwwer d'Wichtegkeet diskutéieren fir d'Privatsphär verständlech ze maachen a wéi integrate.ai dat erméiglecht?

Privatsphär verständlech ze maachen heescht vill Dieren opzemaachen fir Geschäfter an Organisatiounen, déi historesch zougemaach goufen wéinst der eendeiteg Natur vum Risiko. Privatsphärreglementer wéi GDPR, CCPA an HIPPA sinn onheemlech komplex a kënnen ofhängeg vun der Industrie, der Regioun an der Aart vun Daten ënnerscheeden, wat et schwéier mécht fir Organisatiounen ze bestëmmen wat fir Dateprojete Privatsphär sécher sinn. Anstatt Zäit a Mannkraaft ze verschwenden, all Këscht ze iwwerpréiwen, integréiert.ai's federéierte Léierplattform bitt eng agebauter Differential Privatsphär, homomorphesch Verschlësselung a sécher Multi-Partei Berechnung, sou datt Entwéckler an Datespezialisten sech roueg kënne wësse wëssen datt hir Projeten automatesch de Regulatioune respektéieren. Ufuerderunge, ouni de Stress duerch all kategoresch Hoop ze sprangen.

Gëtt et nach eppes wat Dir gär iwwer integrate.ai deele wëllt?

integrate.ai d'Léisung ass en onheemlech Entwéckler-frëndlecht Tool dat et erlaabt konform, Privatsphär behalen a sécher Maschinnléieren an Analyse uewen op sensiblen Datequellen. Duerch einfach ze benotzen APIen gëtt all d'Komplexitéit vun der Regulatiounskonformitéit a Kontrakter uewen op sensiblen Donnéeën abstrachéiert. D'Léisung vun integrate.ai erlaabt Datewëssenschaftler a Softwareentwéckler hir Aarbechtslaascht sécher ze managen mat minimalem Impakt op hir aktuell Infrastruktur a Workflows.

Merci fir dee super Interview, Lieser déi méi gewuer ginn solle besichen integréieren.ai.

A founding partner of unite.AI & e Member vun der Forbes Technology Council, Den Antoine ass a futuristesch déi passionéiert ass iwwer d'Zukunft vun AI & Robotik.

Hien ass och de Grënner vun Securities.io, eng Websäit déi sech op d'Investitioun an d'Stéierungstechnologie konzentréiert.