Connect with us

Bobby Samuels, Protegen perustaja ja toimitusjohtaja – Haastattelusarja

Haastattelut

Bobby Samuels, Protegen perustaja ja toimitusjohtaja – Haastattelusarja

mm

Bobby Samuels johtaa Protegen strategiaa ja toimeenpanoa tuotteiden, markkinointistrategioiden ja pääomarakenteen osalla. Hän perusti Protegen vuonna 2024 ja on toiminut sen toimitusjohtajana perustamisesta lähtien. Hänen johdollaan Protege on kerännyt 35 miljoonan dollarin rahoituksen ja kasvanut 30 miljoonan dollarin liikevaihtoon ensimmäisenä toimintavuotenaan. Aikaisemmin Bobby toimi Datavantin Privacy Hubin yleispäällikkönä, jossa hän auttoi yhtiön kasvua sen 7,0 miljardin dollarin fuusion aikana Ciox Healthin kanssa, josta syntyi Yhdysvaltain suurin terveydenhuollon dataympäristö. Aikaisemmin hän johti kumppanuuksia LiveRampissa, jossa hän kehitti asiantuntemusta neutralien dataverkkojen rakentamisessa. Bobbylla on M.B.A. tutkinto Stanfordin yliopiston kauppakorkeakoulusta ja A.B. tutkinto Harvard Collegesta, jossa hän toimi The Harvard Crimsonin puheenjohtajana. Hänellä on syvä asiantuntemus säädellyssä dataksiirrossa ja monimutkaisen infrastruktuurin kääntämisessä luotettavaksi tekoälymahdollistamiseksi yrityskumppaneille.

Protege on data-infrastruktuuriyhtiö, joka yhdistää omistajat arvokkaille, omistajille kuuluville tietokannoille ja kehittäjille, jotka rakentavat tekoälymallit, tarjoten hallitun ja yksityisyydensuojan mukaisen tavan lisensointiin ja pääsyyn koulutusdataan laajassa mittakaavassa. Perustettu vuonna 2024, alusta keskittyy lukittujen multimodaalidatien avaamiseen, kuten lääketieteellisiin tietoihin, kuvauksiin, videoihin ja ääniin, jotka ovat perinteisesti vaikeita tekoälytiimien hankkia, samalla kun antaa datan tarjoajille täydellisen hallinnan yksityisyyden, vaatimustenmukaisuuden ja rahoituksen suhteen. Tekoälyrakentajille Protege suoristaa löytämisen ja hankinnan kautta kuratoidun luettelon ja työkalujen avulla datatietojen suodattamiseen ja yhdistämiseen, auttaen nopeuttamaan kehitystä terveydenhuollon, median ja muiden alojen osalla. Ydinasiassa yhtiö pyrkii olemaan luotettava datataso tekoälylle, vähentämällä yhtä suurinta pullonkaulaa modernissa mallikehityksessä.

Mikä innoitti sinua perustamaan Protegen, ja miten kokemuksesi johtaa data-, yksityisyyden ja organisaatiomuutoksen aloitteita Datavantissa — sekä aikaisemmissa rooleissa LiveRampissa — muovasivat visiosi sen rakentamisesta?

Kokemukseni Datavantissa osoittivat minulle sekä datan yhdistämisen voiman että sen monimutkaisuuden vastuullisesti laajassa mittakaavassa. Datavant rakensi alustan, joka auttoi herkkien terveydentietojen yhdistämistä potilaiden yksityisyyden säilyttäen, ja selvisi minulle, että hyvin johdettu data voi ajaa massiivista sosiaalista edistystä. Mutta kun sitä ei ole, se voi aiheuttaa oikean vahinkoa.

Kun tekoäly kiihdytti, näin saman kaavan toistuvan: keskittyminen laskentaan ja tekoälyarkkitehtuuriin, mutta ei niin paljon itse datan kehittämiseen. Hypoteesimme on, että seuraava massiivinen pullonkaula on pääsy oikeaan dataan. Halusin rakentaa data-infrastruktuurin, joka tekee datan jakamisen turvalliseksi, avoimeksi ja vastavuoroisesti hyödylliseksi datanomistajille ja tekoälykehittäjille, samalla tarjoten tekoälyyn erikoistunutta asiantuntemusta tukemaan tutkimukseen perustuvia tekoälykehityksiä. Se johti Protegen perustamiseen.

Protege kuvaa itseään ”tekoälydatatalouden selkärangaksi”. Miten määrittelet tämän kerroksen, ja mitä tekoälylle tarkoitettu data-infrastruktuuri näyttää käytännössä?

Protege on sidekudos, joka antaa datanomistajien ja tekoälykehittäjien yhteistyön turvallisen ja tehokkaan. Tekoälylle tarkoitettu data-infrastruktuuri tekee enemmän kuin vain tallentaa tai siirtää dataa; se vahvistaa alkuperän, hallitsee käyttöoikeudet ja varmistaa, että jokainen tietokanta käytetään eettisesti ja suostumuksella. Käytännössä se on yksittäinen alusta, jossa sisällön omistajat voivat lisensointiin dataa luottavaisesti ja saada oikein korvauksen sen mukaan, ja tekoälykehittäjät voivat päästä käyttämään avaindatasettejä eri aloilla, domeeneissa, modaalisuuksissa ja muodoissa, joita he tarvitsevat koulutus- ja arviointimallien kehittämiseen vastuullisesti.

Yksi keskeisistä tehtävistäsi on varmistaa, että mallit koulutetaan lisensoituilla, edustavilla ja suostumusperustaisilla dataseteillä. Miten Protege toteuttaa eettisen hankinnan laajassa mittakaavassa?

Toteutamme eettisyyden kautta järjestelmiä, ei iskulauseita. Jokaisen datan ja sisällön lähteen kohdalla, jonka keräämme ja toimitamme, varmistamme, että oikeudenomistajat säilyttävät omistajuuden selkeiden lisensointiehtojen ja yksityisyydensuojan kanssa.

Alustamme yhdistää ihmisen, tutkimusorientoituneen asiantuntemuksen data-pipelineen ja järjestelmiin, jotka skaalautuvat toimittamaan oikeuksin suojattua dataa. Työskentelemme myös datan ostajakumppaneiden kanssa varmistaaksemme, että data on edustavaa maailman todellisista väestöistä ja heijastaa todellisia käyttötapausten todellista maailmaa. Käsittelemällä sekä data-toimittajia että data-asiakkaita selkeyden ja johdonmukaisuuden kanssa, pystymme ylläpitämään vaatimustenmukaisuutta, reiluutta ja luottamusta.

Teckoälyteollisuus on perinteisesti ollut ”kaiva ensin, kysy myöhemmin” -mentaaliteen omistaja. Miten näet avoimen datalisensoinnin muuttavan suhteita datan tarjoajien ja tekoälykehittäjien välillä?

Avoimuus muuttaa kaivamisen yhteistyöksi. Sen sijaan, että kaivettaisiin, tekoälyyritykset voivat eettisesti lisensointiin dataa tarkastetuista datan tarjoajista, mikä luo paremmat kannustimet molemmille puolille. Datan tarjoajat saavat tulot ja hallinnan, ja tekoälykehittäjät saavat puhdasemmman, laadukkaamman datasetin ilman oikeudellisia ja immateriaalioikeudellisia ongelmia.

Tämä muutos luo luottamusta, joka puolestaan vapauttaa nopeuden tekoälykehityksessä. Kun organisaatiot näkevät, että tekoäly voidaan rakentaa vastuullisesti selkeän suostumuksen ja korvauksen kautta datanomistajille, se vapauttaa enemmän käyttötapausten ja datatarpeita. Tämä luo enemmän kysyntää laadukkaille dataseteille, aloittaen luonnollisen pyörän: parhaat datalähteet houkuttelevat ostajia, ja ostajat houkuttelevat enemmän korkealaatuisia datalähteitä. Kaikki hyötyvät.

Synteettinen data nähdään usein ratkaisuna yksityisyyden ja puolueettomuuden haasteisiin. Missä näet oikean tasapainon olevan synteettisen ja todellisen maailman datasetien välillä, erityisesti säänneltyjen alojen kuten terveydenhuollon osalta?

Synteettinen data on hyödyllistä testaamiseen ja täydentämiseen, mutta se ei voi korvata kokonaan todellisen maailman toimintojen monimutkaisuutta, jotka tuottavat koulutus- ja arviointidataa. Tämä on erityisen totta terveydenhuollossa, jossa potilaiden hoitohistoria ja tulokset hoitotoimenpiteen yhteydessä ovat tärkeitä.

Uskomme, että tekoäly, jota ei ole koulutettu todellisen maailman kokonaisuuden mukaan, ei voi yhtäkkiä tuottaa synteettistä dataa, joka edustaa todellista maailmaa. Todennäköisesti oikea tasapaino on hybridiratkaisu, jossa tarvitsemme enemmän hyödyllistä, laadukasta dataa, joka on tällä hetkellä eristettyä ja jota on vapautettava, ja yhdistämme sen tekoälyllä generoituun synteettiseen dataan tiettyjen käyttötapausten osalta.

Miten Protege mahdollistaa organisaatioiden jakamisen arvokkaasta todellisesta maailmasta turvallisesti ilman, että he altistavat omistajien tietoja, potilastietoja tai immateriaalioikeuksia?

Turvallisuus ja yksityisyyden suoja on rakennettu jokaiseen prosessivaiheeseen. Sisäisistä järjestelmistämme tai de-identifioimis- ja yksityisyyden kumppaneistamme, jotka vahvistavat datasiirroksiamme, varmistamme, että datamme pysyy tarkoitetuissa rajoissa.

Terveydenhuollossa se tarkoittaa noudattamista yksityisyyden ja vaatimustenmukaisuuden kehyksistä kaikissa datasiirroksissamme. Medialla se tarkoittaa varmistamista, että sisältö on lisensoitu ainoastaan sille tarkoitetuksi käyttöön ennalta sovittujen lisensointiehtojen ja -kestojen mukaisesti.

Miten tulevaisuuden perusmallit jatkavat kehittymistään, mitkä tekijät määrittävät seuraavan sukupolven laadukkaiden koulutusdatan putkistojen?

Kolme periaatetta johdattelee: alkuperä, tarkkuus ja tarkoitus.

Alkuperä tarkoittaa täydellistä jäljitettävyyttä lähteeseen ja ehtoihin. Tarkkuus tarkoittaa kuratointia tiettyjen modaalisuuksien tai käyttötapausten osalta eikä yleisiä datayhtymiä tai dataa, joka ei ole täysin vastaavaa todellisen maailman tilanteita. Tarkoitus tarkoittaa datan valinnan kohdistamista todellisiin, konkreettisiin tuloksiin, eikä pelkästään ulkonäön mittareihin.

Yhdessä nämä luovat polun kohti korkealaatuisen datan käyttämistä parempien mallien ajamiseen.

Miten nousussa olevat sääntelyt, kuten EU:n tekoälylain ja tulevat Yhdysvaltain kehykset, vaikuttavat Protegen lähestymistapaan vaatimustenmukaisuuteen ja rajat ylittävään datayhteistyöhön?

Nämä sääntelyt vahvistavat lähestymistapaamme, johon perustimme yhtiön. Ne korostavat avoimuutta, alkuperää ja riskien hallintaa, jotka on sisäänrakennettu tuotteisiimme ja alustaan oletusarvoisesti.

Uskomme, että tulevaisuuden tekoälymahdollisuudet on suojattava oikeuksienomistajia ja ylläpidettävä tiukkoja yksityisyydensuojan valvontaa. Käsitellessämme näitä ehdottomina, autamme datakumppaneita ja asiakkaitamme etenemään luottamuksella ja luottamuksella muuttuvassa tekoälymaisemassa. Tavoitteemme on tehdä vastuullisesta tekoälykehityksestä ei vain oikea asia, vaan myös helpompi asia.

Mikä rooli näet datan avoimuuden ja alkuperän pelaavan jälleenrakentamisessa julkisen luottamusta tekoälyjärjestelmiin?

Luottamus alkaa jäljitettävyydestä. Kun ihmiset ymmärtävät, mistä data on peräisin ja miten sitä käytetään, he ovat todennäköisemmin luottavaisia tekoälytuloksiin.

Avoimuus ja alkuperä luo vastuullisuutta datanomistajasta mallikehittäjään ja loppukäyttäjään. Ne muuttavat tekoälyä mustasta laatikosta ymmärrettävämmäksi ja selitettävämmäksi.

Kun olet kasvanut 20-kertaisesti ja saanut 25 miljoonan dollarin rahoituksen sarjassa A, miten tasapainotat nopean kasvun ja ylläpidät Protegen eettisiä ja turvallisuus sitoumuksia — ja mitä seuraavaksi, kun jatkat muokkaamista siitä, miten organisaatiot kouluttavat tekoälymallit vastuullisesti?

Etiikka ja turvallisuus ovat perusta, joka mahdollistaa kasvumme. Jokainen uusi prosessi, kumppanuus ja tuote mitataan toimimalla niin, että muut voivat tarkkailla. Jos jokainen näkisi, miten toimimme ja mitä päätöksiä teimme, haluaisin, että he olisivat ylpeitä.

Kun suunnittelemme eteenpäin vuoteen 2026, laajennamme ulottuvuuttamme uusiin toimialoihin terveydenhuollon ja median ulkopuolelle, sekä luomme uusia data-tuotteita, kuten arviointidataa benchmarkingiin, kun tekoälyorganisaatiot pyrkivät parantamaan tekoälysuorituskykyä todellisissa käyttötapausten osalta. Tavoitteemme on olla yksittäinen luotettava alusta todelliselle tekoälydatasta ja asiantuntemuksesta, joka on rakennettu tekoälyedistystä varten pitkällä aikavälillä.

Kiitos haastattelusta, lukijat, jotka haluavat oppia lisää, voivat vierailla Protegen sivustolla.

Antoine on visionäärinen johtaja ja Unite.AI:n perustajakumppani, jota ohjaa horjumaton intohimo muokata ja edistää tulevaisuuden tekoälyä ja robottiikkaa. Sarjayrittäjänä hän uskoo, että tekoäly tulee olemaan yhtä mullistava yhteiskunnalle kuin sähkö, ja hänestä usein kuuluu ylistyksiä mullistavien teknologioiden ja AGI:n mahdollisuuksista.
Hänen ollessaan futuristi, hän on omistautunut tutkimiseen, miten nämä innovaatiot muokkaavat maailmaamme. Lisäksi hän on Securities.io:n perustaja, joka on alusta, joka keskittyy sijoittamiseen uraauurtaviin teknologioihin, jotka määrittelevät uudelleen tulevaisuuden ja muokkaavat koko sektoreita.