škrbina Leland Hyman, vodilni podatkovni znanstvenik pri Sherlock Biosciences – serija intervjujev – Unite.AI
Povežite se z nami

Intervjuji

Leland Hyman, vodilni podatkovni znanstvenik pri Sherlock Biosciences – serija intervjujev

mm

objavljeno

 on

Leland Hyman je vodilni podatkovni znanstvenik pri Sherlock Biosciences. Je izkušen računalničar in raziskovalec z izkušnjami na področju strojnega učenja in molekularne diagnostike.

Sherlock Biosciences je biotehnološko podjetje s sedežem v Cambridgeu v Massachusettsu, ki razvija diagnostične teste z uporabo CRISPR. Njihov namen je motiti molekularno diagnostiko z boljšimi, hitrejšimi in cenovno dostopnimi testi.

Kaj vas je na začetku pritegnilo k računalništvu?

Programirati sem začel že zelo mlad, vendar me je zanimalo predvsem izdelovanje video iger s prijatelji. Med študijem na kolidžu in podiplomskem študiju se je moje zanimanje za druge aplikacije računalništva povečalo, zlasti z vsem prelomnim delom na področju strojnega učenja v zgodnjih 2010-ih. Celotno področje se je zdelo kot tako vznemirljiva nova meja, ki bi lahko neposredno vplivala na znanstvene raziskave in naše vsakdanje življenje – nisem si mogel kaj, da me to ne bi zasvojilo.

Opravljali ste tudi doktorat znanosti. pri celični in molekularni biologiji, kdaj ste se prvič zavedli, da se bosta področji križali?

To vrsto intersekcijskega dela z računalništvom in biologijo sem začel opravljati že na podiplomskem študiju. Moj laboratorij se je osredotočal na reševanje problemov proteinskega inženiringa s sodelovanjem med zagrizenimi biokemiki, računalniškimi znanstveniki in vsemi vmes. Hitro sem spoznal, da lahko strojno učenje zagotovi dragocene vpoglede v biološke sisteme in zelo olajša eksperimentiranje. Nasprotno pa sem pridobil tudi spoštovanje vrednosti biološke intuicije pri konstruiranju modelov strojnega učenja. Po mojem mnenju je natančno oblikovanje problema ključni element strojnega učenja. Zato verjamem, da imajo lahko skupna prizadevanja na različnih področjih velik vpliv.

Od leta 2022 delate pri Sherlock Biosciences, ali lahko delite nekaj podrobnosti o tem, kaj vključuje vaša vloga?

Trenutno vodim računalniško skupino pri Sherlock Biosciences. Naša skupina je odgovorna za oblikovanje komponent, ki so vključene v naše diagnostične teste, povezovanje z eksperimentalci, ki preizkušajo te modele v mokrem laboratoriju, in gradnjo novih računalniških zmogljivosti za izboljšanje modelov. Poleg usklajevanja teh dejavnosti delam na delih naše kodne baze, ki se nanašajo na strojno učenje, eksperimentiram z novimi arhitekturami modelov in novimi načini za simulacijo fizike DNK in RNK, vključene v naše teste.

Strojno učenje je jedro Sherlock Biosciences. Ali lahko opišete vrsto podatkov in količino podatkov, ki se zbirajo, ter kako ML nato te podatke razčleni?

Med razvojem testov testiramo na desetine do stotine kandidatov za teste za vsakega novega patogena. Čeprav se velika večina teh kandidatov ne bo uvrstila na komercialni preizkus, jih vidimo kot priložnost, da se učimo iz svojih napak. V teh poskusih merimo dve ključni stvari: občutljivost in hitrost. Naši modeli vzamejo zaporedja DNK in RNK v vsakem testu kot vhod in se nato naučijo predvideti občutljivost in hitrost testa.

Kako ML predvidi, katere komponente molekularne diagnostike bodo delovale z največjo hitrostjo in natančnostjo?

Ko razmišljamo o tem, kako se človek uči, obstajata dve glavni strategiji. Po eni strani se lahko oseba nauči, kako opraviti nalogo s čistim poskusom in napakami. Nalogo so lahko ponovili in po številnih neuspehih so sčasoma sami ugotovili pravila naloge. Ta strategija je bila precej priljubljena pred internetom. Lahko pa tej osebi zagotovimo učitelja, ki ji takoj pove pravila naloge. Učenec z učiteljem bi se lahko učil veliko hitreje kot s pristopom poskusov in napak, vendar le, če ima dobrega učitelja, ki popolnoma razume nalogo.

Naš pristop k usposabljanju modelov strojnega učenja je nekje med tema dvema strategijama. Čeprav nimamo popolnega »učitelja« za naše modele strojnega učenja, jih lahko začnemo z nekaj znanja o fiziki verig DNK in RNK v naših testih. To jim pomaga, da se naučijo narediti boljše napovedi z manj podatki. Da bi to naredili, izvajamo več biofizikalnih simulacij na zaporedjih DNK in RNK našega testa. Nato rezultate vnesemo v model in ga prosimo, da predvidi hitrost in občutljivost testa. Ta postopek ponovimo za vse poskuse, ki smo jih izvedli v laboratoriju, in model pokaže razliko med svojimi napovedmi in tem, kar se je v resnici zgodilo. Z zadostnim številom ponavljanj se sčasoma nauči, kako sta fizika DNK in RNK povezana s hitrostjo in občutljivostjo posameznega testa.

Na katere druge načine algoritme AI uporablja Sherlock Biosciences?

Za reševanje najrazličnejših problemov smo uporabili algoritme strojnega učenja. Nekaj ​​primerov, ki pridejo na misel, je povezanih s tržnimi raziskavami in analizo slik. Za tržne raziskave smo lahko usposobili modele, ki se seznanijo z različnimi vrstami strank in številom ljudi, ki bi lahko imeli nezadovoljeno potrebo po testiranju bolezni. Izdelali smo tudi modele za analizo slik trakov bočnega pretoka (vrsta testa, ki se običajno uporablja pri testih na COVID brez recepta) in samodejno napovedovanje, ali je prisoten pozitiven pas. Čeprav se to za človeka zdi nepomembna naloga, lahko iz prve roke povem, da je to neverjetno priročna alternativa ročnemu označevanju na tisoče slik.

Kateri so nekateri izzivi za izdelavo modelov ML, ki delujejo z roko v roki z vrhunsko tehnologijo bioznanosti, kot je CRISPR?

Razpoložljivost podatkov je glavni izziv pri uporabi modelov strojnega učenja za katero koli tehnologijo bioznanosti. CRISPR in tehnologije, ki temeljijo na DNK ali RNK, se soočajo s posebnim izzivom, predvsem zaradi znatno manjših strukturnih podatkovnih nizov, ki so na voljo za nukleinske kisline v primerjavi z beljakovinami. Zato smo v zadnjih letih opazili ogromen napredek pri ML proteinov (z AlphaFold2 in drugimi), vendar napredek pri ML za DNA in RNA še vedno zaostaja.

Kakšna je vaša vizija za prihodnost, kako se bo umetna inteligenca integrirala s CRISPR in bioznanostjo?

Trenutno smo priča velikemu razcvetu umetne inteligence na področjih proteinskega inženiringa in odkrivanja zdravil in pričakujem, da bo to še naprej pospeševalo razvoj v farmacevtski industriji. Rad bi videl, da bi se v prihodnjih letih enako zgodilo s CRISPR in drugimi tehnologijami, ki temeljijo na DNK in RNK. To bi lahko bilo izjemno pomembno pri diagnostiki, humani medicini in sintetični biologiji. Prednosti računalniških orodij smo že videli pri našem razvoju diagnostike in tehnologij CRISPR tukaj pri Sherlocku in upam, da bo ta vrsta dela spodbudila učinek "snežne kepe", ki bo pospešila področje.

Hvala za odličen intervju, bralci, ki želite izvedeti več, naj ga obiščejo Sherlock Biosciences.

Ustanovni partner unite.AI in član Forbesov tehnološki svet, Antoine je a futurist ki je navdušen nad prihodnostjo umetne inteligence in robotike.

Je tudi ustanovitelj Securities.io, spletno mesto, ki se osredotoča na vlaganje v prelomno tehnologijo.