škrbina Leland Hyman, vodeći znanstvenik za podatke u Sherlock Biosciences - serija intervjua - Unite.AI
Povežite se s nama

Intervjui

Leland Hyman, vodeći znanstvenik za podatke u Sherlock Biosciences – serija intervjua

mm

Objavljeno

 on

Leland Hyman je vodeći znanstvenik za podatke u Sherlock Biosciences. On je iskusan informatičar i istraživač s iskustvom u strojnom učenju i molekularnoj dijagnostici.

Sherlock Biosciences je biotehnološka tvrtka sa sjedištem u Cambridgeu, Massachusetts, koja razvija dijagnostičke testove pomoću CRISPR-a. Cilj im je poremetiti molekularnu dijagnostiku boljim, bržim i pristupačnijim testovima.

Što vas je na početku privuklo informatici?

Počeo sam programirati kao vrlo mlad, ali me uglavnom zanimalo stvaranje videoigara sa svojim prijateljima. Moje zanimanje za druge aplikacije računalne znanosti poraslo je tijekom koledža i poslijediplomskog studija, posebno sa svim revolucionarnim radom na strojnom učenju koji se odvijao ranih 2010-ih. Čitavo se područje činilo kao uzbudljiva nova granica koja bi mogla izravno utjecati na znanstvena istraživanja i naše svakodnevne živote — nisam mogao pomoći da me to ne zaokupi.

Također ste doktorirali. u staničnoj i molekularnoj biologiji, kada ste prvi put shvatili da će se ta dva polja presijecati?

Počeo sam raditi ovu vrstu intersekcijskog rada s informatikom i biologijom rano u diplomskoj školi. Moj se laboratorij usredotočio na rješavanje problema proteinskog inženjeringa kroz suradnju okorjelih biokemičara, računalnih znanstvenika i svih između. Brzo sam shvatio da strojno učenje može pružiti dragocjene uvide u biološke sustave i učiniti eksperimentiranje mnogo lakšim. Suprotno tome, također sam stekao razumijevanje vrijednosti biološke intuicije pri konstruiranju modela strojnog učenja. Po mom mišljenju, točno postavljanje problema ključni je element u strojnom učenju. Zbog toga vjerujem da zajednički napori na različitim poljima mogu imati dubok utjecaj.

Od 2022. radiš u Sherlock Biosciences, možeš li podijeliti neke pojedinosti o tome što tvoja uloga uključuje?

Trenutno vodim računalni tim u Sherlock Biosciences. Naša grupa je odgovorna za dizajniranje komponenti koje ulaze u naše dijagnostičke testove, sučeljavanje s eksperimentalistima koji testiraju te dizajne u mokrom laboratoriju i izgradnju novih računalnih mogućnosti za poboljšanje dizajna. Osim koordinacije ovih aktivnosti, radim na dijelovima strojnog učenja naše baze kodova, eksperimentiram s novim arhitekturama modela i novim načinima simulacije fizike DNK i RNK uključene u naše testove.

Strojno učenje u srži je Sherlock Biosciences, možete li opisati vrstu podataka i količinu podataka koji se prikupljaju i kako ML zatim analizira te podatke?

Tijekom razvoja testa, testiramo desetke do stotine testova kandidata za svaki novi patogen. Iako velika većina tih kandidata neće proći komercijalni test, vidimo ih kao priliku da učimo iz svojih pogrešaka. U ovim eksperimentima mjerimo dvije ključne stvari: osjetljivost i brzinu. Naši modeli uzimaju sekvence DNK i RNK u svakoj analizi kao ulazne podatke i zatim uče predvidjeti osjetljivost i brzinu analize.

Kako ML predviđa koje će komponente molekularne dijagnostike raditi s najvećom brzinom i točnošću?

Kada razmišljamo o tome kako čovjek uči, postoje dvije glavne strategije. S jedne strane, osoba može naučiti kako izvršiti zadatak čistim pokušajem i pogreškom. Mogli su ponoviti zadatak, a nakon mnogo neuspjeha, na kraju bi sami shvatili pravila zadatka. Ova je strategija bila prilično popularna prije interneta. Međutim, ovoj osobi bismo mogli dati učitelja koji bi joj odmah rekao pravila zadatka. Učenik s učiteljem mogao bi učiti puno brže nego s pristupom pokušaja i pogreške, ali samo ako ima dobrog učitelja koji u potpunosti razumije zadatak.

Naš pristup obučavanju modela strojnog učenja nalazi se na pola puta između ove dvije strategije. Iako nemamo savršenog "učitelja" za naše modele strojnog učenja, možemo ih započeti s nekim znanjem o fizici DNK i RNK lanaca u našim testovima. To im pomaže da nauče bolje predviđati s manje podataka. Da bismo to učinili, izvodimo nekoliko biofizičkih simulacija na sekvencama DNA i RNA našeg testa. Zatim unosimo rezultate u model i tražimo od njega da predvidi brzinu i osjetljivost testa. Ponavljamo ovaj postupak za sve eksperimente koje smo proveli u laboratoriju, a model pokazuje razliku između svojih predviđanja i onoga što se stvarno dogodilo. Kroz dovoljno ponavljanja, na kraju uči kako su fizika DNA i RNA povezana s brzinom i osjetljivošću svakog testa.

Na koje druge načine Sherlock Biosciences koristi AI algoritme?

Koristili smo algoritme strojnog učenja za rješavanje raznih problema. Nekoliko primjera koji vam padaju na pamet odnose se na istraživanje tržišta i analizu slike. Za istraživanje tržišta uspjeli smo uvježbati modele koji uče o različitim vrstama kupaca i o tome koliko ljudi može imati nezadovoljenu potrebu za testiranjem bolesti. Također smo izradili modele za analizu slika traka bočnog protoka (vrsta testa koji se obično koristi u testovima na COVID bez recepta) i automatsko predviđanje postoji li pozitivna traka. Iako se ovo čini kao trivijalan zadatak za čovjeka, iz prve ruke mogu reći da je to nevjerojatno zgodna alternativa ručnom označavanju tisuća slika.

Koji su neki od izazova iza izgradnje ML modela koji rade ruku pod ruku s vrhunskom tehnologijom bioznanosti kao što je CRISPR?

Dostupnost podataka glavni je izazov s primjenom modela strojnog učenja na bilo koju tehnologiju bioznanosti. CRISPR i tehnologije temeljene na DNA ili RNA suočavaju se s posebnim izazovom, uglavnom zbog znatno manjih strukturnih skupova podataka dostupnih za nukleinske kiseline u usporedbi s proteinima. To je razlog zašto smo posljednjih godina vidjeli veliki napredak proteinskog ML-a (s AlphaFold2 i drugima), ali napredak DNA i RNA ML-a još uvijek zaostaje.

Koja je vaša vizija budućnosti kako će se AI integrirati s CRISPR-om i bioznanošću?

Trenutno vidimo golemi procvat umjetne inteligencije u području proteinskog inženjeringa i otkrivanja lijekova i očekujem da će to nastaviti ubrzavati razvoj u farmaceutskoj industriji. Volio bih da se isto dogodi s CRISPR-om i drugim tehnologijama koje se temelje na DNK i RNK u nadolazećim godinama. To bi moglo biti nevjerojatno utjecajno u dijagnostici, humanoj medicini i sintetskoj biologiji. Već smo vidjeli prednosti računalnih alata u našem razvoju dijagnostike i CRISPR tehnologija ovdje u Sherlocku, i nadam se da će ova vrsta rada potaknuti efekt "grude snijega" da pomakne polje naprijed.

Hvala vam na sjajnom intervjuu, čitatelji koji žele saznati više neka ga posjete Sherlock Biosciences.

Osnivač unite.AI i član udruge Forbesovo tehnološko vijeće, Antoine je a futurist koji je strastven prema budućnosti umjetne inteligencije i robotike.

Također je i osnivač Vrijednosni papiri.io, web stranica koja se fokusira na ulaganje u disruptivnu tehnologiju.