výhonek Stefano Pacifico a David Heeger, spoluzakladatelé Epistemic AI – série rozhovorů – Unite.AI
Spojte se s námi

rozhovory

Stefano Pacifico a David Heeger, spoluzakladatelé Epistemic AI – série rozhovorů

mm
aktualizováno on

Epistemická AI využívá nejmodernější zpracování přirozeného jazyka (NLP), strojové učení a algoritmy hlubokého učení k mapování vztahů mezi rostoucím souborem biomedicínských znalostí z mnoha veřejných i soukromých zdrojů, včetně textových dokumentů a databází. Prostřednictvím procesu Mapování znalostí uživatelé interaktivně pracují s platformou za účelem zmapování a pochopení podmnožin biomedicínských znalostí, které odhalují koncepty a vztahy, které by jinak tradičnímu vyhledávání chyběly.

Vyzpovídali jsme oba spoluzakladatele Epistemic AI, abychom probrali tyto nejnovější pokroky.

Stefano Pacifiko pochází z více než 10 let vývoje aplikované AI a NLP. Dříve v Bloombergu, kde strávil 7 let, a před založením Epistemic byl v Elemental Cognition.

David Heeger je stříbrným profesorem datových věd a neurověd na NYU a svou kariéru strávil přepojováním počítačových věd, umělé inteligence a biologických věd. Je členem Národní akademie věd. Jako zakladatelé spojují odborné znalosti v oblasti budování aplikovaných rozsáhlých systémů AI a NLP pro porozumění velkým sbírkám znalostí s odbornými znalostmi v oblasti výpočetní biologie a biomedicíny z let výzkumu v této oblasti.

Co vás přivedlo a přitáhlo k AI a zpracování přirozeného jazyka (NLP)?

Stefano Pacifiko: Když jsem byl na vysoké škole v Římě a umělá inteligence nebyla vůbec populární (ve skutečnosti byla velmi okrajová), zeptal jsem se svého tehdejšího poradce, jakou specializaci bych si měl vzít z těch dostupných. Řekl: "Pokud chcete vydělávat peníze, softwarové inženýrství a databáze, ale pokud chcete být divní, ale velmi pokročilí, vyberte si umělou inteligenci." Byl jsem prodán za „divný“. Poté jsem začal pracovat na reprezentaci znalostí a uvažování, abych studoval, jak mohou autonomní agenti hrát fotbal nebo zachraňovat lidi. Pak jsem se do NLP zamiloval kvůli dvěma zjištěním: za prvé, autonomní agenti možná budou muset mezi sebou komunikovat přirozeným jazykem! Za druhé, ruční vytváření formálních znalostních bází je obtížné, zatímco přirozený jazyk (v textu) již poskytuje největší znalostní základnu ze všech. Vím, že se to dnes může zdát samozřejmé, ale dříve nebyly tak mainstreamové.

Co bylo inspirací pro spuštění Epistemic AI?

Stefano Pacifiko: Budu dělat odvážné tvrzení. Nikdo dnes nemá adekvátní nástroje k pochopení a propojení znalostí přítomných ve velkých, stále rostoucích sbírkách dokumentů a dat. Dříve jsem na tomto problému pracoval ve světě financí. Přemýšlejte o zprávách, finančních výkazech, cenových datech, firemních akcích, podáních atd. Tento problém mi připadal opojný. A samozřejmě je to obtížný problém; a jeden důležitý! Když jsem potkal svého spoluzakladatele, Dr. Davida Heegera, strávili jsme docela dost času vyhodnocováním příležitostí pro startupy v biomedicínském průmyslu. Když jsme si uvědomili obrovské množství informací generovaných v této oblasti, jako by vše zapadlo na své správné místo. Biomedicínští výzkumníci se potýkají s přetížením informací a snaží se potýkat s rozsáhlou a rychle se rozšiřující základnou biomedicínských znalostí, včetně dokumentů (např. práce, patenty, klinické studie) a databází (např. geny, proteiny, cesty, léky, nemoci, lékařské termíny). To je pro výzkumníky velkým problémem, a protože nemají k dispozici vhodné řešení, jsou nuceni používat základní vyhledávací nástroje (PubMed a Google Scholar) a prozkoumávat ručně spravované databáze. Tyto nástroje jsou vhodné pro vyhledávání dokumentů odpovídajících klíčovým slovům (např. jeden gen nebo publikovaný časopisový článek), ale ne pro získávání komplexních znalostí o tématické oblasti nebo subdoméně (např. COVID-19), ani pro interpretaci výsledků s vysokou propustností. biologické experimenty, jako je sekvenování genů, exprese proteinů nebo screening chemických sloučenin. Spustili jsme Epistemic AI s myšlenkou vyřešit tento problém pomocí platformy, která jim umožňuje iterativně:

  1. Zkraťte čas na shromažďování informací a vytváření komplexních znalostních map
  2. Povrchové mezioborové informace​, které může být jinak obtížné najít (skutečné objevy často pocházejí z pohledu do bílého prostoru mezi obory);
  3. Identifikujte kauzální hypotézy hledáním cest a chybějících odkazů ve své znalostní mapě​.

Jaké jsou některé z veřejných i soukromých zdrojů, které se používají k mapování těchto vztahů?

Stefano Pacifiko: V tuto chvíli využíváme všechny veřejně dostupné zdroje, které máme k dispozici, včetně Pubmed a Clinictrials.gov. Nabíráme databáze genů, léků, nemocí a jejich interakcí. Zahrnujeme také soukromé zdroje dat pro vybrané klienty, ale zatím nejsme oprávněni zveřejňovat žádné podrobnosti.

Jaký typ technologií strojového učení se používá pro mapování znalostí?

Stefano Pacifiko: Jedním z hluboce zakořeněných přesvědčení v Epistemic AI je, že fantazie nepomáhá při vytváření produktů. Vybudovat architekturu integrující několik technik strojového učení bylo rozhodnutí učiněné na začátku a ty sahají od reprezentace znalostí po modely Transformer, přes vkládání grafů, ale zahrnují také jednodušší modely, jako jsou regrese a náhodné lesy. Každá součást je tak jednoduchá, jak má být, ale není jednodušší. I když jsme přesvědčeni, že jsme již vytvořili komponenty NLP, které jsou pro určité úkoly nejmodernější, nevyhýbáme se jednodušším základním modelům, pokud je to možné.

Můžete jmenovat některé společnosti, neziskové organizace nebo akademické instituce, které platformu Epistemic využívají?

Stefano Pacifiko: I když bych to rád udělal, nedohodli jsme se s našimi uživateli, aby tak učinili. Mohu říci, že se nám přihlásili lidé z velmi renomovaných institucí ve všech třech segmentech (firmy, neziskovky a akademické instituce). Kromě toho máme v úmyslu ponechat platformu zdarma pro akademické/neziskové účely.

Jak Epistemic pomáhá výzkumníkům při identifikaci centrálního nervového systému (CNS) a dalších biomarkerů specifických pro onemocnění?

Dr. David Heeger: Neurověda je velmi vysoce interdisciplinární obor zahrnující molekulární a buněčnou biologii a genomiku, ale také psychologii, chemii a principy fyziky, inženýrství a matematiky. Je tak široký, že na něj nemůže být odborník vůbec nikdo. Výzkumníci z akademických institucí a farmaceutických/biotechnologických společností jsou nuceni se specializovat. Ale víme, že důležité poznatky jsou interdisciplinární a kombinují znalosti z dílčích specializací. Softwarová platforma poháněná umělou inteligencí, kterou budujeme, umožňuje každému být mnohem více interdisciplinární, vidět souvislosti mezi jednotlivými dílčími oblastmi odborných znalostí a dalšími tématy a identifikovat nové hypotézy. To je zvláště důležité v neurovědách, protože jde o velmi interdisciplinární obor. Funkce a dysfunkce lidského mozku je nejtěžší problém, kterému kdy věda čelila. Jsme na misi změnit způsob, jakým biomedicínští vědci pracují, a dokonce i to, jak myslí.

Epistemický také umožňuje odhalit genetické mechanismy poruch CNS. Můžete nám přiblížit, jak to funguje?

Dr. David Heeger: Většina neurologických onemocnění, psychiatrických onemocnění a vývojových poruch nemá jednoduché vysvětlení z hlediska genetických rozdílů. Existuje několik syndromických poruch, u kterých je známo, že specifická mutace způsobuje poruchu. Ale to není typický případ. Existují stovky genetických rozdílů, například, které byly spojeny s poruchami autistického spektra (ASD). Některé z těchto genů mají určité pochopení pro funkce, které slouží z hlediska základní biologie. Například některé geny spojené s ASD drží synapse pohromadě v mozku (všimněte si však, že stejné geny obvykle vykonávají různé funkce v jiných orgánových systémech v těle). Existuje však velmi málo pochopení toho, jak tyto genetické rozdíly mohou vysvětlit komplexní sadu rozdílů v chování, které vykazují jedinci s ASD. Aby toho nebylo málo, dva jedinci se stejnou genetickou odlišností mohou mít zcela odlišné výsledky, jeden s diagnózou ASD a druhý ne. A dva jedinci se zcela odlišnými genetickými profily mohou mít stejný výsledek s velmi podobnými deficity chování. Abychom tomu všemu porozuměli, je třeba vytvořit spojení z genomiky a molekulární biologie s buněčnou neurovědou (jak genetické rozdíly způsobují, že jednotlivé neurony fungují odlišně) a poté se systémovou neurovědou (jak tyto rozdíly v buněčné funkci způsobují sítě velkého počtu propojených neuronů fungovat jinak) a pak psychologii (jak tyto rozdíly ve funkci neuronové sítě způsobují rozdíly v poznání, emocích a chování). A to vše je potřeba chápat z vývojového hlediska. Genetický rozdíl může způsobit deficit v určitém aspektu neurální funkce. Ale mozek tam jen tak nesedí a nebere to. Mozky jsou vysoce adaptivní. Pokud mechanismus chybí nebo je poškozený, mozek se bude vyvíjet jinak, aby to co nejvíce kompenzoval. Tato kompenzace může být molekulární, například upregulace jiného synaptického receptoru, aby nahradil funkci poškozeného synaptického receptoru. Nebo kompenzace může být behaviorální. Konečný výsledek závisí nejen na počátečním genetickém rozdílu, ale také na různých pokusech o kompenzaci v závislosti na jiných molekulárních, buněčných, obvodových, systémech a mechanismech chování.

Žádný jednotlivec nemá takové znalosti, aby tomu všemu porozuměl. Všichni potřebujeme pomoc. Softwarová platforma poháněná umělou inteligencí, kterou budujeme, umožňuje každému shromažďovat a propojovat všechny relevantní biomedicínské znalosti, vidět souvislosti a identifikovat nové hypotézy.

Jak biofarmaceutické a akademické instituce využívají Epistemic k řešení problému COVID-19?

Stefano Pacifiko: Vydali jsme veřejnou verzi naší platformy, která obsahuje datové sady specifické pro COVID a je volně přístupná každému, kdo provádí výzkum COVID-19. Je k dispozici na https://covid.epistemic.ai

Na jaké další nemoci nebo genetické problémy se Epistemic používá?

Stefano Pacifiko: Spolupracovali jsme s výzkumníky v oblasti autismu a v poslední době dáváme dohromady nové výzkumné úsilí pro cystickou fibrózu. Jsme ale rádi, že můžeme spolupracovat s dalšími výzkumníky nebo institucemi, které by mohly potřebovat pomoc s jejich výzkumem.

Je ještě něco, co byste chtěli o Epistemicu sdílet?

Stefano Pacifiko: Budujeme hnutí lidí, kteří chtějí změnit způsob, jakým biomedicínští výzkumníci pracují a myslí. Upřímně doufáme, že se k nám bude chtít přidat mnoho vašich čtenářů!

Děkujeme vám oběma, že jste si našli čas na zodpovězení našich otázek. Čtenáři, kteří se chtějí dozvědět více, by měli navštívit Epistemická AI.

Zakládající partner unite.AI a člen Technologická rada Forbes, Antoine je a futurista který je zapálený pro budoucnost umělé inteligence a robotiky.

Je také zakladatelem Cenné papíry.io, web, který se zaměřuje na investice do převratných technologií.