Зв'язатися з нами

Стефано Пасіфіко та Девід Хігер, співзасновники Epistemic AI – Серія інтерв’ю

інтерв'ю

Стефано Пасіфіко та Девід Хігер, співзасновники Epistemic AI – Серія інтерв’ю

mm

Епістемічний ШІ використовує найсучасніші алгоритми обробки природної мови (NLP), машинного навчання та глибокого навчання для відображення зв'язків між зростаючим обсягом біомедичних знань з численних публічних та приватних джерел, включаючи текстові документи та бази даних. Завдяки процесу відображення знань користувачі інтерактивно працюють з платформою, щоб відображати та розуміти підмножини біомедичних знань, що розкриває концепції та зв'язки, які інакше пропускаються під час традиційного пошуку.

Ми взяли інтерв’ю в обох співзасновників Epistemic AI, щоб обговорити ці останні досягнення.

Стефано Пасифіко походить від 10+ років у прикладній розробці ШІ та НЛП. Раніше він працював у Bloomberg, де він провів 7 років, і працював у Elemental Cognition перед тим, як почати Epistemic.

Девід Хігер є срібним професором науки про дані та нейронауки в Нью-Йоркському університеті та провів свою кар’єру, поєднуючи інформатику, штучний інтелект та біологічні науки. Є членом Національної академії наук. Будучи засновниками, вони об’єднують досвід створення прикладних широкомасштабних систем штучного інтелекту та НЛП для розуміння великих колекцій знань, а також досвід у галузі обчислювальної біології та біомедичних наук, отриманий за роки досліджень у цій галузі.

Що вас привернуло до штучного інтелекту та обробки природної мови (NLP)?

Стефано Пасифіко: Коли я навчався в коледжі в Римі, і штучний інтелект взагалі не був популярним (насправді він був дуже маргінальним), я запитав свого тодішнього радника, яку спеціалізацію я мав би отримати серед доступних. Він сказав: «Якщо ви хочете заробляти гроші, розробку програмного забезпечення та бази даних, але якщо ви хочете бути дивними, але дуже просунутими, тоді оберіть штучний інтелект». Мене продали за «дивним». Потім я почав працювати над представленням знань і міркуваннями, щоб дослідити, як автономні агенти можуть грати у футбол або рятувати людей. Потім два усвідомлення змусили мене закохатися в НЛП: по-перше, автономним агентам, можливо, доведеться спілкуватися між собою природною мовою! По-друге, створювати формальні бази знань вручну важко, тоді як природна мова (у тексті) вже забезпечує найбільшу базу знань з усіх. Я знаю, що сьогодні це може здатися очевидним спостереженням, але раніше вони не були такими основними.

Що стало натхненням для запуску Epistemic AI?

Стефано Пасифіко: Я збираюся зробити сміливу заяву. Ніхто сьогодні не має належного інструментарію для розуміння та зв’язку знань, наявних у великих, постійно зростаючих колекціях документів і даних. Раніше я працював над цією проблемою у світі фінансів. Подумайте про новини, фінансові звіти, дані про ціни, корпоративні дії, документи тощо. Я вважаю, що ця проблема п’янить. І, звичайно, це складна проблема; і важливий! Коли я зустрів свого співзасновника, доктора Девіда Хігера, ми витратили досить багато часу на оцінку можливостей стартапу в біомедичній галузі. Коли ми усвідомлюємо величезний обсяг інформації, що генерується в цьому полі, ніби все стає на свої місця. Біомедичні дослідники борються з перевантаженням інформацією, намагаючись впоратися з величезною та швидко зростаючою базою біомедичних знань, включаючи документи (наприклад, документи, патенти, клінічні випробування) і бази даних (наприклад, гени, білки, шляхи, ліки, хвороби, медичні терміни). Це головна проблема для дослідників, і, за відсутності відповідного рішення, вони змушені використовувати базові інструменти пошуку (PubMed і Google Scholar) і досліджувати бази даних, створені вручну. Ці інструменти придатні для пошуку документів, що відповідають ключовим словам (наприклад, окремий ген чи опублікована стаття в журналі), але не для отримання вичерпних знань про тематику чи піддомен (наприклад, COVID-19) або для інтерпретації результатів високої продуктивності біологічні експерименти, такі як секвенування генів, експресія білків або скринінг хімічних сполук. Ми запустили Epistemic AI з ідеєю вирішити цю проблему за допомогою платформи, яка дозволяє їм ітеративно:

  1. Скоротіть час збору інформації та створіть комплексні карти знань
  2. Поверхнева міждисциплінарна інформація​, яку інакше важко знайти (справжні відкриття часто приходять, дивлячись у пробіл між дисциплінами);
  3. Визначте причинно-наслідкові гіпотези, знаходячи шляхи та відсутні ланки у вашій карті знань.

Які державні та приватні джерела використовуються для відображення цих відносин?

Стефано Пасифіко: На даний момент ми використовуємо всі загальнодоступні джерела, до яких ми можемо отримати, зокрема Pubmed і Clinicaltrials.gov. Ми поглинаємо бази даних про гени, ліки, хвороби та їх взаємодію. Ми також включаємо приватні джерела даних для вибраних клієнтів, але ми поки не маємо права розголошувати будь-які подробиці.

Який тип технологій машинного навчання використовується для відображення знань?

Стефано Пасифіко: Одне з глибоко укорінених переконань Epistemic AI полягає в тому, що фанатизм не корисний для створення продуктів. Рішення про побудову архітектури, що об’єднує кілька методів машинного навчання, було прийнято на ранньому етапі, і вони варіюються від представлення знань до трансформаторних моделей, через вбудовування графів, але включають також простіші моделі, такі як регресії та випадкові ліси. Кожен компонент настільки простий, наскільки він повинен бути, але не простіший. Хоча ми вважаємо, що вже створили компоненти NLP, які є найсучаснішими для певних завдань, ми не уникаємо простіших базових моделей, коли це можливо.

Чи можете ви назвати деякі компанії, некомерційні організації чи академічні установи, які використовують платформу Epistemic?

Стефано Пасифіко: Хоча я б хотів, ми не домовилися з нашими користувачами про це. Я можу сказати, що у нас були люди, які підписувалися з дуже авторитетних установ у всіх трьох сегментах (компанії, некомерційні та наукові установи). Крім того, ми маємо намір залишати платформу безкоштовною для академічних/некомерційних цілей.

Як Epistemic допомагає дослідникам у визначенні біомаркерів центральної нервової системи (ЦНС) та інших специфічних для захворювання біомаркерів?

Доктор Девід Хігер: Нейронаука є надзвичайно міждисциплінарною галуззю, яка включає молекулярну та клітинну біологію та геноміку, а також психологію, хімію та основи фізики, інженерії та математики. Це настільки широко, що ніхто не може бути експертом взагалі. Дослідники в академічних установах і фармацевтичних/біотехнологічних компаніях змушені спеціалізуватися. Але ми знаємо, що важливі ідеї є міждисциплінарними, поєднуючи знання з вузьких спеціальностей. Програмна платформа на основі штучного інтелекту, яку ми створюємо, дає змогу кожному бути набагато більш міждисциплінарним, бачити зв’язки між його індивідуальною підсферою знань та іншими темами, а також визначати нові гіпотези. Це особливо важливо в нейронауці, тому що це надзвичайно міждисциплінарна сфера. Функціонування та дисфункція людського мозку є найскладнішою проблемою, з якою коли-небудь стикалася наука. Ми маємо на меті змінити спосіб роботи вчених-біомедиків і навіть те, як вони думають.

Епістеміка також дозволяє виявити генетичні механізми розладів ЦНС. Чи можете ви розповісти нам, як це працює?

Доктор Девід Хігер: Більшість неврологічних захворювань, психіатричних захворювань і розладів розвитку не мають простого пояснення з точки зору генетичних відмінностей. Існує кілька синдромальних розладів, для яких відомо, що певна мутація викликає розлад. Але зазвичай це не так. Існують сотні генетичних відмінностей, наприклад, які пов’язані з розладами аутистичного спектру (РАС). Існує певне розуміння деяких із цих генів щодо функцій, які вони виконують з точки зору базової біології. Наприклад, деякі гени, пов’язані з РАС, утримують разом синапси в мозку (проте зауважте, що ті самі гени зазвичай виконують різні функції в інших системах органів тіла). Але існує дуже мало розуміння того, як ці генетичні відмінності можуть пояснити складний набір поведінкових відмінностей, які демонструють люди з РАС. Що ще гірше, дві особи з однаковими генетичними відмінностями можуть мати абсолютно різні результати: в однієї з діагнозом РАС, а в іншої ні. І дві особи з абсолютно різними генетичними профілями можуть мати однаковий результат із дуже схожими поведінковими дефіцитами. Щоб зрозуміти все це, потрібно встановити зв’язок між геномікою та молекулярною біологією та клітинною нейронаукою (як генетичні відмінності спричиняють різне функціонування окремих нейронів), а потім із системною нейронаукою (як ці відмінності у клітинних функціях спричиняють мережі великої кількості взаємопов’язаних нейронів). функціонувати по-іншому), а потім до психології (як ці відмінності у функціях нейронної мережі викликають відмінності в пізнанні, емоціях і поведінці). І все це потрібно розуміти з точки зору розвитку. Генетична відмінність може спричинити дефіцит певного аспекту нервової функції. Але мозок не просто сидить і приймає це. Мозок дуже адаптивний. Якщо механізм відсутній або зламаний, мозок розвиватиметься по-іншому, щоб компенсувати якомога більше. Ця компенсація може бути молекулярною, наприклад, активація іншого синаптичного рецептора для заміни функції пошкодженого синаптичного рецептора. Або компенсація може бути поведінковою. Кінцевий результат залежить не лише від початкової генетичної різниці, але й від різноманітних спроб компенсації, спираючись на інші молекулярні, клітинні, ланцюгові, системні та поведінкові механізми.

Жодна людина не має знань, щоб усе це зрозуміти. Ми всі потребуємо допомоги. Програмна платформа на основі штучного інтелекту, яку ми створюємо, дозволяє кожному збирати та пов’язувати всі відповідні біомедичні знання, бачити зв’язки та виявляти нові гіпотези.

Як біофармацевтичні та наукові установи використовують Epistemic для боротьби з COVID-19?

Стефано Пасифіко: Ми випустили загальнодоступну версію нашої платформи, яка містить набори даних, пов’язаних із COVID-19, і є вільною для всіх, хто досліджує COVID-XNUMX. Він доступний на https://covid.epistemic.ai

Для яких інших захворювань або генетичних проблем використовувався Epistemic?

Стефано Пасифіко: Ми співпрацюємо з дослідниками аутизму і нещодавно об’єднуємо нові дослідження муковісцидозу. Але ми раді співпрацювати з будь-якими іншими дослідниками чи установами, яким може знадобитися допомога у своїх дослідженнях.

Чи є ще щось, чим ви хотіли б поділитися про Epistemic?

Стефано Пасифіко: Ми створюємо рух людей, які хочуть змінити спосіб роботи та мислення біомедичних дослідників. Ми щиро сподіваємося, що багато ваших читачів захочуть приєднатися до нас!

Дякуємо вам обом за те, що знайшли час відповісти на наші запитання. Читачі, які хочуть дізнатися більше, повинні відвідати Епістемічний ШІ.

Антуан — далекоглядний лідер і партнер-засновник Unite.AI, керований непохитною пристрастю до формування та просування майбутнього ШІ та робототехніки. Будучи серійним підприємцем, він вірить, що штучний інтелект буде таким же руйнівним для суспільства, як електрика, і його часто ловлять на захопленні потенціалом революційних технологій і AGI.

Як футурист, він присвячений дослідженню того, як ці інновації впливатимуть на наш світ. Крім того, він є засновником Securities.io, платформа, орієнтована на інвестиції в передові технології, які переосмислюють майбутнє та змінюють цілі сектори.