Інтерв’ю
Іттай Даян, MD, співзасновник та CEO Rhino Health – Серія інтерв’ю

Іттай Даян, MD є співзасновником і CEO Rhino Health. Його досвід роботи пов’язаний з розробкою штучного інтелекту та діагностики, а також клінічної медицини та досліджень. Він є колишнім ключовим членом практики охорони здоров’я BCG та виконавчим директором лікарні. Наразі він зосереджений на внесенні свого внеску у розвиток безпечного, справедливого та ефективного штучного інтелекту в галузі охорони здоров’я та життєвих наук. У Rhino Health вони використовують розподілені обчислення та Федераційне навчання як засіб підтримання конфіденційності пацієнтів та сприяння співробітництву в фрагментованому ландшафті охорони здоров’я.
Він служив у збройних силах Ізраїлю – спецпідрозділі, очолював найбільший академічний медичний центр з трансляційної штучної інтелектуальної центру у світі. Він є експертом у галузі розробки та комерціалізації штучного інтелекту, а також довгостроковим бігуном.
Чи можете ви поділитися історією походження Rhino Health?
Моя подорож у сфері штучного інтелекту розпочалася, коли я був клініцистом і дослідником, який використовував ранні форми “цифрових біомаркерів” для вимірювання реакції на лікування психічних розладів. Пізніше я очолив Центр клінічної науки про дані (CCDS) у Mass General Brigham. Там я керував розробкою десятків клінічних застосунків штучного інтелекту та особисто побачив основні проблеми, пов’язані з доступом та “активацією” даних, необхідних для розробки та навчання продуктів штучного інтелекту, що відповідають нормативним вимогам.
Відповідь на ці питання полягає в тому, що я переконав систему Mass General Brigham у цінності наявності свого “спеціалізованого CRO для штучного інтелекту” (CRO = Клінічна дослідницька організація), для тестування алгоритмів від кількох комерційних розробників.
Однак проблема залишилася – дані про здоров’я все ще дуже фрагментовані, і навіть велика кількість даних з однієї мережі недостатня для боротьби з все більш вузькими цілями медичного штучного інтелекту. Влітку 2020 року я ініціював та очолив (разом з доктором Моною Флорес з NVIDIA) найбільше на той час дослідження Федераційного навчання (FL) у сфері охорони здоров’я, EXAM. Ми використали FL для створення прогностичної моделі результатів COVID, використовуючи дані з усього світу, без обміну жодними даними.. Надалі опублікована у Nature Medicine, це дослідження продемонструвало позитивний вплив використання різноманітних і розрізнених наборів даних та підкреслило потенціал для більш широкого використання федераційного навчання в охороні здоров’я.
Цей досвід, однак, висвітлив ряд проблем. До них належать оркестрування даних по співробітничим сайтам, забезпечення слідовості даних та належної характеристики, а також тягар, що лежить на відділах інформаційних технологій кожної установи, яким доводиться вивчати передові технології, до яких вони не звикли. Це вимагало нової платформи, яка б підтримувала ці нові “розподілені дані” співробітництва. Я вирішив об’єднатися зі своїм співзасновником, Ювалем Барором, щоб створити платформу з кінцевим кінцем для підтримки конфіденційних співробітництв. Ця платформа – це “Платформа Rhino Health”, яка використовує FL і краєве обчислення.
Чому ви вважаєте, що моделі штучного інтелекту часто не можуть забезпечити очікувані результати в медичній обстановці?
Медичний штучний інтелект часто тренується на малих, вузьких наборах даних, таких як набори даних з однієї установи або географічного регіону, що призводить до того, що отримана модель працює добре лише на тих типах даних, з якими вона була навчена. Як тільки алгоритм застосовується до пацієнтів або сценаріїв, що відрізняються від вузького навчального набору даних, продуктивність сильно погіршується.
Ендрю Нг висловив цю ідею добре, коли сказав: “Виявляється, що коли ми збираємо дані зі Стенфордської лікарні… ми можемо публікувати статті, які показують, що ці алгоритми порівнянні з людськими радіологами у виявленні певних станів. … [Коли] ви берете ту саму модель, ту саму систему штучного інтелекту, до старої лікарні внизу вулицею, з старою машиною, і технік використовує трохи іншу протокол іміджінгу, ці дані зсуваються, щоб спричинити суттєве погіршення продуктивності системи штучного інтелекту”.
Просто кажучи, більшість моделей штучного інтелекту не тренуються на даних, які достатньо різноманітні та високої якості, що призводить до поганої “реальної” продуктивності. Ця проблема була добре задокументована як у наукових, так і в загальнодоступних колах, таких як у Science і Politico.
Як важливо тестування на різноманітних пацієнтських групах?
Тестування на різноманітних пацієнтських групах є вкрай важливим для забезпечення того, що отриманий продукт штучного інтелекту не тільки ефективний і продуктивний, але й безпечний. Алгоритми, які не були навчені або протестовані на достатньо різноманітних пацієнтських групах, можуть страждати від алгоритмічної упередженості, серйозної проблеми в охороні здоров’я та технологіях охорони здоров’я. Не тільки такі алгоритми відображатимуть упередженість, яка була присутня у навчальних даних, але й посилять цю упередженість і погіршать існуючі расові, етнічні, релігійні, гендерні тощо нерівності в охороні здоров’я. Недостатнє тестування на різноманітних пацієнтських групах може призвести до небезпечних продуктів.
Нещодавно опубліковане дослідження5, яке використовувало платформу Rhino Health, досліджувало продуктивність алгоритму штучного інтелекту, розробленого на одному сайті для виявлення аневризми мозку на чотирьох різних сайтах з різними типами сканерів. Результати продемонстрували суттєву мінливість продуктивності на сайтах з різними типами сканерів, підкресливши важливість навчання та тестування на різноманітних наборах даних.
Як ви визначаєте, чи не представлена певна субпопуляція?
Поширений підхід полягає в тому, щоб проаналізувати розподіли змінних у різних наборах даних, окремо та у поєднанні. Це може інформувати розробників як під час підготовки “навчальних” наборів даних, так і під час підготовки наборів даних для валідації. Платформа Rhino Health дозволяє зробити це, а користувачі можуть побачити, як модель працює на різних когортах, щоб забезпечити узагальнюваність та стійку продуктивність по субпопуляціям.
Чи можете ви описати, що таке Федераційне навчання та як воно вирішує деякі з цих питань?
Федераційне навчання (FL) можна визначити як процес, у якому моделі штучного інтелекту тренуються та продовжують покращуватися з часом, використовуючи розрізнені дані, без будь-якої потреби в обміні або централізації даних. Це величезний крок вперед у розвитку штучного інтелекту. Історично будь-який користувач, який бажає співпрацювати з кількома сайтами, повинен був об’єднати ці дані, що спричиняло безліч трудомістких, дорогих і часоємних юридичних, ризикових та процедурних питань.
Сьогодні з програмним забезпеченням, таким як платформа Rhino Health, FL стає щоденною реальністю в охороні здоров’я та життєвих науках. Федераційне навчання дозволяє користувачам досліджувати, курирувати та валідувати дані, залишаючи ці дані на локальних серверах співробітників. Контейнерний код, такий як алгоритм штучного інтелекту/машинного навчання або аналітична програма, відправляється на локальний сервер, де виконується код, такий як навчання або валідування алгоритму штучного інтелекту, “локально”. Дані залишаються з “опікуном даних” у всіх випадках.
Лікарні, зокрема, стурбовані ризиками, пов’язаними з агрегацією чутливих даних пацієнтів. Це вже призвело до прикрих ситуацій, коли стало ясно, що організації охорони здоров’я співпрацювали з промисловістю без точного розуміння використання їхніх даних. У свою чергу, вони обмежують обсяг співробітництва, яке можуть здійснювати промисловість та академічні дослідники, що сповільнює дослідження та розробки та впливає на якість продукції по всій галузі охорони здоров’я. FL може пом’якшити це та дозволити співробітництво з даними, як ніколи раніше, контролюючи ризик, пов’язаний з цими співробітництвами.
Чи можете ви поділитися баченням Rhino Health щодо забезпечення швидкої створення моделей за допомогою більш різноманітних даних?
Ми бачимо екосистему розробників та користувачів штучного інтелекту, які співпрацюють без страху чи обмежень, поважаючи кордони регуляторів.. Співробітники можуть швидко визначати необхідні навчальні та тестові дані з різних географічних місцевостей, отримувати доступ та взаємодіяти з цими даними, а також ітерувати розвиток моделей, щоб забезпечити достатню узагальнюваність, продуктивність та безпеку.
У центрі цього знаходиться платформа Rhino Health, яка забезпечує “одну зупинку” для розробників штучного інтелекту, щоб сконструювати величезні та різноманітні набори даних, тренувати та валідувати алгоритми штучного інтелекту, а також постійно моніторити та підтримувати розгорнуті продукти штучного інтелекту.
Як платформа Rhino Health запобігає упередженості штучного інтелекту та забезпечує пояснюваність штучного інтелекту?
Відкриваючи та оптимізуючи співробітництво з даними, розробники штучного інтелекту можуть використовувати більші, більш різноманітні набори даних під час навчання та тестування своїх застосунків. Результатом більш надійних наборів даних є більш узагальнена продукція, яка не страждає від упередженості однієї установи чи вузького набору даних. На підтримку пояснюваністі штучного інтелекту наша платформа забезпечує чітке уявлення про дані, використані під час процесу розвитку, з можливістю аналізу походження даних, розподілу значень та інших ключових метрик, щоб забезпечити адекватну різноманітність даних та їхню якість. Крім того, наша платформа забезпечує функціональність, яку неможливо досягти, якщо дані просто об’єднані, включаючи можливість користувачам подальшого вдосконалення своїх наборів даних додатковими змінними, такими як ті, що обчислюються з існуючих даних, щоб досліджувати причинно-наслідкові зв’язки та пом’якшувати конфундери.
Як ви реагуєте на лікарів, які стурбовані тим, що надмірна залежність від штучного інтелекту може привести до упереджених результатів, які не були незалежно валідовані?
Ми співчуваємо цій проблемі та визнаємо, що ряд застосунків на ринку сьогодні можуть бути фактично упередженими. Наша відповідь полягає в тому, що нам потрібно об’єднатися як галузі, як спільноті охорони здоров’я, яка перш за все стурбована безпекою пацієнтів, щоб визначити політики та процедури, які запобігають таким упередженостям та забезпечують безпечні та ефективні застосування штучного інтелекту. Розробники штучного інтелекту несуть відповідальність за те, щоб їхні продукти штучного інтелекту, які продаються на ринку, були незалежно валідовані, щоб здобути довіру як фахівців охорони здоров’я, так і пацієнтів. Rhino Health присвячена підтримці безпечних та надійних продуктів штучного інтелекту та працює з партнерами над можливістю та оптимізацією незалежної валідації застосунків штучного інтелекту до їхнього розгортання в клінічних умовах, ліквідуючи бар’єри для необхідних валідних даних.
Яке ваше бачення майбутнього штучного інтелекту в охороні здоров’я?
Бачення Rhino Health полягає у світі, де штучний інтелект досяг свого повного потенціалу в охороні здоров’я. Ми наполегливо працюємо над створенням прозорості та сприяння співробітництву, стверджуючи приватність, щоб забезпечити цей світ. Ми бачимо охорону здоров’я штучного інтелекту, яка не обмежена вогневими стінами, географіями чи регуляторними обмеженнями. Розробники штучного інтелекту матимуть контрольований доступ до всіх даних,必要их для побудови потужних, узагальнених моделей – і для їхнього безперервного моніторингу та поліпшення з потоком даних в реальному часі. Постачальники та пацієнти матимуть впевненість у тому, що вони не втрачають контролю над своїми даними та можуть забезпечити їхнє використання для добра. Регулятори зможуть моніторити ефективність моделей, використовуваних у розробці фармацевтичних продуктів та пристроїв, в реальному часі. Організації охорони здоров’я матимуть вигоду від цих досягнень у сфері штучного інтелекту, а пацієнти та постачальники зможуть спати спокійно, знаючи, що приватність захищена.
Дякуємо за велике інтерв’ю. Читачам, які бажають дізнатися більше, слід відвідати Rhino Health.












