заглушки Джош Міллер, генеральний директор Gradient Health - Серія інтерв'ю - Unite.AI
Зв'язатися з нами

інтерв'ю

Джош Міллер, генеральний директор Gradient Health – Серія інтерв’ю

mm

опублікований

 on

Джош Міллер є генеральним директором Градієнт здоров'я, компанія, заснована на ідеї, що автоматизована діагностика має існувати, щоб охорона здоров’я була справедливою та доступною для всіх. Gradient Health має на меті прискорити автоматизовану діагностику штучного інтелекту за допомогою впорядкованих, позначених і доступних даних.

Не могли б ви поділитися історією генезису Gradient Health?

Ми з моїм співзасновником Оувеном щойно залишили наш перший стартап FarmShots, який використовував комп’ютерне зір, щоб допомогти зменшити кількість пестицидів, що використовуються в сільському господарстві, і ми шукали наш наступний виклик.

Нами завжди рухало бажання знайти складну проблему для вирішення за допомогою технології, яка а) дає можливість зробити багато добра у світі та б) веде до міцного бізнесу. Оуен працював над медичним дипломом, і з нашим досвідом роботи з комп’ютерним зором, медичне зображення було природним для нас. Через руйнівний вплив раку молочної залози ми обрали мамографію як потенційне перше застосування. Тож ми сказали: «Добре, з чого почати? Нам потрібні дані. Нам потрібна тисяча мамографів. Звідки ви берете такий масштаб даних?» і відповідь була «Ніде». Ми відразу зрозуміли, що знайти дані дуже важко. Через кілька місяців це розчарування переросло для нас у філософську проблему, ми подумали, що «будь-хто, хто намагається робити добро в цьому просторі, не повинен боротися й боротися, щоб отримати дані, необхідні для створення рятівних алгоритмів». І тому ми сказали: «Гей, можливо, це насправді наша проблема, яку потрібно вирішити».

Які поточні ризики існують на ринку з нерепрезентативними даними?

З незліченних досліджень і реальних прикладів ми знаємо, що якщо ми створимо алгоритм, використовуючи лише дані із західного узбережжя, і ви перенесемо його на південний схід, він просто не працюватиме. Знову і знову ми чуємо історії про штучний інтелект, який чудово працює в північно-східній лікарні, де його було створено, а потім, коли його розгортають в інших місцях, точність падає до менше 50%.

Я вважаю, що основна мета штучного інтелекту на етичному рівні полягає в тому, щоб він зменшував розбіжності у здоров’ї. Мета полягає в тому, щоб якісне лікування було доступним для кожного. Але проблема полягає в тому, що коли ви використовуєте неякісні дані, ви фактично збільшуєте розбіжності. Ми не впораємося з місією штучного інтелекту охорони здоров’я, якщо дозволимо йому працювати лише для білих хлопців з узбережжя. У результаті люди з недостатньо представлених верств суспільства зазнають більшої, а не меншої дискримінації.

Чи могли б ви обговорити, як Gradient Health отримує дані?

Звичайно, ми співпрацюємо з усіма типами систем охорони здоров’я в усьому світі, дані яких іншим чином зберігаються, що коштує їм грошей і нікому не приносить користі. Ми ретельно деідентифікуємо їхні дані в джерелі, а потім ретельно систематизуємо їх для дослідників.

Як Gradient Health гарантує, що дані є неупередженими та максимально різноманітними?

Є багато способів. Наприклад, коли ми збираємо дані, ми обов’язково включаємо багато громадських клінік, де ви часто маєте набагато більш репрезентативні дані, а також більші лікарні. Ми також отримуємо дані з великої кількості клінічних сайтів. Ми намагаємося отримати якомога більше сайтів від якнайширшого кола населення. Тож не просто мати велику кількість сайтів, але мати їх географічно та соціально-економічно різноманітні. Тому що якщо всі ваші сайти є з лікарень у центрі міста, це все одно не репрезентативні дані, чи не так?

Щоб підтвердити все це, ми запускаємо статистику для всіх цих наборів даних і налаштовуємо її під клієнта, щоб переконатися, що вони отримують дані, різноманітні з точки зору технології та демографії.

Чому цей рівень контролю даних такий важливий для розробки надійних алгоритмів ШІ?

Існує багато змінних, з якими штучний інтелект може зіткнутися в реальному світі, і наша мета полягає в тому, щоб алгоритм був настільки надійним, наскільки це можливо. Щоб спростити речі, ми думаємо про п’ять ключових змінних у наших даних. Перша змінна, про яку ми думаємо, це «виробник обладнання». Це очевидно, але якщо ви створюєте алгоритм, використовуючи лише дані зі сканерів GE, він, скажімо, не працюватиме так добре на Hitachi.

Подібним чином є змінна «модель обладнання». Це насправді досить цікаво з точки зору нерівності у здоров’ї. Ми знаємо, що великі, добре фінансовані дослідницькі лікарні, як правило, мають останні та найкращі версії сканерів. І якщо вони навчать свій штучний інтелект лише на власних моделях 2022 року, це не працюватиме так добре на старішій моделі 2010 року. Ці старіші системи є саме тими, що зустрічаються в менш заможних і сільських районах. Таким чином, використовуючи лише дані з новіших моделей, вони ненавмисно створюють додаткові упередження щодо людей із цих спільнот.

Іншими ключовими змінними є стать, етнічна приналежність і вік, і ми докладаємо всіх зусиль, щоб переконатися, що наші дані пропорційно збалансовані між усіма ними.

З якими регулятивними перешкодами стикаються медтехнічні компанії?

Ми починаємо спостерігати, як FDA справді досліджує упередженість у наборах даних. До нас приходили дослідники і казали: «FDA відхилив наш алгоритм, оскільки в ньому не було 15% афроамериканського населення» (приблизний відсоток афроамериканців, які є частиною населення США). Ми також чули про те, що розробнику сказали, що він повинен включити 1% тихоокеанських жителів Гавайських островів у свої навчальні дані.

Таким чином, FDA починає розуміти, що ці алгоритми, які були лише навчені в одній лікарні, не працюють у реальному світі. Справа в тому, що якщо ви хочете маркування CE та дозвіл FDA, вам потрібно мати набір даних, який представляє населення. Тренувати штучний інтелект на невеликій або нерепрезентативній групі вже не прийнятно.

Ризик для медтехніки полягає в тому, що вони інвестують мільйони доларів, щоб перенести свою технологію в місце, де, на їхню думку, вони готові до нормативного дозволу, а потім, якщо вони не зможуть це зробити, вони ніколи не отримають відшкодування чи прибутку. Зрештою, шлях до комерціалізації та шлях до сприятливого впливу на охорону здоров’я, який вони хочуть мати, вимагає від них уваги до упередженості даних.

Які існують варіанти подолання цих перешкод з точки зору даних?

За останні роки методи керування даними розвинулися, і розробники штучного інтелекту тепер мають більше можливостей, ніж будь-коли раніше. Від посередників даних і партнерів до федеративного навчання та синтетичних даних, є нові підходи до цих перешкод. Який би метод вони не вибрали, ми завжди заохочуємо розробників враховувати, чи їхні дані справді репрезентують населення, яке використовуватиме продукт. Це, безумовно, найскладніший аспект отримання даних.

Рішення, яке пропонує Gradient Health, — Gradient Label. Що це за рішення та як воно дозволяє позначати дані в масштабі?

Штучний інтелект для медичного зображення потребує не лише даних, а й коментарів експертів. І ми допомагаємо компаніям отримати ці експертні коментарі, зокрема від радіологів.

Яке ваше бачення майбутнього ШІ та даних у сфері охорони здоров’я?

Уже існують тисячі інструментів штучного інтелекту, які дивляться на все, від кінчиків ваших пальців до кінчиків пальців ніг, і я думаю, що це продовжуватиметься. Я думаю, що в підручнику з медицини буде щонайменше 10 алгоритмів для кожного стану. Кожна з них матиме кілька, можливо, конкурентоспроможних інструментів, які допоможуть клініцистам надавати найкращу допомогу.

Я не думаю, що ми побачимо трикодер у стилі Star Trek, який сканує когось і вирішує всі можливі проблеми з ніг до голови. Натомість ми матимемо спеціалізовані додатки для кожного піднабору.

Чи є ще щось, чим ви хотіли б поділитися про Gradient Health?

Я в захваті від майбутнього. Я думаю, що ми рухаємось до місця, де охорона здоров’я буде недорогою, рівною та доступною для всіх, і я дуже хочу, щоб Gradient отримав шанс зіграти фундаментальну роль у цьому. Уся команда щиро вірить у цю місію, і в них панує об’єднана пристрасть, яку можна зустріти не в кожній компанії. І я люблю це!

Дякую за чудове інтерв’ю, читачі, які хочуть дізнатися більше, повинні відвідати Градієнт здоров'я.

Партнер-засновник unite.AI і член Технологічна рада Forbes, Антуан - це а футурист який захоплений майбутнім ШІ та робототехніки.

Він також є засновником Securities.io, веб-сайт, який зосереджується на інвестиціях у революційні технології.