заглушки Джош Миллер, генеральный директор Gradient Health — Серия интервью — Unite.AI
Свяжитесь с нами:

Интервью

Джош Миллер, генеральный директор Gradient Health – серия интервью

mm

опубликованный

 on

Джош Миллер — генеральный директор Градиент здоровья, компания, основанная на идее, что автоматизированная диагностика должна существовать, чтобы здравоохранение было справедливым и доступным для всех. Gradient Health стремится ускорить автоматическую диагностику ИИ с помощью упорядоченных, помеченных и доступных данных.

Не могли бы вы поделиться историей происхождения Gradient Health?

Мы с моим сооснователем Оуэном только что вышли из нашего первого стартапа FarmShots, который использовал компьютерное зрение для сокращения количества пестицидов, используемых в сельском хозяйстве, и искали следующую задачу.

Нами всегда двигало желание найти сложную проблему для решения с помощью технологий, которые а) могут принести много пользы миру и б) ведут к солидному бизнесу. Оуэн работал над своей медицинской степенью, и с нашим опытом в области компьютерного зрения, медицинская визуализация была для нас естественной. Из-за разрушительного воздействия рака молочной железы мы выбрали маммографию в качестве потенциального первого применения. Поэтому мы сказали: «Хорошо, с чего начнем? Нам нужны данные. Нам нужна тысяча маммограмм. Где вы берете такой масштаб данных?» и ответ был "Нигде". Мы сразу поняли, что действительно трудно найти данные. Спустя несколько месяцев это разочарование переросло для нас в философскую проблему, мы подумали, что «любой, кто пытается делать добро в этой сфере, не должен бороться и бороться за получение данных, необходимых для создания жизненно важных алгоритмов». И поэтому мы сказали: «Эй, может быть, это действительно наша проблема, которую нужно решить».

Каковы текущие риски на рынке с нерепрезентативными данными?

Из бесчисленных исследований и реальных примеров мы знаем, что если мы построим алгоритм, используя только данные с западного побережья, и перенесем его на юго-восток, он просто не сработает. Снова и снова мы слышим истории об ИИ, который отлично работает в северо-восточной больнице, где он был создан, а затем, когда его внедряют в другом месте, точность падает до менее 50%.

Я считаю, что фундаментальная цель ИИ на этическом уровне заключается в том, что он должен уменьшить расхождения в состоянии здоровья. Цель состоит в том, чтобы сделать качественную медицинскую помощь доступной для всех. Но проблема в том, что когда вы строите его на плохих данных, вы на самом деле увеличиваете расхождения. Мы не справимся с миссией медицинского ИИ, если позволим ему работать только для белых парней с побережья. В результате люди из недостаточно представленных слоев общества на самом деле будут страдать от дискриминации больше, а не меньше.

Не могли бы вы обсудить, как Gradient Health получает данные?

Конечно, мы сотрудничаем со всеми типами систем здравоохранения по всему миру, чьи данные иначе хранятся, что стоит им денег и никому не приносит пользы. Мы тщательно деидентифицируем их данные в источнике, а затем тщательно организуем их для исследователей.

Как Gradient Health обеспечивает объективность и максимальное разнообразие данных?

Есть много способов. Например, когда мы собираем данные, мы обязательно включаем множество общественных клиник, где у вас часто есть гораздо более репрезентативные данные, а также более крупные больницы. Мы также получаем данные из большого количества клинических центров. Мы стараемся получить как можно больше сайтов от максимально широкого круга населения. Таким образом, не только наличие большого количества сайтов, но и их географическое и социально-экономическое разнообразие. Потому что, если все ваши сайты взяты из больниц в центре города, это все равно нерепрезентативные данные, не так ли?

Чтобы проверить все это, мы запускаем статистику по всем этим наборам данных и настраиваем ее для клиента, чтобы убедиться, что они получают данные, которые разнообразны с точки зрения технологий и демографии.

Почему этот уровень контроля данных так важен для разработки надежных алгоритмов ИИ?

Есть много переменных, с которыми ИИ может столкнуться в реальном мире, и наша цель — сделать алгоритм настолько надежным, насколько это возможно. Чтобы упростить ситуацию, мы думаем о пяти ключевых переменных в наших данных. Первая переменная, о которой мы думаем, это «производитель оборудования». Это очевидно, но если вы строите алгоритм, используя только данные со сканеров GE, он не будет работать так же хорошо, скажем, на Hitachi.

В том же духе находится переменная «модель оборудования». Это на самом деле довольно интересно с точки зрения неравенства в отношении здоровья. Мы знаем, что крупные, хорошо финансируемые исследовательские больницы, как правило, имеют самые последние и лучшие версии сканеров. И если они будут обучать свой ИИ только на своих собственных моделях 2022 года, он не будет работать на более старой модели 2010 года. Эти старые системы точно такие же, как и в менее богатых и сельских районах. Таким образом, используя только данные из более новых моделей, они непреднамеренно вносят дополнительные предубеждения против людей из этих сообществ.

Другими ключевыми переменными являются пол, этническая принадлежность и возраст, и мы делаем все возможное, чтобы наши данные были пропорционально сбалансированы по всем им.

С какими нормативными препятствиями сталкиваются компании MedTech?

Мы начинаем видеть, что FDA действительно расследует предвзятость в наборах данных. К нам приходили исследователи и говорили: «Управление по санитарному надзору за качеством пищевых продуктов и медикаментов отклонило наш алгоритм, потому что в нем не было 15% афроамериканского населения» (приблизительный процент афроамериканцев, составляющих часть населения США). Мы также слышали, что разработчику сказали, что им нужно включить 1% жителей тихоокеанских гавайских островов в свои обучающие данные.

Итак, FDA начинает понимать, что эти алгоритмы, которые были обучены только в одной больнице, не работают в реальном мире. Дело в том, что если вы хотите получить маркировку CE и разрешение FDA, вы должны иметь набор данных, который представляет население. Совершенно справедливо, что обучение ИИ на небольшой или нерепрезентативной группе больше неприемлемо.

Риск для MedTech заключается в том, что они вкладывают миллионы долларов в то, чтобы довести свои технологии до такого состояния, когда, по их мнению, они готовы к разрешению регулирующих органов, а затем, если они не смогут пройти через это, они никогда не получат возмещения или дохода. В конечном счете, путь к коммерциализации и путь к тому благотворному влиянию на здравоохранение, которое они хотят иметь, требует, чтобы они заботились о предвзятости данных.

Каковы некоторые варианты преодоления этих препятствий с точки зрения данных?

За последние годы методы управления данными изменились, и теперь у разработчиков ИИ есть больше возможностей, чем когда-либо прежде. От посредников данных и партнеров до федеративного обучения и синтетических данных — существуют новые подходы к решению этих препятствий. Какой бы метод они ни выбрали, мы всегда рекомендуем разработчикам задуматься, действительно ли их данные репрезентативны для населения, которое будет использовать продукт. Это, безусловно, самый сложный аспект поиска данных.

Gradient Health предлагает решение Gradient Label. Что это за решение и как оно позволяет маркировать данные в нужном масштабе?

ИИ для медицинской визуализации требует не только данных, но и экспертных аннотаций. И мы помогаем компаниям получить эти экспертные аннотации, в том числе от рентгенологов.

Каким вы видите будущее ИИ и данных в здравоохранении?

Уже существуют тысячи инструментов искусственного интеллекта, которые смотрят на все, от кончиков ваших пальцев до кончиков пальцев ног, и я думаю, что это будет продолжаться. Я думаю, что в учебнике по медицине будет по крайней мере 10 алгоритмов для каждого состояния. У каждого из них будет несколько, вероятно, конкурирующих инструментов, которые помогут клиницистам обеспечить наилучшее лечение.

Я не думаю, что мы, вероятно, в конечном итоге увидим Tricorder в стиле Star Trek, который сканирует кого-то и решает все возможные проблемы с головы до ног. Вместо этого у нас будут специальные приложения для каждого подмножества.

Есть ли что-нибудь еще, что вы хотели бы рассказать о Gradient Health?

Я в восторге от будущего. Я думаю, что мы движемся к тому, чтобы здравоохранение было недорогим, равным и доступным для всех, и я очень хочу, чтобы у Gradient была возможность сыграть фундаментальную роль в этом. Вся команда здесь искренне верит в эту миссию, и в них есть единая страсть, которую вы не встретите в каждой компании. И я люблю это!

Спасибо за отличное интервью, читатели, которые хотят узнать больше, должны посетить Градиент здоровья.

Партнер-основатель unite.AI и член Технологический совет Форбс, Антуан - это футурист который увлечен будущим искусственного интеллекта и робототехники.

Он также является основателем Ценные бумаги.io, веб-сайт, посвященный инвестициям в прорывные технологии.