存根 Gradient Health 首席执行官 Josh Miller - 访谈系列 - Unite.AI
关注我们.

面试

Gradient Health 首席执行官 Josh Miller – 访谈系列

mm

发布时间

 on

乔什·米勒 (Josh Miller) 是 梯度健康,该公司的成立理念是自动化诊断必须存在,医疗保健才能公平并为每个人提供。 Gradient Health 旨在利用经过组织、标记和可用的数据来加速自动化人工智能诊断。

您能分享一下 Gradient Health 背后的起源故事吗?

我和我的联合创始人 Ouwen 刚刚退出了我们的第一家初创公司 FarmShots,该公司利用计算机视觉来帮助减少农业中农药的使用量,我们正在寻找下一个挑战。

我们一直渴望找到一个可以用技术解决的难题,a)有机会为世界做很多好事,b)带来稳固的业务。 欧文正在攻读医学学位,凭借我们在计算机视觉方面的经验,医学成像非常适合我们。 由于乳腺癌的破坏性影响,我们选择乳房X光检查作为潜在的第一个应用。 所以我们说:“好吧,我们从哪里开始? 我们需要数据。 我们需要一千张乳房X光检查。 你从哪里获得这么大规模的数据?” 答案是“无处可去”。 我们立即意识到,找到数据真的很难。 几个月后,这种挫败感对我们来说变成了一个哲学问题,我们认为“任何试图在这个领域做好事的人都不应该为了构建救生算法所需的数据而奋斗和奋斗”。 所以我们说“嘿,也许这实际上是我们要解决的问题”。

目前市场上数据不具代表性的风险有哪些?

从无数的研究和现实世界的例子中,我们知道,如果我们只使用西海岸的数据构建一个算法,然后把它带到东南部,它就行不通。 我们一次又一次地听到人工智能在创建它的东北医院效果很好的故事,然后当他们将其部署到其他地方时,准确率下降到不到 50%。

我相信人工智能在道德层面上的根本目的是减少健康差异。 其目标是让每个人都能负担得起并获得优质护理。 但问题是,当你将其建立在不良数据之上时,实际上会增加差异。 如果我们让它只为来自沿海地区的白人服务,那么我们就未能完成医疗保健人工智能的使命。 来自代表性不足背景的人实际上会因此遭受更多而不是更少的歧视。

您能否讨论一下 Gradient Health 如何获取数据?

当然,我们与世界各地各种类型的卫生系统合作,这些系统的数据否则会被存储起来,这会花费他们金钱,而且不会让任何人受益。 我们从源头彻底消除他们的数据身份,然后为研究人员仔细组织。

Gradient Health 如何确保数据无偏见且尽可能多样化?

有很多方法。 例如,当我们收集数据时,我们确保包括许多社区诊所以及较大的医院,这些诊所通常拥有更具代表性的数据。 我们还从大量临床站点获取数据。 我们试图从尽可能广泛的人群中获得尽可能多的地点。 因此,不仅拥有大量的站点,而且还具有地理和社会经济的多样性。 因为如果您的所有站点都来自市中心医院,那么它仍然不具有代表性,不是吗?

为了验证这一切,我们对所有这些数据集进行统计,并为客户进行定制,以确保他们获得在技术和人口统计方面多样化的数据。

为什么这种级别的数据控制对于设计强大的人工智能算法如此重要?

人工智能在现实世界中可能会遇到许多变量,我们的目标是确保算法尽可能稳健。 为了简化事情,我们考虑了数据中的五个关键变量。 我们想到的第一个变量是“设备制造商”。 这是显而易见的,但如果您仅使用 GE 扫描仪的数据构建算法,那么它在日立 (Hitachi) 上的表现就不会那么好。

类似的还有“设备模型”变量。 从健康不平等的角度来看,这实际上非常有趣。 我们知道,资金充足的大型研究医院往往拥有最新、最好版本的扫描仪。 而且,如果他们只在自己的 2022 年模型上训练人工智能,那么它在较旧的 2010 年模型上就无法正常工作。 这些旧系统正是在不太富裕和农村地区发现的系统。 因此,通过仅使用来自新模型的数据,他们无意中对这些社区的人们引入了进一步的偏见。

其他关键变量是性别、种族和年龄,我们竭尽全力确保我们的数据在所有这些变量之间按比例平衡。

医疗科技公司面临哪些监管障碍?

我们开始看到 FDA 真正调查数据集中的偏见。 研究人员来找我们说“FDA 拒绝了我们的算法,因为它缺少 15% 的非裔美国人人口”(非裔美国人占美国人口的大约百分比)。 我们还听说一位开发人员被告知他们需要在训练数据中包含 1% 的太平洋夏威夷岛民。

因此,FDA 开始意识到,这些仅在一家医院训练过的算法在现实世界中不起作用。 事实是,如果您想要获得 CE 标志和 FDA 许可,您就必须提供代表人群的数据集。 正确的是,在小规模或无代表性的群体中训练人工智能已经不再被接受。

医疗科技公司面临的风险在于,他们投资数百万美元,将自己的技术带到他们认为已经准备好获得监管许可的地方,然后,如果他们无法通过,他们将永远不会获得报销或收入。 最终,商业化的道路以及对医疗保健产生他们想要的有益影响的道路要求他们关心数据偏差。

从数据角度来看,克服这些障碍有哪些选择?

近年来,数据管理方法不断发展,人工智能开发人员现在拥有比以往更多的选择。从数据中介和合作伙伴到联合学习和合成数据,有新的方法可以克服这些障碍。无论他们选择哪种方法,我们始终鼓励开发人员考虑他们的数据是否真正代表了将使用该产品的人群。这是迄今为止获取数据最困难的方面。

Gradient Health 提供的一个解决方案是 Gradient Label,这个解决方案是什么以及它如何实现大规模标记数据?

医学影像人工智能不仅需要数据,还需要专家注释。 我们帮助公司获得这些专家注释,包括来自放射科医生的注释。

您对医疗保健领域人工智能和数据的未来有何愿景?

已经有数千种人工智能工具可以观察从指尖到脚趾尖的一切,而且我认为这种情况将会继续下去。 我认为医学教科书中针对每种情况至少有 10 种算法。 每个工具都将拥有多种可能具有竞争力的工具来帮助临床医生提供最好的护理。

我不认为我们最终会看到星际迷航风格的三录仪来扫描某人并从头到脚解决所有可能的问题。 相反,我们将为每个子集提供专门的应用程序。

关于梯度健康,您还有什么想分享的吗?

我对未来感到兴奋。 我认为我们正在朝着一个医疗保健价格低廉、平等且向所有人开放的方向发展,我希望 Gradient 有机会在实现这一目标的过程中发挥重要作用。 这里的整个团队真诚地相信这一使命,他们之间有一种团结的热情,这是每家公司都没有的。 我喜欢它!

感谢您的精彩采访,想要了解更多信息的读者可以访问 梯度健康.

Unite.AI 创始合伙人 & 会员 福布斯技术委员会, 安托万是一个 未来学家 他对人工智能和机器人技术的未来充满热情。

他也是 证券,一个专注于投资颠覆性技术的网站。