Connect with us

访谈

佩德罗·阿尔维斯,Ople.ai 的 CEO 和创始人 – 采访系列

mm

佩德罗·阿尔维斯是 Ople.ai 的 CEO 和创始人,Ople.ai 是一个平台,赋予分析师和主题专家强大的预测分析能力。该平台拥有世界领先数据科学家的知识和专业知识,因此用户可以专注于他们真正擅长的领域:创造商业影响。

最初是什么吸引你进入数据科学领域?

在 2001 年,我看到了机器学习和人工智能的巨大潜力。在学习计算机科学作为本科生,并决定要进一步追求哪个子领域时,我想:好吧,AI/ML 是计算机科学的一个领域,我认为它很有趣 – 你可以帮助预测任何领域的事件。无论你是在生物学、医学还是金融领域,如果你有机器学习和 AI,你都可以显著推进这些领域。我一直认为它背后的数学很迷人。

当我进入研究生院时,我决定提高我在机器学习方面的专业知识的最佳方式是学习如何应用它。我一直很注重实用性;我不想仅仅为了理论而学习理论。我选择学习机器学习,因为它适用于基因组学和蛋白质组学领域。我的所有研究生工作都在计算生物学领域,但重点是机器学习。

不久之后,我进入了医疗保健行业,在那里我看到了人工智能/机器学习应用的巨大潜力。那是我开始看到人工智能在实践中存在的问题的时刻,我在学术界之外看到了人工智能的现实,并学习了如何在现实世界中应用人工智能,而不是仅仅因为技术问题。我因此而被吸引到解决这个问题。

您以前是 Banjo 的首席数据科学家,在那里您解决了社交网络领域的一些挑战。您能讨论一些这些挑战吗?

作为一家公司,我们会检测社交媒体上记录的事件,特别是需要被突出为潜在危险的事件,例如附近发生的车祸或着火的建筑。我们会帮助标记这些事件,以便进一步帮助调动急救人员。我们正在使用社交媒体做好事。

许多这样的事件在社交媒体数据中是罕见的。例如,每天在任何城市都可能发生许多车祸,但当你查看社交媒体数据的体量时,一张车祸的图片变得微不足道。考虑到几分钟内有数百万张狗的图片、食物的图片、数百万张自拍,以及一张车祸的图片。基本上,在 Banjo,我们正在找出一根针在一堆干草中。

因此,出现的一个挑战是关于计算机视觉的问题。虽然当时的计算机视觉还不错,但当你试图在数百万张图片中找到一张图片时,即使是一个小的错误率也可能完全摧毁你检测这些罕见事件的机会。

例如,有一个公开的数据集,当用来训练神经网络时,会导致神经网络无法识别颜色。即使一张图片在数据集中是彩色的,神经网络也会查看所有 RGB,但它不会使用颜色作为标志。拿一辆传统的警车和一辆传统的出租车为例 – 它们都是相同的基本车型,在顶部有一个额外的机械装置(例如,警车上的警笛或出租车上的空忙信号)。但是,如果你看颜色,两者之间的区别是明显的。由于这个例子,我们能够理解创建一个适当的数据集是至关重要的。

2017 年,您随后推出了 Ople。这个创业公司背后的起源故事是什么?

我希望公司能够从实施人工智能中获得良好的投资回报率。根据 Gartner 的说法,80% 到 90% 的人工智能项目永远不会见天日。这与技术方面无关,例如模型的准确性。通常是公司文化或公司内部的程序方面。

这可能是由于数据科学团队和业务用户之间缺乏充分的沟通,从而导致模型预测的是业务团队不需要的东西,因为数据科学团队没有理解需要构建什么。或者,如果他们构建了正确的模型,当数据科学团队完成后,业务团队根本不利用预测。 在大多数公司中,销售、营销和物流等部门才是真正应该利用人工智能的团队,但理解模型的却是数据科学团队。当这些团队不理解为他们构建的模型时,他们往往不相信其预测,因此不使用它们。

所以,如果人工智能没有改变公司的业务方式,那么有什么意义呢?

我们希望创建一个平台来解决这个问题 – 我们希望帮助数据科学团队或业务分析师、数据分析师、公司中参与此过程的任何人构建正确的项目,并帮助员工理解和信任模型。如果我们解决了这个问题,那么我相信数据科学终于可以为公司带来真正的价值。

您曾表示,数据科学家正在花费宝贵的时间执行可以用人工智能自动化的任务。可以举出一些应该自动化的任务的例子吗?

数据科学家通常需要几个月的时间来完成一个模型,一旦完成,公司就会实施该模型,尽管它可能没有达到最佳的准确性。在模型实施后的几个月里,数据科学家将继续致力于提高模型的准确性。通常,这就是数据科学家花费时间的地方,而他们本可以花时间做其他事情,例如确保员工理解、信任和使用现有的人工智能模型。所有这些时间都花在了可以轻松用人工智能自动化的任务上,例如特征工程、训练模型、参数调整和算法选择。

您能描述什么是 元学习 以及 Ople 如何应用它吗?

在我开始讨论元学习之前,了解机器学习的第一层是很重要的。假设你有一个数据集,可以预测工厂地板上的机器何时会坏掉。机器会通知员工它即将坏掉,这样他们就可以进行预防性维护。这被认为是学习的第一层。

元学习,也被称为“学习学习”,是进一步理解学习过程。因此,当您训练模型预测机器故障时,您有另一个模型在观察。例如,第二个模型可以帮助企业了解预测性维护模型学习得很好的参数和不太好的参数。当您进行元学习时,您可以更好地构建更高效的模型,速度更快。

您对 合成数据 有什么看法?

合成数据如果处理不当,可能非常难以处理。

假设您有医疗记录数据 – 您有 20 名患者,并且对于这些患者,您有他们的年龄、性别、体重、身高、血压、药物列表等。有可能使用机器学习根据这些医疗记录创建合成数据。然而,如果您仅仅依赖机器学习或统计学,您可能会得到不合理的合成数据。它可以创建一个随机的值组合,例如一个 3 岁的儿童身高 6 英尺或一个 4 英尺高的人体重 1000 磅。虽然人工智能/机器学习在许多情况下是可靠的,但用于医疗记录的合成数据需要有医生的输入。

因此,您需要让一位医疗专业人员参与创建参数,例如“如果这个人是这个年龄,那么什么是现实的身高范围和体重”,或者“如果他们正在服用这种药物,那么他们不应该服用什么药物”。这个过程最终会成为一项巨大的任务,并且对于每位患者的医疗记录来说,映射出所有可能性将变得过于复杂。

然而,在图像领域,合成数据可以更容易地理解和创建。假设您有一张车的图片,车位于左上角。您不需要成为专家就知道同一辆车可以在右下角、右上角或中心。您不仅可以将相机指向许多方向,还可以重新排列图片。将图片的焦点移动到车辆位于不同角落的位置,就是创建合成数据 – 另一种简单的方法是使用旋转。

您能给出一些 Ople 如何帮助企业解决数据需求的例子吗?

Ople.AI 为企业提供了在组织的各个层级利用深入的数据分析的能力,并为员工提供了解锁人工智能价值的机会,只需点击几下。与其依赖一小组数据科学家来阐述和实施人工智能,Ople.AI 平台为各个部门的员工提供了工具,以便他们能够访问数据的见解,并随之提高他们的日常效率。

话虽如此,企业在实施人工智能时经常面临的一个大障碍是模型可解释性。对于企业来说,提供员工可以理解和更重要的是信任的人工智能至关重要。模型可解释性有助于实现这一点。我们的目标是通过 Ople.AI 平台为可能不懂人工智能或技术的员工提供机会,让他们轻松理解模型如何做出预测以及为什么做出预测。创建模型可解释性将为企业带来强大的长期结果。

此外,模型可以为公司带来的价值远远超过做出预测。人工智能可以发现潜在的问题或可以利用的领域。我们称之为数据可解释性 – 模型可以以对公司有价值的方式分享数据的智能见解。这是人工智能可以帮助企业的重要方式,也是我们在竞争对手中领先的领域。

感谢采访,希望了解更多的读者可以访问 Ople.ai。

安托万是一位具有远见的领导者和Unite.AI的创始合伙人,他被对塑造和推广AI和机器人人的未来充满不动摇的热情所驱动。作为一位连续创业者,他相信AI将对社会产生与电力一样的颠覆性影响,他经常被听到对颠覆性技术和AGI的潜力大加赞赏。

作为一位未来学家,他致力于探索这些创新将如何塑造我们的世界。另外,他也是Securities.io的创始人,这是一个专注于投资于重新定义未来和重塑整个行业的尖端技术的平台。