访谈
利兰·哈森,Aporia联合创始人兼CEO – 采访系列

利兰·哈森是Aporia的联合创始人兼CEO,Aporia是一家全栈机器学习可观察性平台,用于确保负责任的AI。Aporia与任何机器学习基础设施无缝集成。无论是FastAPI服务器在Kubernetes上,还是像MLFlow这样的开源部署工具,或者像AWS Sagemaker这样的机器学习平台
在创立Aporia之前,利兰曾是Adallom(被Microsoft收购)的机器学习架构师,后来成为Vertex Ventures的投资者。
您10岁开始编码,最初是什么吸引您对计算机的兴趣,您当时在做什么项目?
那是1999年,一个朋友打电话给我,说他建了一个网站。输入200个字符的地址后,我在浏览器中看到了一个带有他名字的网站。我对他能在自己的电脑上创建东西并在我的电脑上看到它感到惊讶。这让我非常好奇它是如何工作的,以及我如何做到同样的事情。我问妈妈给我买一本HTML书,这是我编程的第一步。
我喜欢接受技术挑战,随着时间的推移,我的好奇心只会越来越强。我学习了ASP、PHP和Visual Basic,什么都学。
13岁时,我已经开始接一些自由职业项目,建网站和桌面应用程序。
当我没有活儿的时候,我会做自己的项目,通常是为了帮助别人实现目标的网站和应用程序:
蓝白编程 – 这是一种类似HTML的希伯来语编程语言,我在意识到以色列的孩子们没有高水平的英语技能被限制或被编程世界排除在外后创建了它。
Blinky – 我的祖父母是聋人,使用手语与朋友交流。当Skype和ooVoo这样的视频会议软件出现时,它们使他们能够与朋友交谈,即使他们不在同一个房间里(就像我们现在用手机做的那样)。然而,由于他们听不到,他们无法知道何时有来电。为了帮助他们,我编写了软件来识别来电并通过连接到他们电脑的小型硬件设备中的LED数组来提醒他们。
这些只是我作为青少年时期建立的一些项目。我的好奇心从未停止,我发现自己在学习C、C++、汇编语言和操作系统的工作原理,并尽力学习尽可能多的东西。
您能否分享您作为Adallom的机器学习架构师的经历?
我在军队服役五年后,作为Adallom的第一批员工之一加入了公司。公司由伟大的创始人领导,并由顶级风险投资公司支持,如红杉资本。云技术的爆发式增长刚刚开始,我们正在构建云安全解决方案。企业刚刚开始从本地转向云,我们看到新的行业标准出现,如Office 365、Dropbox、Marketo和Salesforce等。
在我加入公司的前几周内,我就知道我想创办自己的公司。我觉得从技术角度来说,我已经准备好接受任何挑战,如果不是我自己,我知道有合适的人可以帮助我克服任何困难。
Adallom需要有人既有深厚的技术知识,又能面向客户。快进一个月,我就乘坐飞往美国的飞机,第一次去见LinkedIn(当时还未被Microsoft收购)的朋友。几周后,他们就成了我们的第一个付费客户。之后,我们又有了许多大型企业,如Netflix、迪士尼和Safeway,我帮助他们解决了关键的云问题。这对我来说是一个很好的学习过程,也是一个很好的信心建立者。
对于我来说,加入Adallom是关于加入一个我相信的市场、团队和愿景的公司。我非常感谢在Adallom获得的机会。
我所做的事情的目的非常重要。对我来说,这在军队时期就很重要了。在Adallom,我看到了公司的方法——连接到SaaS解决方案、监控用户活动、资源、发现异常等——这是未来的发展方向。我相信Adallom将会是一家成功的公司。
我负责整个机器学习基础设施的架构。我亲眼目睹了缺乏适当工具的痛苦。很明显,需要一个专用的解决方案来集中管理所有模型、监控和警报、调试工具、根因分析和可解释的AI。这就是Aporia的想法开始成形的时候。
您能否分享Aporia的创立故事?
我的机器学习经历始于2008年,当时我参与了一个合作项目,包括威兹曼科学研究所、巴斯大学和一个中国研究中心。我建立了一个通过分析虹膜图像的生物识别系统,取得了94%的准确率。这个项目在研究方面取得了成功,但对我来说,感觉不够真实。因为你不能在现实生活中使用我建立的生物识别系统——它只对我使用的特定数据集有效。
这只是背景。当你建立一个机器学习系统时,你希望预测是确定性的——你希望知道系统能够准确识别某个人。这就像你的iPhone不会解锁,如果它不识别正确的人在正确的角度。但在我第一次进入机器学习领域时,这并不是事实。
七年后,我在Adallom亲身经历了在没有可靠防护的情况下运行生产模型的现实。后来,我有幸在Vertex Ventures担任投资者三年。我看到越来越多的组织使用机器学习,公司从仅仅谈论机器学习转变为实际使用机器学习。然而,这些公司面临着与我们在Adallom相同的问题。
每个人都急于使用机器学习,但他们试图在内部建立监控系统。显然,这不是他们的核心业务,这些挑战非常复杂。这时我意识到这是我产生巨大影响的机会。
AI正在被各个行业采用,包括医疗保健、金融服务、汽车等,它将影响每个人的生活。Aporia在这里发挥着至关重要的作用——使这些改变生活的用例能够正常运作并改善我们的社会。因为,就像任何软件一样,你会遇到bug,机器学习也不例外。如果不加以控制,机器学习问题可能会严重影响业务连续性和社会,导致意外偏见的结果。例如,亚马逊尝试实施AI招聘工具——由于意外偏见,机器学习模型更倾向于推荐男性候选人而不是女性候选人。这显然是一个不期望的结果。因此,需要一个专门的解决方案来检测意外偏见,在它成为新闻并影响最终用户之前。
为了让组织能够正确地依赖和享受机器学习的好处,他们需要知道何时机器学习不正常工作。现在,有了新的法规,机器学习用户经常需要解释他们的模型预测。最终,研究和开发新模型和创新项目至关重要,但是一旦这些模型遇到现实世界并为人们、企业和社会做出决定,就需要一个全面的可观察性解决方案来确保他们可以信任AI。
您能否解释透明和可解释的AI的重要性?
虽然看起来相似,但传统软件和机器学习之间有一个重要的区别。在软件中,你有软件工程师编写代码,定义应用程序的逻辑,我们知道代码的每个流程会发生什么。这是确定性的。这种方式是软件通常被构建的方式——工程师创建测试用例,测试边缘情况,达到70%到80%的覆盖率——你会感到足够自信地发布到生产环境中。如果出现任何警报,你可以轻松地调试并了解哪个流程出了问题,并进行修复。
这不是机器学习的案例。相反,逻辑不是由人类定义的,而是在模型的训练过程中定义的。当谈到逻辑时,它不是一套规则,而是一亿个数字的矩阵,代表机器学习模型的大脑。但这是一个黑盒,我们不知道矩阵中每个数字的含义。我们知道统计学上的含义,这是概率性的,而不是确定性的。这引发了很多问题。首先,我们如何信任一个我们无法解释其预测的系统?其次,我们如何在高度监管的行业中解释预测——例如金融部门?例如,在美国,金融公司有法律义务向客户解释为什么他们被拒绝了贷款申请。
无法用人类可读的文本解释机器学习预测可能是机器学习在各个行业大规模采用的主要障碍。我们希望知道模型没有做出偏见的决定。我们希望确保我们理解是什么导致模型做出特定的决定。这就是透明度和可解释性如此至关重要的地方。
Aporia的透明和可解释的AI工具箱解决方案如何工作?
Aporia的可解释AI工具箱作为统一的机器学习可观察性系统的一部分工作。没有对生产模型的深入可见性和可靠的监控和警报解决方案,很难信任可解释的AI洞察。因此,Aporia提供了一个单一的窗口,能够看到所有运行的模型、可自定义的监控、警报功能、调试工具、根因分析和可解释的AI。Aporia是一个专用的、全栈的可观察性解决方案,用于解决生产环境中出现的任何问题。
Aporia平台是中立的,能够为面向AI的企业、数据科学和机器学习团队提供集中式仪表盘和对其模型的健康状况、预测和决策的完整可见性——使他们能够信任自己的AI。通过使用Aporia的可解释AI,组织能够让每个相关的利益相关者了解机器学习决策,只需点击一下按钮——就可以获得对特定模型预测或模拟“什么如果”场景的可读洞察。另外,Aporia不断跟踪输入模型的数据以及预测,并在重要事件发生时主动发送警报,包括性能下降、意外偏见、数据漂移,甚至改进模型的机会。最后,通过Aporia的调查工具箱,您可以找到任何事件的根因并改进生产中的任何模型。
数据点和时间序列调查工具等功能如何帮助防止AI偏见和漂移?
数据点提供了模型接收的数据和预测的实时视图。您可以获得实时的数据流并了解业务中正在发生什么。这种可见性对于透明度至关重要。有时,随着时间的推移,会出现多个变化之间的关联——这就是时间序列调查的作用。
最近,主要零售商的AI预测工具在预测供应链问题时都失败了,Aporia平台将如何解决这个问题?
识别此类问题的主要挑战在于我们正在谈论对未来的预测。例如,多少人会购买某件特定的衬衫或新PlayStation。然后,需要一些时间来收集实际结果——超过几周。然后,我们可以总结并说,好吧,这是我们实际看到的需求。这段时间,从模型做出预测到业务知道它是正确还是错误的,需要几个月。到那时,通常已经太晚了,业务要么错失了潜在的收入,要么由于需要以大幅折扣出售过剩库存而损害了利润率。
这就是挑战所在。这也是Aporia变得非常有用的地方。首先,它使组织能够轻松获得对所做决策的透明度和可见性——是否有任何波动?是否有任何不合理的东西?其次,正如我们所讨论的那样,我们正在谈论大型零售商,我们正在谈论巨大的库存,手动跟踪它们几乎是不可能的。这就是Aporia作为24/7自动化和可自定义的监控系统被业务和机器学习团队最有价值的地方。Aporia不断跟踪数据和预测,分析预测的统计行为,并可以预测和识别消费者行为和数据行为的变化,一旦它们发生。与其等待六个月才意识到需求预测是错误的,不如在几天内就能识别出我们在需求预测上走错了的道路。Aporia将这个时间框架从几个月缩短到了几天。这对任何机器学习实践者来说都是一个巨大的游戏规则改变者。
您还想分享关于Aporia的其他内容吗?
我们正在不断增长和寻找拥有杰出思维的人加入Aporia的旅程。查看我们的开放职位。
感谢这次精彩的采访,希望了解更多的读者可以访问Aporia。












