人工智能
Nir Bar-Lev,Allegro AI 的 CEO 和联合创始人 – 采访系列

Nir Bar-Lev 是 Allegro AI 的 CEO 和联合创始人。Allegro AI 专门帮助公司开发、部署和管理机器学习和深度学习解决方案。通过 Allegro AI,组织可以更快、更具成本效益地推出和管理更高质量的产品。这些产品基于 Allegro Trains 开源的 ML 和 DL 实验管理器和 ML-Ops 包。
您最初被什么吸引到 AI 领域?
在我的职业生涯中,我主要被吸引到的是将尖端技术创新应用于解决大规模的问题或机会(实际上,它们是同一枚硬币的两面)。我必须承认,我在 Google 的时间确实帮助我形成了这种倾向。
AI 无疑符合这两个标准。它是当前技术前沿的领军者,并且有潜力影响我们生活的几乎每个方面。
您曾在 Google 任职,担任 Google 语音识别平台的创始产品负责人。您能否讨论一下您在 Google 早期的工作经历以及您从中获得的经验?
从沃顿商学院毕业后,我直接加入了 Google,我被 Google 的运作方式所震惊,它与世界上最好的商学院所教授的成功商业运作方式以及我之前的职业经验有着巨大的差异。我记得当时与几位同事讨论这个问题,他们也刚刚从 MBA 学位毕业加入了 Google。
事实证明,Google 在某种程度上改变了商业规则书,但它也从广告业务中获得了大量的资金,这使得它能够以其他公司无法承受的方式进行实验。在我花了十年时间在 Google 工作后,我发现它越来越多地采用了“主流”的商业惯例和思维方式。
对于我来说,作为语音识别平台的产品负责人,我必须与研究科学家合作。这实际上是 Google 最早的、如果不是第一个,真正关于应用研究的研究团队。对于我来说,这是一个巨大的挑战。研究人员的思维方式与工程师有很大不同,而我当时正试图在一个极度以工程为导向的公司中与成就卓著的研究人员合作。
事实证明,我当时面临的挑战与现在公司试图将 AI 数据科学家融入其组织时面临的问题非常相似。
2016 年,您成为 Allegro AI 的联合创始人。您创立 Allegro AI 的灵感是什么?
在创立 Allegro AI 时,我与两位杰出的合作伙伴合作,他们都是出色的工程人才。我的一位合作伙伴是以色列第一个也是最顶尖的 AI 实验室的第一位博士生,该实验室位于全球领先的 AI 集群之一。因此,他实际上是当地应用 AI 社区的创始团队成员之一。他有远见,认识到在实践中应用机器学习/深度学习将面临一系列新的挑战,例如规模、自动化、可靠性、质量等。在与他们交谈时,我意识到我可以从我的 Google 经验和之前的经验为团队做出贡献,真正有机会创建一家能够通过我们提供的工具对 AI 产生巨大影响的公司。
Google 和其他科技巨头拥有令人羡慕的资源和顶级人才。但是,几乎所有其他公司都无法承担这样的成本(无论是人才、财务资源、公司关注点等)。因此,这是一个机会,正好符合我最喜欢做的事情(见问题 1),并帮助整个生态系统。
Allegro AI 提供开源机器学习和深度学习管理平台。您能否讨论使用开源软件的好处?
开源软件有几个好处。最重要的是,它利用更广泛的社区来改进产品本身。用户发现错误、问题,有广泛的讨论关于感兴趣的功能;与其他开源工具的集成比与两个商业组织之间的集成更容易实现等等。
它为社区和公司提供了双赢的模式。它容易被组织尝试和测试,甚至扩展,而这些组织不愿意或无法为此付费。同时,它也使更大的潜在客户能够在广泛使用的软件(因此风险较小)基础上支付额外的功能/服务。
Allegro AI 提供数据管理服务。您能否讨论一下为此提供的工具类型?
Allegro Ai 提供结构化数据和非结构化数据管理。然而,虽然有许多成熟的结构化数据管理解决方案,我们提供了一个针对非结构化数据的独特解决方案。
具体来说,需要明确我们提供的数据管理类型。其理念不是物理数据管理,而是从 AI 角度出发的数据管理。对于 AI,数据科学团队需要了解他们可以使用的数据。对于非结构化数据来说,这非常困难。想象成千上万或数十万小时的视频或音频。想象成亿计的传感器信号等。
数据科学家需要了解数据的方差,以便与不同的情况相匹配,从而有效地训练他们的模型。他们需要了解是否有关键数据缺失;是否存在数据偏差或倾斜。
然后 – 在另一方面 – 他们需要有工具来解决这些情况,以低成本和快速的方式解决,而无需外出寻找新数据并注释/标记(这是一个非常昂贵且耗时的任务)。
这基本上是我们在这个领域提供的工具:在前所未有的细节和粒度水平上进行“AI 业务智能”的强大工具。另一方面,我们提供工具来紧密集成数据到实验和模型中,以便数据科学家可以使用现有数据设置有效的训练运行,而无需编写代码。
此外,我们提供额外的价值增值服务,例如数据流优化、数据移动等。由于我们正在处理数十亿字节的数据,因此移动数据的成本很高,公司需要解决方案来优化这一过程。
Allegro AI 还提供数据工程服务的外包。您能否讨论一下可用的服务?
Allegro Ai 主要是一家产品公司,我们认为自己提供工具、基础设施或框架,以帮助公司开发、部署和管理集成了 AI(DL/ML)模型的产品。
话虽如此,这是一个新领域,我们的客户有时需要帮助设置他们的特定管道,这些管道建立在我们的工具之上,或者甚至需要帮助启动他们自己的模型。当这种情况发生时,我们提供辅助服务来补充我们的核心软件产品。
您能否讨论联邦学习的重要性以及 Allegro AI 在此背景下的应用?
联邦学习基本上是指能够训练单个 AI 模型,利用分布在不同物理位置的数据集进行训练,而无需将这些数据集集中在一个位置。我们还提供了一种增强版的联邦学习,我们称之为“盲联邦学习”或“盲协同学习”,在这种情景中,任何实体(包括最终获得模型的实体)都无法访问不属于自己的数据。
联邦学习在数据隐私、监管或知识产权/保密性至关重要的各种情况下至关重要,同时也希望利用不同的数据集。例如,两家或多家医院或医疗机构希望合作训练 CT 扫描模型;或两家政府机构希望合作训练反恐模型,但由于法律原因,即使彼此之间也无法暴露数据。
或者,即使一个实体无法移动其各个数据存储,因为这将极其昂贵 – 例如,一家全球汽车 OEM 公司希望训练自主驾驶汽车,利用来自世界各地行驶的汽车收集的数据。
Allegro AI 是全球为数不多的拥有经过验证和测试的商业平台的公司之一,该平台可以实现联邦学习。
您还想分享关于 Allegro AI 的其他信息吗?
Allegro AI 是 AI 工具和 ML-Ops 领域的新兴力量。就在过去的一个季度,在 COVID-19 危机的第一波期间,我们的客户基础在短短 3 个月内就增加了一倍多。
感谢这次采访,希望了解更多的读者可以访问 Allegro AI。












