访谈

埃蒂安·伯纳德,NuMind联合创始人兼首席执行官 – 采访系列

mm

埃蒂安·伯纳德是NuMind的联合创始人兼首席执行官,NuMind是一家成立于2022年6月的软件公司,专门从事机器学习工具的开发。埃蒂安是人工智能和机器学习的专家。在完成了ENS的博士学位和MIT的博士后研究后,埃蒂安加入了Wolfram Research,并在那里担任了7年的机器学习负责人。在此期间,埃蒂安领导了自动学习工具、用户友好的深度学习框架和各种机器学习应用的开发。

是什么最初吸引你进入机器学习领域的?

我第一次听到“机器学习”这个词是在2009年,我相信那是因为Netflix奖。机器可以学习的想法对我来说很有趣和强大。很明显,这将会带来很多重要的应用,包括创建人工智能的可能性。我立即决定深入研究,并且从未回头。

在获得ENS的博士学位和MIT的博士后研究后,你加入了Wolfram Research,并在那里担任了7年的机器学习负责人。你在那里工作的一些更有趣的项目是什么?

我在Wolfram最喜欢的项目是为Wolfram语言(也称为Mathematica)开发自动机器学习函数。第一个项目是Classify,你只需要给它数据,它就会返回一个分类器。对我来说,机器学习一直是关于自动化的。你不需要调整人类学生的超参数,也不应该为机器调整超参数。创建真正的强大和高效的自动机器学习函数,从科学和软件工程的角度来说,是非常具有挑战性的。

创建一个高级神经网络框架也是一个非常有趣的项目。有很多困难的设计决策,关于如何象征性地表示神经网络,如何可视化它们,如何操作它们(例如,可以剪切一些部分,粘合其他部分,替换层等)。我认为我们做得还不错,如果它是开源的,我相信它会被广泛使用;)

在此期间,你还写了一本名为“机器学习入门”的书,这本书的写作过程中遇到了哪些挑战?

哦,有很多!写这本书花了两年时间。我本可以决定只写一本“如何做”书,这样会更容易,但我的Wolfram之旅的一部分是关于学习机器学习,我觉得有必要传达这些知识。所以,主要的困难是决定谈论什么,和如何使其有趣和易于理解。然后是教学细节:我应该使用数学公式来解释这个概念?还是使用一些代码?或者只是一个可视化?我想让这本书尽可能地易于理解,这给我带来了很多头痛。总的来说,我对结果很满意。我希望它能够对很多人有所帮助!

你能分享一下NuMind的创立故事吗?

好吧。我想创办一家公司已经有一段时间了,最初是在2012年,目的是创建一个自动机器学习工具,但Wolfram的工作太有趣了。然后在2019-2020年,第一个大型语言模型(LLM)开始出现,例如GPT-2和GPT-3。它们能够理解和生成文本的能力对我来说是一个冲击。我也看到了创建NLP模型的痛点:你需要处理一个注释团队,拥有专家运行大量实验等等。我认为应该有一个使用这些LLM的工具来大大改善创建NLP模型的体验。我的联合创始人萨缪尔(碰巧也是我的堂兄)与我有相同的愿景,所以我们决定创建这个工具。

NuMind的目标是通过创建简单而强大的工具来推广机器学习和人工智能的使用。目前有什么工具可用?

的确。我们的第一个工具是用于创建自定义NLP模型的。例如,如果你想分析用户的反馈情绪,你可以使用我们的工具来训练一个自定义模型,这个模型可以在你的数据上表现良好。我们的工具允许你以极其简单和高效的方式实现这一点。基本上,你只需要加载你的数据,进行少量的注释,然后就可以通过API部署模型。这得益于LLM和我们称为交互式人工智能开发的新学习范式。

你看到NuMind的第一批客户开发了哪些自定义模型?

有几个情绪分析器。例如,一位客户正在监测帮助人们克服成瘾的群聊情绪,以便在情绪下降时进行干预。另一位客户使用我们的工具来找到最适合某份简历的工作岗位——我认为这种匹配人工智能有很大的潜力。我们还有客户使用我们的工具来从医疗和法律文件中提取信息。

公司使用NuMind工具可以节省多少时间?

当然,这取决于具体应用,但与传统解决方案(分别标记数据和训练模型)相比,我们看到最多10倍的速度改进,以获得一个模型并将其投入生产。我预计这个数字会随着我们继续开发产品而改善。最终,我相信原本需要几个月的项目将在几天内完成,并且具有更好的性能。

你能解释一下NuMind的交互式人工智能开发是如何工作的吗?

交互式人工智能开发的想法来自于人类如何相互教学。例如,如果你雇佣一名实习生来分类你的电子邮件,你首先会描述任务和其目的。然后你可能会提供一些好的例子,一些边缘情况,也许。然后你的实习生会开始标记电子邮件,并开始一段对话。你的实习生会回来问你一些问题,例如“如何标记这个?”或“我认为我们应该为这个创建一个新标签”,或者甚至问你“为什么”我们应该以某种方式标记。同样,你可能会问你的实习生一些问题来识别和纠正他们的知识缺口。这种教学方式非常自然,在信息交换方面非常高效。我们正在尝试在人类和机器之间模拟这种工作流程,以便高效地教导机器。

从技术上来说,这个工作流程是一种低延迟、高带宽、多模式和双向的人机交流,我们决定称之为交互式人工智能开发,以强调双向和低延迟的方面。我认为这是教导机器的第三种范式,继经典编程和经典机器学习(你只需要给计算机一些任务示例,让它自己弄清楚该怎么做)之后。

这种新范式是由LLM解锁的。的确,你需要在机器中拥有某种智能才能与它高效地交互。我相信这种范式将在不久的将来变得普遍,我们已经可以在基于聊天的LLM和我们的工具中看到它的迹象。

我们正在将这种范式应用于NLP任务的教学,但它也可以——并将会——被用于更多的事情,包括软件开发。

关于NuMind,还有其他你想分享的内容吗?

也许是它是一个可以被机器学习专家和非专家使用的工具,它是多语言的,你拥有自己的模型,并且数据可以留在你的机器上!

否则,我们目前处于私人测试阶段,因此,如果您有任何NLP需求,我们很乐意与您交谈并弄清楚我们是否可以帮助您!

感谢这次精彩的采访,希望了解更多的读者可以访问NuMind

安托万是一位具有远见的领导者和Unite.AI的联合创始人,他对塑造和推广人工智能和机器人技术的未来充满热情。作为一位连续创业者,他相信人工智能将对社会产生电力的影响一样的颠覆性影响,并经常被发现对颠覆性技术和通用人工智能的潜力大肆赞扬。

作为一位未来学家,他致力于探索这些创新将如何塑造我们的世界。另外,他还是Securities.io的创始人,这是一个专注于投资尖端技术的平台,这些技术正在重新定义未来并重塑整个行业。