存根 Seek AI 创始人兼首席执行官 Sarah Nagy - 访谈系列 - Unite.AI
关注我们.

面试

Seek AI 创始人兼首席执行官 Sarah Nagy – 访谈系列

mm

发布时间

 on

莎拉·纳吉 (Sarah Nagy) 的创始人兼首席执行官 寻求人工智能,一个平台,使业务最终用户能够在 Slack、Teams 和电子邮件中提出与他们当前向数据团队提出的完全相同的问题。 他们没有“巧妙”地写问题,也没有学习新的平台。

您最初是一名研究人员,使用哈勃太空望远镜的数据。 你在做什么?

我当时在加州大学洛杉矶分校和加州理工学院进行研究,观察一些可以用望远镜观测到的最遥远的星系,并致力于分析它们的一些特性,例如质量和大小。 这项研究的目的是帮助我们了解非常遥远的星系与距离我们较近的星系之间的差异,并开发这些星系随着时间的推移如何形成的模型。

然后,您在多家初创公司担任数据科学家。 有哪些更有趣的项目?

一个突出的项目涉及使用自然语言处理 (NLP) 对与零售商品相关的非结构化文本进行分类。例如,采用原始文本(例如“air jordans green”)并标记为估计品牌(“Nike”)。我有一位专门研究 NLP 的同事,他正忙于另一个项目,所以实际上我本来不应该从事这个项目。由于他们很忙,所以最终交给了我。当时我什至对 NLP 一无所知,所以我参加了斯坦福大学和 Fast.ai 的一些免费课程来增加我的知识。我真的很喜欢学习 NLP,并开始理解为什么它如此重要,以及为什么人工智能 (AI) 能够理解语言是迈向所谓的“通用人工智能”的一大步。这次经历无疑让我在 GPT-3 刚推出时就迅速理解了它的重要性。

您能分享一下 Seek AI 背后的起源故事吗?

当 OpenAI 的 GPT-3 模型问世时,我立即认识到这是多么令人难以置信的进步,并且对涉及 GPT-3 编写代码的应用程序感到特别兴奋。 毕竟,作为一名数据科学家,我整天都在编写代码,看到人工智能做到这一点并完美地生成代码,真是令人瞠目结舌。 我将我对 GPT-3 的反应与 2013 年第一次了解 VR 的反应进行比较,那对我来说是另一次令人瞠目结舌的经历。 我最终决定需要成立一家初创公司来押注这项技术。 我并不确切地知道我要构建什么,但我有一种直觉,如果我更多地了解这些模型,一些有价值的东西就会水到渠成。

一旦我真正了解了这些模型,我就意识到我可以解决我作为一名量化分析师或数据科学家时遇到的痛点。 所讨论的痛点是业务人员没有合适的工具来回答自己的数据问题。 作为一名数据科学家,我经常会处理需要高度关注的问题,但我经常被业务方面的同事打断,他们对数据有疑问,迫使我停止正在做的事情。 这个过程似乎陈旧且低效。 我意识到,如果我专注于解决问题的新技术,它将成为这个非常重要且普遍存在的问题的类别定义解决方案。

Seek AI 使用生成式人工智能。 您能向我们的读者解释一下这是什么吗?

“生成式人工智能”是一个非常炒作的流行词,但与其他流行词不同,我不认为这种炒作是没有根据的。该术语指的是具有数千亿参数的大型机器学习模型,例如 Open AI DALL-EGPT-3。 这些模型的创新之处在于它们可以理解自然语言并生成文本、图像、代码等。 例如,如果您曾经尝试过 DALL-E 或稳定扩散,您很快就会明白为什么这些模型如此大肆宣传; 他们具有令人难以置信的类似人类的能力来理解自然语言命令,并且可以创作出可与最优秀的人类艺术家相媲美的艺术作品。

代码生成是生成式人工智能最小众但最重要的应用之一。 数据变得越来越大、越来越复杂,因此人类手动分析和组织变得更加困难。 然而,这些数据中编码了如此多的信息。 这些信息不仅对组织来说非常强大,还可以在学术方面带来令人难以置信的科学突破。 构建人工智能以从数据中提取价值将以有用信息的形式释放令人难以置信的价值。

Seek AI 正在构建一个界面,使用户能够使用自然语言与数据进行交互。 知识工作者可以通过电子邮件、Slack、文本和一系列客户关系管理 (CRM) 系统访问 Seek AI 的自然语言界面。

Seek AI 使用了哪些其他类型的机器学习?

虽然生成式人工智能是我们机器学习架构的一部分,但我们的架构还包括开源深度学习模型的几个分支。 Transformer 模型(“生成式 AI”是其中的一个变体)包含 Seek 使用的许多(但不是全部)模型。

为什么对于非技术用户来说能够快速访问数据如此重要?

如果数据不能产生投资回报率,那么数据有什么用?如果面向企业的用户甚至无法访问数据,企业如何才能获得投资回报率? 这就是为什么在不影响准确性的情况下向尽可能多的人提供访问权限是绝对必要的。

当我还是一名数据科学家时,有时我会收到首席执行官的要求,要求我分析一些数据,以帮助我们公司的产品或上市策略。 这些项目可能需要数周或更长时间。 作为现在的首席执行官,我肯定比我在数据方面时更深入地了解这些项目的重要性。 我经常发现自己希望能够轻松获取触手可及的数据,以便更快地做出决策。 这是我们在 Seek 解决问题的一个例子。

Seek AI 如何使这些数据变得如此容易检索?

有趣的是,数据实际上只能用代码来分析。 确实,有些平台是对该代码的抽象(例如数据仪表板),但在幕后,有数据分析师手动编写的代码,使数据能够呈现给业务最终用户。

大多数知识工作者不知道如何编码,不想编码,或者甚至无法访问数据,即使他们确实想编写代码来分析数据。 因此,当他们需要数据时,他们要么需要在仪表板中找到它,要么询问数据团队是否找不到它。 数据集越大,这种情况发生的就越多。

因此,数据团队需要成为针对他们的自然语言问题以及他们使用代码查询的数据本身的“翻译者”。 消除这个“翻译”中介是 Seek 所做工作的核心。

企业如何确保他们使用的数据准确?

管理数据准确性和可访问性之间的权衡是一个巨大的挑战。 正如我在最近的一次采访中所说,一方面,可访问性允许技术水平较低的人员开始与公司数据的知识源泉进行交互。 另一方面,受污染的水源(即不良数据)有什么用呢?

最好的数据团队是以尽可能最佳的方式管理这种权衡的团队,其中很大一部分是仔细校准和审查非技术用户可以交互的任何工具。

Seek AI 平台的用例有哪些?

我们已经在 B2B SaaS、金融科技、消费品 (CPG) 和 B2C 电子商务垂直市场中为客户和设计合作伙伴提供价值。

战鳍例如,是另类金融数据集的领先市场。 他们相信,能否快速、高质量地回答客户的问题,是战胜竞争对手的关键。 该公司首席执行官 Tim Harrington 指出:“Seek AI 在我们公司的 2023 年战略中发挥了关键作用,因为它为我们提供了访问和分析 2,400 多个数据集以回答客户问题的优势。 我估计,如果没有该平台,我们在 Seek AI 上的投资回报率约为 10 倍,这是基于我们为达到这种效率水平所花费的成本。”

关于 Seek AI,您还有什么想分享的吗?

这可能是无耻插头的正确位置。 Seek 目前提供我们平台的免费试用,可以通过 寻求人工智能。 我们很高兴成为将生成式人工智能引入数据团队的先驱,我期待着与我们的客户一起踏上这段旅程。

感谢您的精彩采访,想要了解更多信息的读者可以访问 寻求人工智能.

Unite.AI 创始合伙人 & 会员 福布斯技术委员会, 安托万是一个 未来学家 他对人工智能和机器人技术的未来充满热情。

他也是 证券,一个专注于投资颠覆性技术的网站。