访谈

Countly 联合创始人兼 CEO 奥努尔·阿尔普·索纳尔 – 采访系列

mm

奥努尔·阿尔普·索纳尔是 Countly 的联合创始人兼 CEO,Countly 是一家数字分析和应用内互动平台。作为一名技术专家和创业者,他从零开始打造了 Countly,以便为公司提供更多的控制权,让他们能够更好地理解和与用户互动。在他的领导下,Countly 已经发展成为一个全球范围内的可靠平台,帮助企业快速创新,同时将用户隐私放在增长战略的核心。

让我们回到您创立 Countly 的那一刻 —— 您当时在使用现有的分析工具时遇到了什么问题,导致您认为数据所有权模型是有缺陷的?

大约 13 年前,当移动应用开始流行时,现有的分析工具遵循了一种特定的模式。许多工具都是免费或价格较低的,但是作为交换条件,平台会收集和利用您的数据,通常将其融入广告生态系统中。当时,这被广泛接受为正常的运作方式。

然而,这并没有让我们感到满意。即使作为一家小公司,仅仅为了了解产品的性能就将所有用户数据交给别人,这似乎并不合理。

Countly 就是作为对此的回应而诞生的。我们希望构建一种分析工具,让公司能够完全拥有和控制它,这就是为什么我们将其作为开源、自托管平台推出的原因。我们的想法很简单:组织应该能够在不将数据交给别人的情况下理解和处理自己的数据。这一原则仍然是 Countly 今天的核心。

自从创立 Countly 以来,AI 已经将数据所有权从一个小众问题转变为一个战略性要求。您是什么时候意识到这一原则不仅仅适用于分析,而是对所有领域都很重要?

在早期,围绕数据所有权的讨论主要集中在隐私或合规性方面。主要是银行、医疗服务提供者和政府对数据所有权和控制非常关心。对于其他公司来说,分析主要被视为一个简单的报告工具,因此所有权问题并不紧迫。

这种观点开始随着公司越来越依赖数据来运行产品而不是仅仅衡量产品而发生变化。一旦分析从报告转变为决策、个性化、产品变化和客户互动,控制数据的重要性就变得更加明显。每一家数字化先锋公司,从出行到酒店业,实际上都在数据而不是仅仅在前端体验上竞争。

AI 已经极大地加速了这一认识。您可以许可或构建一个 AI 模型,但是您无法购买反映您自己产品用户交互行为的行为数据。这种数据对于每个组织来说都是独一无二的。

许多组织认为自己已经“AI 就绪”,因为他们拥有大量的数据。从您在真正的公司中看到的情况来看,表面下通常缺少什么?

数据的缺乏通常不是问题。真正的问题是缺乏可用的数据。许多组织拥有大量的信息,但是这些信息分散在不同的工具、团队和系统中。例如,营销可能拥有一个数据集,产品拥有另一个,而工程可能拥有自己的遥测数据,通常存储在不同的格式中,结构也不相同。

为了使 AI 有用,底层数据需要是干净的、连贯的和有上下文的。仅仅收集事件或日志是不够的,您需要了解这些信号实际上代表什么。没有语义层,AI 系统基本上是在猜测。

另一个问题是所有权。令人惊讶的是,很多公司实际上并不控制自己的数据,因为这些数据存储在第三方平台中。这使得组合数据集、管理数据使用和安全地应用 AI 模型变得困难。

因此,当公司声称自己已经“AI 就绪”因为他们拥有大量数据时,真正的问题是他们是否拥有一个连贯的数据基础。

为什么第一方数据在 AI 系统中创造了持久的竞争优势,而模型本身变得越来越可以互换?

产生持久优势的不是模型本身,而是来自第一方数据的对用户的理解。这种数据反映了人们实际上如何与您的产品交互,它对于每个组织来说都是独一无二的。模型另一方面,越来越多地成为商品。您可以许可它们、微调它们或在提供者之间切换相对容易。然而,您无法复制的是您自己的用户在产品上交互产生的行为数据。

这种数据捕捉了模式、上下文和信号,反映了客户实际的行为。当它被正确结构化和理解时,它使公司能够构建能够从真实使用中持续学习的系统,而不是依赖于通用数据集。

现代分析堆栈在哪里会在为 AI 系统而不是报告、仪表板和 KPI 而重新利用时悄悄地崩溃?

它们通常在数据需要从观察转变为行动的点上崩溃。传统的分析堆栈主要是为报告而设计的。它们收集和聚合数据,然后以仪表板的形式呈现,以帮助团队了解昨天或上周发生了什么。

AI 系统的运作方式却大不相同。它们需要结构化、有上下文且实时可用的数据,以便直接影响系统的行为。当分析管道围绕批处理和延迟报告而构建时,它们难以支持需要立即反应的系统。

在团队尝试将 AI 从实验转移到生产时,缺乏真正的数据所有权如何在操作中体现出来?

它通常表现为一个控制问题。最终,如果您不控制自己的数据,您就无法控制自己的 AI。这在实验转移到生产时变得尤为明显。在实验期间,团队可以使用小型数据集或临时管道,但是生产系统需要在整个组织中一致地访问可靠的数据。

然后,在许多公司中,底层数据存储在不同的第三方平台中,例如分析工具、营销系统或云服务。这使得组合数据集、应用治理规则或以受控方式在系统之间移动数据变得困难。这也是为什么许多 AI 项目仍然停留在试点阶段的原因之一。没有结构化的、组织范围的数据,部署 AI 到生产环境变得困难。

这也使得追踪模型如何得出某个决定或重现模型背后的确切数据状态变得更加困难。没有这种控制水平,纠正错误或回滚决定变得极其困难。

为什么糟糕的数据结构、语义和上下文会破坏甚至最有能力的 AI 模型?

即使是最有能力的 AI 模型也仅仅是其接收的数据那么好。如果底层数据结构不良或缺乏上下文,模型对这些信号的含义几乎没有任何理解。

在许多系统中,数据被收集为孤立的事件或日志,没有明确的含义。模型可能会看到成千上万的交互,但是没有适当的结构和语义,模型无法区分什么是重要的,什么只是噪音。

上下文同样重要。AI 系统需要了解不同数据片段如何随时间相关联。没有这种上下文,模型可能仍然会产生输出,但是这些输出往往不可靠,因为系统使用的是不完整的信息。

什么警告信号表明一家公司即将走向通用 AI 结果,尽管这些体验对于客户来说尚未感觉到通用?

最基本的警告信号是当公司依赖相同的外部 AI 模型和工具,但几乎没有努力开发自己的数据基础时。如果组织使用相同的模型,但不将自己的用户和上下文数据输入其中,系统基本上是从相同的通用输入中工作的。在这种情况下,AI 只能产生高级或通用的结果。随着时间的推移,这会导致产品感觉越来越相似,因为它们背后的智能是建立在相同的有限信息上的。

另一个警告信号是当组织专注于采用 AI 模型,但几乎没有关注其数据的结构和质量时。AI 放大了它接收的东西。如果底层数据混乱、分散或结构不良,系统只会产生同样问题的更复杂版本。

对于想要在自己的数据上构建 AI 的组织来说,Countly 实际上提供了什么,而传统分析和数据平台又不能提供什么?

关键的区别在于控制如何构建到平台中。在许多分析产品中,数据所有权似乎是一个选项或功能。对于 Countly 来说,它是系统的核心。该平台的设计使组织无需为了高级功能而放弃对数据的控制权。

在实践中,这意味着公司可以在自己的环境中运行 Countly,完全控制自己的数据堆栈,并在大规模上访问分析、参与和自动化功能。这在组织想要在自己的数据上构建 AI 时变得尤为重要。许多传统的分析工具主要是为报告而构建的,这意味着它们收集的数据通常停留在第三方仪表板中,而不是成为其他系统可用的基础。Countly 采取了不同的方法,将分析视为底层数据基础设施的一部分。

随着 AI 系统被嵌入日常决策中,当数据所有权被视为核心设计原则而不是策略复选框时,AI 的定义应该如何演变?

一旦数据所有权成为设计原则,AI 的伦理不再是事后审计模型,而是构建允许用户在训练模型的数据上保留代理权的系统。伦理成为基础设施。

感谢这次精彩的采访,希望了解更多的读者可以访问 Countly

安托万是一位具有远见的领导者和Unite.AI的联合创始人,他对塑造和推广人工智能和机器人技术的未来充满热情。作为一位连续创业者,他相信人工智能将对社会产生电力的影响一样的颠覆性影响,并经常被发现对颠覆性技术和通用人工智能的潜力大肆赞扬。

作为一位未来学家,他致力于探索这些创新将如何塑造我们的世界。另外,他还是Securities.io的创始人,这是一个专注于投资尖端技术的平台,这些技术正在重新定义未来并重塑整个行业。