访谈
data.world 的 CTO 和联合创始人 Bryon Jacob – 采访系列

Bryon Jacob 是 data.world 的首席技术官和联合创始人,致力于打造世界上最有意义、最具协作性和最丰富的数据资源。之前,他在 HomeAway.com 任职十年,担任过技术副总裁和技术研究员等职务。Bryon 还曾在亚马逊工作,并是 Capital Factory 的长期导师。他拥有凯斯西储大学的计算机科学学士和硕士学位。
是什么最初吸引你学习计算机科学?
我从 10 岁开始接触编程,当时我得到了第一台康莫多 64 计算机。我从 BASIC 开始,很快转向了汇编语言。对于我来说,计算机科学就像解开一系列复杂的谜题,同时还能体验到自动化的刺激。这种解谜的过程一直让我保持着兴趣和激情。
能否分享 data.world 的创立故事?
data.world 诞生于我们的创始团队的一系列头脑风暴会议。我们的 CEO Brett 联系了 Jon 和 Matt,他们之前曾经合作过。他们开始讨论想法,Jon 将一些想法带给我进行技术评估。虽然这些想法没有成型,但它们引发了与我自己的工作相关的讨论。通过这些对话,我们最终形成了 data.world 的概念。我们的共同历史和相互尊重使我们能够快速建立一个伟大的团队,吸引了我们之前合作过的最优秀的人才,并为创新奠定了坚实的基础。
是什么启发 data.world 开发 AI 上下文引擎,它解决了哪些企业面临的具体挑战?
从开始,我们就知道知识图谱(KG)对于推进 AI 能力至关重要。随着生成式 AI 的兴起,我们的客户希望 AI 解决方案能够与他们的数据进行对话式交互。当前 AI 应用中面临的一个重大挑战是可解释性。如果不能展示工作过程,答案就不那么可靠。我们的 KG 架构使每个响应都基于可验证的事实,提供清晰、可追溯的解释。这提高了透明度和可靠性,使企业能够自信地做出明智的决定。
AI Context Engine 的知识图谱架构如何提高 LLM 的准确性和可解释性,相比仅使用 SQL 数据库?
在我们的开创性论文中,我们证明了使用知识图谱(KG)比传统关系数据库提高了三倍的准确性。KG 使用语义来表示数据作为现实世界的实体和关系,使其比 SQL 数据库更准确,后者专注于表格和列。对于可解释性,KG 允许我们将答案链接回术语定义、数据源和指标,提供可验证的证据,增强信任和可用性。
能否分享 AI Context Engine 如何改变企业内部数据交互和决策的例子?
AI Context Engine 被设计为一个 API,能够无缝集成到客户现有的 AI 应用程序中,无论是自定义的 GPT、协同驾驶还是使用 LangChain 构建的定制解决方案。这意味着用户不需要切换到新的界面——我们将 AI Context Engine 带给他们。这种集成提高了用户的采用率和满意度,推动了更好的决策和更高效的数据交互,通过将强大的 AI 能力直接嵌入现有的工作流程中。
AI Context Engine 如何提供透明度和可追溯性,以满足监管和治理要求?
AI Context Engine 与我们的知识图谱和数据目录相连,利用数据血统和治理的能力。我们的平台跟踪数据血统,提供数据和转换的完整可追溯性。AI 生成的答案与其数据源相连,提供了每个信息片段是如何得出的清晰证据。这对于监管和治理合规至关重要,确保每个 AI 决策都可以被审计和验证。
您认为知识图谱在未来 AI 和数据管理领域会扮演什么角色?
知识图谱(KG)在生成式 AI 的兴起中变得越来越重要。通过将事实正式化为图结构,KG 为 AI 提供了更坚实的基础,提高了准确性和可解释性。我们看到从标准的检索增强生成(RAG)架构转向图 RAG 模型,这些模型首先将非结构化内容转换为 KG,导致回忆和准确性显著提高。KG 将在推动 AI 创新和有效性方面发挥关键作用。
未来我们可以期待哪些增强功能来进一步提高 AI Context Engine 的能力和用户体验?
AI Context Engine 会随着使用而变得更加智能,因为上下文会反馈到数据目录中,使其变得更聪明。从产品角度来看,我们专注于开发能够执行高级知识工程任务的代理,能够将原始内容转化为更丰富的本体论和知识库。我们不断从有效的模式中学习,并迅速将这些见解整合到产品中,为用户提供一个强大且直观的工具来管理和利用他们的数据。
data.world 如何投资研究和开发,以保持在 AI 和数据集成技术领域的领先地位?
AI Context Engine 的研发是我们最大的投资领域。我们致力于保持在 AI 和数据集成领域的技术前沿。我们的团队由符号 AI 和机器学习专家组成,推动这一承诺。我们在 data.world 建立的坚实基础使我们能够快速行动和突破技术界限,确保我们始终为客户提供最先进的功能。
您对 AI 和数据集成的未来有何长期愿景?data.world 将如何为这一演变做出贡献?
我对 AI 和数据集成的未来始终抱有这样的愿景:不仅仅是让用户更容易地查询他们的数据,而是完全消除用户查询数据的需要。我们的愿景一直是将组织的数据与其知识无缝集成,包括关于数据系统的元数据和现实世界实体的逻辑模型。
通过在机器可读的知识图谱中实现这种集成,AI 系统可以真正实现与数据的自然语言交互。随着过去两年中生成式 AI 的快速进步和我们将其与企业知识图谱集成的努力,这个未来正在今天成为现实。data.world 正处于这一演变的前沿,推动变革以使 AI 通过直观和智能的数据交互为用户带来前所未有的价值。
感谢这次精彩的采访,希望读者能够通过访问 data.world 了解更多信息。












