访谈
杰里米·凯尔韦(Jeremy Kelway),EDB 数据、人工智能工程副总裁 – 采访系列

杰里米(杰兹)凯尔韦是位于美国太平洋西北地区的 EDB 的工程副总裁。他领导一个专注于交付基于 Postgres 的分析和人工智能解决方案的团队。凭借数据库即服务(DBaaS)管理、运营领导和创新技术交付经验,杰兹在推动新兴技术发展方面有着坚实的背景。
EDB 支持 PostgreSQL 以符合业务优先级,实现云原生应用开发、从旧数据库迁移的成本效益以及在混合环境中灵活部署。凭借不断增长的人才池和强大的性能,EDB 确保安全、可靠和卓越的客户体验,以满足关键任务应用的需求。
为什么 Postgres 正变得越来越多地被用作构建生成式人工智能应用的首选数据库,以及它具有哪些关键特性使其适合这一不断演变的格局?
由于 几乎 75% 的美国公司采用了人工智能,这些企业需要一种基础技术,使他们能够快速、轻松地访问大量数据,并充分利用人工智能。这就是 Postgres 的用处。
Postgres 可能是最完美的技术例子,它是一种经久不衰的技术,在人工智能时代比以往任何时候都更具有相关性。凭借强大的架构、对多种数据类型的本地支持和设计上的可扩展性,Postgres 是企业在主权和安全环境中为生产就绪人工智能利用数据价值的首选候选者。
在 EDB 存在的 20 年里,或者说 Postgres 作为一种技术已经存在 30 多年了,行业已经经历了演变、转变和创新,尽管如此,用户仍然继续使用 Postgres 来解决他们最复杂的数据挑战。
检索增强生成(RAG)如何被应用于今天,并如何看待它将塑造“智能经济”的未来?
RAG 流程正在获得显著的流行和势头,这是有原因的!当将其置于“智能经济”的背景下时,RAG 流程使信息的获取变得更加便捷,节省了时间,通过自动化和过滤数据和信息输出,这些输出原本需要大量的手动努力和时间来创建。检索步骤(检索)的准确性提高,并且可以将特定内容添加到更广泛的 LLM 中,提供了大量机会来加速和增强明智的决策,具有相关的数据。一个有用的思考方式是,如果你有一个熟练的研究助理,不仅可以找到正确的信息,还可以以适合上下文的方式呈现出来。
组织在生产环境中实施 RAG 时面临的一些最重大挑战是什么,以及哪些策略可以帮助解决这些挑战?
从根本上讲,您的数据质量是您的 AI 差异化因素。RAG 应用的准确性,特别是生成的响应,将始终受到用于训练和增强输出的数据质量的制约。如果输入存在缺陷,生成模型的复杂性将会降低,导致结果不合适和意外(通常被称为“幻觉”)。数据源的质量将始终是检索内容成功的关键,如果输出需要尽可能准确,LLM 的上下文数据源将需要尽可能更新。
从性能角度来看,采取主动措施,了解您的 RAG 应用程序试图实现什么,以及何时和在哪里检索数据,将有助于您了解潜在的影响。例如,如果您的 RAG 流程从事务数据源(即对业务至关重要的不断更新的数据库)中检索数据,监控这些关键数据源的性能以及从这些源检索数据的应用程序,将有助于您了解对这些关键事务数据源的性能影响。这些措施是管理 RAG 流程步骤的潜在或实时影响的绝佳步骤。此外,这些信息还可以提供有价值的上下文,以调整 RAG 应用程序,专注于适当的数据检索。
考虑到专用向量数据库在人工智能中的崛起,Postgres 相对于这些解决方案具有哪些优势,特别是对于希望使人工智能工作负载实现操作的企业?
具有使命批判性向量数据库的能力可以支持需求苛刻的人工智能工作负载,同时确保数据安全、可用性和灵活性,以集成现有的数据源和结构化信息。构建人工智能/RAG 解决方案通常会使用向量数据库,因为这些应用涉及与高维数据一起使用的相似性评估和推荐。向量数据库作为这些关键数据管道的高效和有效的数据源,用于存储、管理和检索。
EDB Postgres 如何处理人工智能中向量数据的复杂性,以及将人工智能工作负载集成到 Postgres 环境中的主要优势是什么?
虽然 Postgres 没有本机向量功能,但 pgvector 是一个允许您将向量数据与 Postgres 中的其他数据一起存储的扩展。这使得企业能够利用向量功能,同时利用现有的数据库结构,简化人工智能应用的管理和部署,减少了对单独数据存储和复杂数据传输的需求。
随着 Postgres 成为事务和分析工作负载的核心角色,它如何帮助组织简化数据管道并在不增加复杂性的情况下实现更快的洞察力?
这些数据管道实际上是在为人工智能应用提供动力。由于数据存储格式、位置和数据类型的种类繁多,检索阶段的复杂性很快就会成为一个切实的挑战,特别是当人工智能应用从概念验证转移到生产时。
EDB Postgres AI 管道扩展是 Postgres 在数据管理部分发挥关键作用的例子。通过自动管道简化数据处理,自动从 Postgres 或对象存储中获取数据,生成新的数据时生成向量嵌入,并在源数据更改时触发嵌入更新——这意味着无需繁琐的维护即可实现始终更新的数据用于查询和检索。
我们可以期待 Postgres 在近期内推出哪些创新或发展,特别是随着人工智能的不断演进和对数据基础设施的需求增加?
向量数据库绝不是一个完成的产品,随着向量数据库技术的利用和依赖的持续增长,进一步的开发和增强是可以预期的。PostgreSQL 社区继续在这一领域创新,寻求方法来增强索引以允许更复杂的搜索标准,以及 pgvector 能力的进展。
Postgres,特别是 EDB 的产品,如何支持多云和混合云部署的需求,以及为什么这种灵活性对人工智能驱动的企业至关重要?
EDB 的一项研究显示,56% 的企业现在以混合模式部署关键任务工作负载,突出了支持灵活性和数据主权的解决方案的需求。Postgres,结合 EDB 的增强功能,提供了多云和混合云环境中必不可少的灵活性,赋予人工智能驱动的企业管理数据的能力,既有灵活性,又有控制力。
EDB Postgres AI 为混合环境带来了云敏捷性和可观察性,具有主权控制。这种方法使企业能够控制人工智能模型的管理,同时也简化了事务、分析和人工智能工作负载在混合或多云环境中的部署。通过实现数据可移植性、细粒度的 TCO 控制和在各种基础设施上提供云类似体验,EDB 支持人工智能驱动的企业实现更快、更敏捷的响应,以满足复杂的数据需求。
随着人工智能越来越深入地嵌入企业系统,Postgres 如何支持数据治理、隐私和安全,特别是在处理人工智能模型的敏感数据的背景下?
随着人工智能成为企业的运营基石和竞争力不同iator,企业面临着日益增长的压力,需要保护数据完整性并维持严格的合规标准。这种不断演变的格局使数据主权成为焦点——在这里,严格的治理、安全和可见性不仅仅是优先事项,而是前提。企业需要知道并确保他们的数据在哪里,以及它要去哪里。
Postgres 是人工智能就绪数据环境的骨干,提供高级功能来管理混合和多云环境中的敏感数据。其开源基础意味着企业可以从不断的创新中受益,而 EDB 的增强功能确保了企业级别的安全、细粒度的访问控制和深度可观察性——这些对于负责任地处理人工智能数据至关重要。EDB 的主权人工智能功能建立在这一态度之上,专注于将人工智能能力带到数据中,从而实现对数据移动的控制。
EDB Postgres 具有哪些独特的能力,可以扩展人工智能工作负载,同时保持高可用性和性能,特别是对于关键任务应用?
EDB Postgres AI 通过将分析和人工智能系统更接近客户的核心运营和事务数据(所有这些都由 Postgres 管理)来提升数据基础设施,使其成为战略技术资产。它为人工智能驱动的应用提供了数据平台基础,通过减少基础设施复杂性、优化成本效益和满足数据主权、性能和安全的企业需求。
对于需要可靠解决方案的现代运营商、开发人员、数据工程师和人工智能应用构建者来说,EDB Postgres 是一个精美的数据平台,他们需要一个经过验证的解决方案来处理关键任务工作负载,同时可以访问分析和人工智能功能,同时使用企业的核心运营数据库系统。
感谢这次精彩的采访,希望了解更多的读者可以访问 EDB。












