访谈
Karthik Ranganathan,Yugabyte 联合创始人兼联合 CEO – 采访系列

Karthik Ranganathan 是 Yugabyte 的联合创始人和联合 CEO,Yugabyte 是开源、高性能的分布式 PostgreSQL 数据库 YugabyteDB 的公司。Karthik 是一位经验丰富的数据专家和前 Facebook 工程师,他与两位 Facebook 同事联合创立了 Yugabyte,以革新分布式数据库。
是什么启发你联合创立了 Yugabyte,你看到市场上有哪些空白导致你创造了 YugabyteDB?
我的联合创始人 Kannan Muthukkaruppan、Mikhail Bautin 和我于 2016 年创立了 Yugabyte。作为前 Meta(当时称为 Facebook)的工程师,我们帮助构建了流行的数据库,包括 Apache Cassandra、HBase 和 RocksDB,以及作为内部工作负载的托管服务运行其中一些数据库。
我们创建了 YugabyteDB,因为我们看到市场上缺乏面向业务关键应用的云原生事务数据库。我们构建了 YugabyteDB,以满足从本地到云原生操作的组织的需求,并将非关系数据库的优势与云原生架构的可扩展性和弹性相结合。在 Facebook 构建 Cassandra 和 HBase 的过程中(这有助于解决 Facebook 的重大扩展需求),我们看到微服务、容器化、高可用性、地理分布和应用程序编程接口(API)的兴起。我们还认识到开源技术在推动行业发展方面的影响。
人们经常认为事务数据库市场已经饱和。但是,今天 Postgres 已成为云原生事务数据库的默认 API。越来越多的云原生数据库选择支持 Postgres 协议,这已经成为 YugabyteDB 的一个特点,使其成为市场上最兼容 Postgres 的数据库。YugabyteDB 保留了 PostgreSQL 的强大功能和熟悉度,同时将其演变为适合现代云原生应用的企业级分布式数据库。YugabyteDB 允许企业使用熟悉的 SQL 模型高效地构建和扩展系统。
你在 Facebook 的经历如何影响了你对公司的愿景?
2007 年,我正在考虑是否加入一家小但正在增长的公司——Facebook。当时,该网站有大约 3000 万到 4000 万用户。我以为它可能会翻倍,但我错了!在我五年多的 Facebook 生涯中,用户基数增长到 20 亿。吸引我加入这家公司的是其创新和大胆的文化,鼓励人们“快速失败”以激发创新。
Facebook 已经变得如此庞大,以至于我渴望的技术和智力挑战已经不再存在。多年来,我一直梦想着创办自己的公司,解决普通用户面临的挑战——这让我联合创立了 Yugabyte。
我们的使命是简化云原生应用,重点关注三个对现代开发至关重要的功能:
- 首先,应用必须始终可用,确保在备份或故障的情况下保持正常运行,特别是在云中运行在商品硬件上时。
- 其次,按需扩展的能力至关重要,允许开发人员快速构建和发布,而无需等待硬件的交付。
- 第三,随着越来越多的数据中心变得容易访问,跨区域复制数据对于可靠性和性能至关重要。
这些三个元素赋予开发人员灵活性和自由,让他们能够创新,而不会受到基础设施限制的约束。
你能分享一下从 2016 年 Yugabyte 创立到现在成为分布式 SQL 数据库领导者的整个过程吗?在这段时间里,有哪些关键的里程碑?
在 Facebook,我经常与需要特定功能的开发人员交谈,例如在 SQL 数据库上添加二级索引或偶尔进行多节点事务。不幸的是,答案通常是“不”,因为现有的系统没有针对这些需求进行设计。
今天,我们正在经历一个转变,向云原生事务应用迁移,这些应用需要解决可扩展性和可用性问题。传统数据库无法满足这些需求。现代企业需要能够在云中运行的关系数据库,并提供三个基本功能:高可用性、可扩展性和地理分布,同时支持 SQL 功能。这些是我们构建 YugabyteDB 和专注于解决的数据库挑战的基础。
2016 年 2 月,创始人开始开发 YugabyteDB,一种针对云原生事务应用的全球分布式 SQL 数据库。2019 年 7 月,我们做出了一个前所未有的宣布,并将我们以前的商业功能作为开源发布。这重新肯定了我们对开源原则的承诺,并正式将 YugabyteDB 发布为完全开源的关系数据库管理系统(RDBMS),采用 Apache 2.0 许可证。
YugabyteDB 的最新版本(于九月份发布)具有增强的 Postgres 兼容性。它包括一个自适应成本优化器(CBO),该优化器优化了大规模、多区域应用的查询计划,并且具有智能数据分发,可以自动确定是否将表存储在一起以降低延迟,或者将数据分片和分发以提高可扩展性。这些增强功能使开发人员能够在 YugabyteDB 上高效运行其 PostgreSQL 应用,并且无需进行妥协或复杂的迁移即可扩展。
YugabyteDB 以其兼容 PostgreSQL 和 Cassandra 风格的 API 而闻名。这种多 API 方法如何让开发人员和企业受益?
YugabyteDB 的多 API 方法使其能够结合高性能 SQL 数据库的优势和全球互联网级应用所需的灵活性。
它支持水平扩展的关系数据库和高容量的在线事务处理(OLTP)工作负载,同时保持低查询延迟和异常的恢复能力。与 PostgreSQL 的兼容性允许现有的 Postgres 应用程序进行无缝的现代化升级,仅需最少的更改。
在最新版本的分布式数据库平台中(于 2024 年 9 月发布),功能如自适应 CBO 和智能数据分发通过优化查询计划和自动管理数据放置来增强性能。这使开发人员能够在不妥协的情况下实现低延迟和高可扩展性,使 YugabyteDB 成为快速增长的云原生应用的理想选择,这些应用需要可靠的数据管理。
AI 正在越来越多地被集成到数据库系统中。Yugabyte 如何利用 AI 来提高其 SQL 系统的性能、可扩展性和安全性?
我们正在利用 AI 来增强我们的分布式 SQL 数据库,解决性能和迁移挑战。我们的即将推出的性能导航员(Performance Copilot),是我们性能顾问(Performance Advisor)的增强版,将通过分析查询模式、检测异常并提供实时建议来简化故障排除数据库性能问题。
我们还将 AI 集成到 YugabyteDB Voyager 中,这是我们的数据库迁移工具,简化了从 PostgreSQL、MySQL、Oracle 和其他云数据库到 YugabyteDB 的迁移。我们旨在通过自动化模式转换、SQL 翻译和数据转换,并进行主动兼容性检查来简化从传统系统的过渡。这些创新旨在使 YugabyteDB 更加智能、高效和易于使用,适用于现代分布式应用。
使用像 YugabyteDB 这样的开源 SQL 系统与传统的专有数据库相比,在云原生应用中有哪些主要优势?
使用像 YugabyteDB 这样的开源 SQL 系统的主要优势包括透明度、灵活性和强大的社区支持。当我们推出 YugabyteDB 时,我们认识到人们对开源模式的怀疑。我们与用户互动,他们表达了对完全开源数据库的强烈偏好,以便将其用于他们的关键数据。
我们最初使用开源核心模型,但很快意识到需要一个完全开源的解决方案。开发人员越来越多地转向 PostgreSQL 作为 Oracle 的合理替代品,但 PostgreSQL 并不是为动态云平台设计的。YugabyteDB 通过支持 PostgreSQL 的功能深度来填补这一空白,以满足现代云基础设施的需求。通过成为 100% 开源,我们消除了采用障碍。
这使我们对构建业务关键应用的开发人员和在云原生平台上运行它们的运维工程师非常有吸引力。我们的重点是创建一个不仅开源,而且易于使用并与 PostgreSQL 兼容的数据库,PostgreSQL 仍然是开发人员的最爱,因为其成熟的功能集和强大的扩展。
可扩展和适应性强的 SQL 解决方案的需求正在增长。你在企业数据库市场中观察到哪些趋势,Yugabyte 如何满足这些需求?
企业数据库中的更大规模往往导致故障率增加,尤其是当组织处理更大的足迹和更大量的数据时。影响数据库格局的关键趋势包括 DBaaS 的采用以及从公有云到私有云环境的转变。此外,生成式 AI 的整合带来了机会和挑战,需要自动化和性能优化来管理不断增长的数据负载。
组织越来越多地转向 DBaaS,以简化操作,尽管最初对控制和安全有所担忧。这种方法可以提高跨各种基础设施的效率,同时关注私有云解决方案有助于企业降低成本并提高工作负载的可扩展性。
YugabyteDB 通过将关系数据库的优势与云原生架构的可扩展性相结合来满足这些不断演变的需求。像智能数据分发和自适应 CBO 这样的功能增强了性能,并支持大量数据库对象。这使其成为运行广泛应用的有力选择。
此外,YugabyteDB 允许企业迁移其 PostgreSQL 应用,同时保持类似的性能水平,对于现代工作负载至关重要。我们致力于开源开发,鼓励社区参与,并为希望避免供应商锁定的客户提供灵活性。
随着边缘计算和物联网的兴起,YugabyteDB 如何解决这些技术带来的数据分布和延迟挑战?
YugabyteDB 的分布式 SQL 架构旨在通过提供一个可扩展且可靠的数据层来满足边缘计算和物联网带来的挑战,该数据层可以在云和边缘环境中无缝运行。其自动分片和复制数据的能力确保了高效的数据分发,实现了快速访问和实时处理。这最小化了延迟,使应用能够快速响应用户交互和数据更改。
通过提供根据特定应用需求调整配置的灵活性,YugabyteDB 确保企业能够有效地管理其数据需求,因为它们在日益去中心化的环境中不断演变。
作为联合 CEO,你如何平衡领导技术创新和管理公司增长的双重角色?
我们的公司旨在简化云原生应用,这促使我紧跟技术趋势,例如生成式 AI 和上下文切换。跟进创新需要好奇心、渴望产生影响以及持续学习的承诺。
平衡技术创新和公司增长基本上是关于扩展——无论是扩展系统还是扩展影响力。在分布式数据库中,我们专注于构建能够扩展性能、处理大量工作负载并在全球基础设施上实现高可用性的技术。同样,扩展 Yugabyte 意味着增长我们的客户群,增强社区参与,并扩展我们的生态系统,同时保持运营卓越。
所有这些都需要对性能和效率采取有纪律的方法。
从技术上讲,我们优化查询执行,减少延迟,提高系统吞吐量;从组织上讲,我们简化流程,扩展团队,并增强跨职能协作。在这两种情况下,成功来自于赋予团队正确的工具、洞察力和流程,使他们能够做出明智的、数据驱动的决策。
在接下来的 5-10 年里,你如何看待分布式 SQL 数据库的演变,特别是在 AI 和机器学习的背景下?
在接下来的几年里,分布式 SQL 数据库将演变以处理复杂的数据分析,允许用户在没有大量技术专业知识的情况下进行预测和检测异常。AI 和机器学习的背景下存在大量的数据库专业化,但这不可持续。数据库需要演变以满足 AI 的需求。这就是为什么我们正在迭代和增强 pgvector 的功能,确保开发人员可以将 Yugabyte 用于其 AI 数据库需求。
此外,我们可以期待对 AI 开发中的开源的持续承诺。五年前,我们使 YugabyteDB 在 Apache 2.0 许可下完全开源,强调了我们对开源框架的承诺,并积极地建立我们的开源社区。
感谢您提供的详细回复,希望了解更多的读者可以访问 YugabyteDB。












