关注我们.

面试

Tabnine联合创始人兼联合首席执行官Eran Yahav教授访谈系列

mm

埃兰·亚哈夫教授Tabnine 的联合创始人兼联合首席执行官是以色列理工学院(Technion)的计算机科学教授,他的研究方向包括编程语言、机器学习和软件工程,尤其擅长程序合成和大规模代码分析。除了学术研究之外,他还联合创立了 Tabnine(原名 Codota),致力于将多年的研究成果应用于实用的开发者工具,引领了人工智能驱动的代码补全和自动化技术的发展。他的工作连接了学术界和产业界,专注于提升人工智能生成的代码的可靠性、安全性和上下文感知能力,使其能够更好地服务于真实的企业环境。

塔布宁 Tabnine 是一个人工智能驱动的编码平台,旨在协助开发人员完成整个软件开发生命周期,从编写和调试代码到生成测试和文档。Tabnine 最初作为代码补全工具推出,如今已发展成为一个面向企业的更广泛平台,集成了生成式人工智能和基于代理的工作流,使团队能够在保持对隐私、安全和合规性严格控制的同时,实现复杂开发任务的自动化。Tabnine 支持数十种编程语言,并与主流 IDE 集成,旨在提高开发人员的生产力,同时确保人工智能生成的代码值得信赖并符合组织标准。

您在以色列理工学院从事程序分析与综合研究多年,之前也曾在IBM研究院工作。是什么软件开发问题促使您联合创办了Tabnine?您的学术研究又是如何影响公司最初的愿景的?

我的学术研究主要集中在程序分析与合成领域,其本质是教会机器理解和生成代码。我的博士学位研究方向是程序分析,这也是我最初几年应用研究工作的主要方向。运用程序分析解决软件质量问题让我意识到,一旦程序编写错误,有些问题就很难解决。正所谓“预防胜于治疗”。这让我确信,解决软件质量问题的正确途径是程序合成,因此我将大部分研究时间和精力都投入到了程序合成领域。

我最初从事并发程序的程序合成研究,试图实现从顺序程序自动生成并发程序。之后,我转向使用机器学习进行更通用的程序合成。

利用机器学习进行程序合成也是Tabnine的核心理念。这个理念现在看来显而易见:模型可以直接从庞大的代码库中学习编码模式,并实时辅助开发人员。这一理念适用于软件开发生命周期的所有阶段——从代码创建到代码审查,再到部署以及后续环节。

我们的愿景始终是增强人类开发者的能力,为他们提供加速开发流程、消除摩擦的工具。软件开发是一门创造性和解决问题的学科,而人工智能的目标是通过处理日常任务,帮助开发者保持专注,从而消除开发过程中的摩擦。尽管技术自那时以来已经发生了显著变化,但这一愿景至今仍然指引着我们。

早在生成式人工智能凭借 OpenAI 等工具成为主流之前,Tabnine 就率先推出了人工智能编码助手。回顾过去,自那时以来,人工智能在软件开发中的角色发生了怎样的变化?业界又从第一批编码助手身上汲取了哪些经验教训?

最早的人工智能代码助手主要侧重于预测。它们本质上是高级自动补全系统,通过预测下一行代码或函数来帮助开发者更快地编写代码。

代理循环带来的变化是,人工智能现在可以更自主地处理任务,以至于我们可以将代理(在适当的指导下)视为独立的初级开发人员。

但这也给业界上了一堂重要的课。仅仅具备模型本身的能力不足以满足企业软件开发的需求。基于公共数据训练的模型可以产生令人印象深刻的输出结果,但它们往往缺乏对组织架构、依赖关系和惯例的了解。

因此,下一阶段的发展不仅仅是更大的模型或更大的上下文窗口,而是将这些模型与软件构建的真实环境联系起来。

许多企业发现,扩展人工智能代理规模需要的不仅仅是更大的模型,还需要更深入的组织背景。您认为为什么组织背景正在成为可靠的人工智能驱动开发的真正前沿领域?

软件系统是由复杂的关系网络构成的。单个更改可能会影响多个服务、API 或下游组件。

如今的人工智能模型非常擅长生成看似合理的代码,但它们往往缺乏对这些关系的结构化理解。缺乏这种理解,人工智能就无法可靠地推断出代码变更的后果。

企业逐渐发现,人工智能系统的可靠性取决于其运行环境的质量。如果人工智能系统能够理解系统架构、服务间的依赖关系以及组织的编码标准,它就能生成与系统实际运行方式更加契合的代码。

从这个意义上讲,上下文正在成为企业人工智能开发的下一个前沿领域。

您的新企业上下文引擎旨在使人工智能代理能够结构化地理解组织的架构、依赖关系和工程实践。这种方法与许多公司目前依赖的常用方法(例如检索增强生成)有何不同?

检索增强生成是一种有用的技术。它允许模型在生成答案时提取相关的文档或代码片段。

但仅仅检索信息并不能产生理解。它提供的是获取信息的途径,而不是构建结构。

企业上下文引擎旨在通过构建软件环境的结构化表示来更进一步。它分析存储库、服务、依赖关系、API 和架构关系,并将它们组织成一个系统实际运行方式的模型。

这使得人工智能系统能够推断组件之间的关系,而不仅仅是检索文本片段。对于复杂的企业环境而言,这种区别至关重要。

人工智能编码工具正从自动补全建议发展到能够执行多步骤工作流程的自主代理。您认为未来五年内,人类开发人员和代理系统之间的平衡将会发生怎样的变化?

人工智能代理将越来越多地承担日常开发任务。它们已经能够独立完成端到端的功能实现,包括测试和文档编写。每位开发人员都将成为人工智能开发团队的负责人。主要挑战在于如何将需求传达给这个团队,并验证生成的成果是否符合既定需求。

然而,软件开发的本质是解决问题和进行设计。开发人员将继续定义架构、权衡取舍,并指导系统的整体发展方向。

将会改变的是开发者工作的抽象层次。开发者不再专注于代码编写,而是越来越多地负责协调更高层次的工作流程,并与执行这些工作流程部分环节的人工智能系统进行协作。

换句话说,随着人工智能承担越来越多的机械性工作,开发人员的角色变得更加具有战略性。

Tabnine指出,在某些企业环境中,AI生成的代码验收率可以达到80%左右。企业应该使用哪些指标来判断AI编码工具是否真正提高了开发人员的效率,而不仅仅是生成了更多的代码?

关键问题不在于人工智能生成了多少代码,而在于它实际产生了多少有用的工作。

企业应该追踪几个指标。其中之一是首次通过率,它衡量的是人工智能生成的代码无需修改即可使用的频率。另一个是审查周期——即合并拉取请求之前需要多少次迭代。

企业还应该关注开发人员在返工上花费的时间,以及从开发到生产的变更所需时间。

如果人工智能工具确实能提高生产力,那么你应该能在各项指标上看到提升。开发人员花在修复生成代码上的时间会减少,而将更多时间投入到更高价值的任务中。

企业对于将专有代码暴露给外部模型仍然持谨慎态度。“可信AI编码”的概念如何解决治理、隐私和合规性方面的担忧?这些担忧一直阻碍着企业采用AI开发工具。

信任是企业采用人工智能最重要的因素之一。

信任是实现人工智能工程师愿景的终极挑战。我们如何才能信任人工智能工程师,使其能够自主完成关键的软件工程任务?我们如何确保其行为符合我们对质量、安全性和政策合规性的预期?如果人工智能工程师要成为我们工程团队中被认可的成员,它必须像我们经过严格筛选和适当入职培训的团队成员一样值得信赖。

应对这一挑战依赖于两大关键支柱:

  • 个性化使 AI 工程师深入了解您的组织、代码库和最佳实践。
  • 通过积极争取让商标与其相匹配的域名优先注册来维护实施强大的系统,以确保所有代码(包括人工智能生成的代码和人工编写的代码)均符合贵组织的质量、安全性、性能和可靠性标准。

此外,可信人工智能编码意味着赋予组织对人工智能部署方式的控制权,并确保集中治理和控制。

您曾提出,组织环境可能会成为企业人工智能架构的基础层——类似于以往计算时代的数据库或云基础设施。那么,未来的架构会是什么样子呢?

如果你观察企业技术的演变,我们经常会看到新的基础设施层不断涌现。

数据库成为数据管理的基础。云平台成为大规模运行应用程序的基础。

在人工智能时代,组织需要基础设施,使人工智能系统能够理解企业的内部结构——其系统、关系和运营限制。

该基础设施层将提供结构化的上下文,供多个 AI 系统使用,无论它们是编码助手、支持代理还是运营自动化工具。

从这个意义上讲,上下文成为了企业人工智能的共同基础。

许多公司构建的编码助手都与单一的基础模型紧密耦合。而Tabnine则允许企业根据自身需求连接不同的模型。为什么模型灵活性对于企业级AI开发工具的长期发展至关重要?

人工智能生态系统发展迅速。新模型频繁发布,不同的模型往往在不同的领域各有优势。

企业不应因模型环境的变化而每次都重新设计其开发工作流程。通过允许组织选择和切换模型,我们提供了灵活性,有助于确保其人工智能战略面向未来。

模型灵活性还允许组织在性能、成本、隐私要求和部署限制之间取得平衡。

从长远来看,企业很可能在多模型环境下运营,开发平台的设计应该考虑到这一现实。

对于如今正在评估人工智能开发平台的首席技术官和工程领导者来说,企业在部署人工智能编码工具时最容易犯的错误是什么?他们又该如何避免这些错误?

一个常见的错误是只关注模型的能力。大型模型固然重要,但在实际环境中的可靠性取决于人工智能对所运行系统的理解程度。

另一个常见的错误是在部署人工智能工具时没有考虑治理和安全要求。企业需要制定明确的政策,规范代码访问、模型部署和输出验证方式。

最后,一些组织期望人工智能能够立即提升生产力,而无需调整工作流程或提供足够的背景信息。成功的部署通常涉及将人工智能集成到现有的开发流程中,并将其与组织的代码和架构连接起来。

当这些要素结合在一起时,人工智能可以成为软件开发的强大加速器,而不仅仅是另一种工具。

感谢您的精彩采访,想要了解更多信息的读者可以访问 塔布宁.

Antoine 是一位富有远见的领导者,也是 Unite.AI 的创始合伙人,他对塑造和推动人工智能和机器人技术的未来有着坚定不移的热情。作为一名连续创业者,他相信人工智能将像电力一样颠覆社会,并经常对颠覆性技术和 AGI 的潜力赞不绝口。

作为一个 未来学家他致力于探索这些创新将如何塑造我们的世界。此外,他还是 证券一个专注于投资重新定义未来和重塑整个行业的尖端技术的平台。