访谈
Etan Ginsberg,Martian 的联合创始人 – 采访系列

Etan Ginsberg 是 Martian 的联合创始人,Martian 是一个动态路由每个提示到最佳 LLM 的平台。通过路由,Martian 实现了比任何单个提供商(包括 GPT-4)更高的性能和更低的成本。该系统建立在公司独特的模型映射技术上,该技术将 LLM 从复杂的黑盒中解析为更易于解释的架构,使其成为第一个商业应用的机制可解释性。
Etan 从中学开始就编码、设计网站和为客户建立电子商务业务。作为一个博学多才的 Etan,他是世界记忆锦标赛的竞争者,并在中国深圳的世界速度阅读锦标赛中获得第二名。
他是 vid 黑客马拉松的竞争者。过去的奖项包括 Tech Crunch SZ 的第三名、普林斯顿黑客马拉松的七强决赛和耶鲁黑客马拉松的三个行业奖。
您是之前的两次创业公司的创始人,这两家公司是什么,您从这次经历中学习到了什么?
我的第一家公司是美国忍者勇士运动的第一个推广和发展平台。2012 年,我认为美国忍者勇士运动是一个地下运动(类似于 90 年代的 MMA),我创建了第一个平台,人们可以在那里购买蓝图、订购障碍和找到训练馆。我为想要开设自己的健身房的公司提供咨询,包括帮助美国特种部队建立一个训练课程,并将一个设施从草图扩展到前三个月的收入为 30 万美元。虽然我当时还在高中,但我已经有了管理 20 多名工人的经验,并学习了有效的管理和人际关系。
我的第二家公司是一家我在 2017 年之前的 ICO 波潮中联合创立的替代资产管理公司。这是我第一次接触 NLP,我们使用社交媒体数据的情感分析作为投资策略。
我学习了创办初创公司所需的许多硬技能和软技能——从如何管理团队到 NLP 的技术方面。我也学到了很多关于自己的东西和关于我想要从事什么的东西。我相信,最成功的公司是由有更广泛的愿景或目标的创始人创立的。我在 2017 年离开了加密货币领域,专注于 NLP,因为增强和理解人类的智慧是我真正热衷的东西。我很高兴发现了这一点。
您在就读宾夕法尼亚大学期间进行了一些 AI 研究,具体研究了什么?
我们的研究最初专注于构建 LLM 的应用。特别是,我们从事了 LLM 的教育应用,并正在构建第一个 LLM 驱动的认知导师。结果相当好——我们在初步实验中看到学生的成绩提高了 0.3 个标准偏差——我们的系统已被从宾夕法尼亚大学到不丹大学的各个大学使用。
您能讨论一下这项研究如何导致您联合创立 Martian?
因为我们是最早在 LLM 之上构建应用的人之一,我们也是最早遇到构建 LLM 应用时面临的问题的人之一。这指导我们的研究朝着基础设施层发展。例如,我们很早就开始在更大的模型(如 GPT-3)的输出上对较小的模型进行微调,并对专门的数据源(如编程和数学问题解决)进行模型微调。这最终导致我们遇到了关于模型行为和模型路由的问题。
Martian 的名称来源及其与智能的关系也很有趣,您能分享一下这个名称的选择故事吗?
我们的公司以 20 世纪生活的一群匈牙利裔美国科学家“火星人”命名。这个群体中包括一些有史以来最聪明的人:
- 其中最著名的是 约翰·冯·诺伊曼;他发明了博弈论、现代计算机体系结构、自动机理论,并在其他几十个领域做出了基本贡献。
- 保罗·埃尔多什 是有史以来最多产的数学家,发表了超过 1500 篇论文。
- 西奥多·冯·卡门 建立了空气动力学的基本理论,并帮助创立了美国太空计划。人类定义的地球和外太空之间的边界被称为“卡门线”,以表彰他的工作。
- 利奥·西拉德 发明了原子弹、放射治疗和粒子加速器。
这些科学家和其他 14 位科学家(包括氢弹的发明者、现代物理学中引入群论的人以及组合数学、数论、数值分析和概率论的基本贡献者)有一个显著的相似之处——他们都出生在布达佩斯的同一个地区。这导致人们质疑:如此多的智慧的来源是什么?
作为回应,西拉德开玩笑说:“火星人已经在这里了,他们自称为匈牙利人!”实际上……没人知道。
人类现在发现自己处于一个类似的位置,面对一组新的可能超级智能的思维:人工智能。人们知道模型可以非常聪明,但不知道它们是如何工作的。
我们的使命是回答这个问题——理解和利用现代超级智能。
您有着令人难以置信的记忆壮举的历史,您是如何沉浸在这些记忆挑战中的,如何将这些知识应用于 Martian 的概念?
在大多数运动中,专业运动员可以比普通人表现好 2-3 倍(将普通人踢球门的距离与专业运动员踢球门的距离进行比较,或者将普通人投掷快速球的速度与专业运动员投掷快速球的速度进行比较)。记忆运动很有趣,因为顶级运动员可以记住 100 倍或甚至 1000 倍的信息,而普通人只需要很少的训练。另外,这些人通常具有平均的自然记忆力,他们的表现归功于任何人都可以学习的特定技术。我想最大化人类的知识,我将世界记忆锦标赛视为一个被低估的洞察力,了解如何推动非凡的回报以增加人类的智慧。
我想在整个教育系统中部署记忆技术,所以我开始探索 NLP 和 LLM 如何帮助减少设置成本,这些成本阻止了大多数有效的教育方法被应用于主流教育系统。Yash 和我创建了第一个 LLM 驱动的认知导师,这导致我们发现了 LLM 部署的问题,这些问题我们现在正在解决。
Martian 本质上是抽象出决定使用哪个大型语言模型(LLM)的决定,为什么这对开发人员来说目前是一个痛点?
创建语言模型变得越来越容易——计算成本正在降低,算法变得更加高效,更多的开源工具可用于创建这些模型。因此,更多的公司和开发人员正在创建在自定义数据上训练的自定义模型。由于这些模型具有不同的成本和能力,使用多个模型可以获得更好的性能,但测试所有模型并找到合适的模型使用起来很困难。我们为开发人员解决了这个问题。
您能讨论一下系统如何理解哪个 LLM 最适合每个特定任务?
良好的路由本质上是一个关于理解模型的问题。为了有效地路由模型,您需要能够理解是什么导致它们失败或成功。使用模型映射来理解这些特征,使我们能够确定任何给定模型在请求上将如何执行,而无需运行该模型。因此,我们可以将该请求发送到将产生最佳结果的模型。
您能讨论一下优化使用哪个 LLM 可以带来的成本节约类型吗?
我们允许用户指定他们如何在成本和性能之间进行权衡。如果您只关心性能,我们可以在 openai/evals 上超越 GPT-4。如果您正在寻找一种特定的成本来使您的单元经济工作,我们可以让您指定请求的最大成本,然后找到完成该请求的最佳模型。如果您想要更动态的东西,我们可以让您指定您愿意为更好的答案支付多少钱——这样,如果两个模型具有相似的性能但成本差异很大,我们可以让您使用更便宜的模型。我们的某些客户已经看到成本降低了多达 12 倍。
您对 Martian 的未来有什么设想?
每次我们提高对模型的基本理解时,都会导致 AI 的范式转变。微调是由输出理解驱动的范式。提示是由输入理解驱动的范式。我们对模型的理解的这种单一差异是传统 ML(“让我们训练一个回归器”)和现代生成 AI(“让我们提示一个婴儿 AGI”)之间的区别的很大一部分。
我们的目标是不断在可解释性方面取得突破,直到 AI 被完全理解,我们对智能有一个像我们对逻辑或微积分的理论一样坚实的理论。
对我们来说,这意味着建设。这意味着创建很棒的 AI 工具并将其交到人们手中。这意味着发布以前从未有人做过的事情、有趣且有用的东西。
用弗朗西斯·培根的话来说,“知识就是力量”。因此,确保我们理解 AI 的最好方法是发布强大的工具。我们认为模型路由器就是这样一种工具。我们很高兴构建它、发展它并将其交到人们手中。
这只是我们未来几个月将要发布的众多工具中的第一个。为了发现人工智能的美丽理论,为了使完全新的 AI 基础设施成为可能,为了帮助建设人类和机器的更美好的未来——我们迫不及待地想与您分享这些工具。
感谢这次精彩的采访,希望了解更多的读者可以访问 Martian。












