面试
iMerit 首席执行官兼创始人 Radha Basu – 访谈系列

拉达·巴苏iMerit 创始人兼首席执行官拉达·拉达的职业生涯始于惠普,在这家科技巨头工作了 20 年,最终领导了惠普的企业解决方案部门。之后,她担任 Support.com 的首席执行官,带领其上市。拉达于 2007 年与迪帕克·巴苏 (Dipak Basu) 共同创立了 Anudip 基金会,并于 2012 年创立了 iMerit。她被认为是一位杰出的科技企业家和导师,也是软件行业的先驱。
优点 通过结合自动化、专家人工注释和高级分析来提供多模式 AI 数据解决方案,以支持大规模高质量数据标记和模型微调。
您经历了一段非凡的旅程——从建立惠普在印度的业务,到创立 iMerit,致力于帮助不丹、印度和新奥尔良的边缘青年。是什么促使您创立 iMerit?在从零开始打造一支包容的全球劳动力队伍的过程中,您面临哪些挑战?
在创立 iMerit 之前,我曾担任 SupportSoft 的董事长兼首席执行官,带领公司完成了首次公开募股 (IPO) 和二次公开募股 (IPO),使其成为支持自动化软件领域的全球领导者。这段经历让我从第一天起就感受到了人才与技术相结合的力量。
虽然印度的科技繁荣创造了新的机遇,但我注意到,许多在服务欠缺地区才华横溢的年轻人却被抛在了后面。我相信他们的潜力和学习的动力。当他们看到软件如何为人工智能等先进技术赋能时,他们便热切地拥抱了这些职业。
我们成立 iMerit 时,团队规模虽小,但多元化,其中一半成员是女性。自成立以来,团队发展迅速。我们团队的适应能力和可指导性至关重要,尤其是在以数据为中心的人工智能技术日益增长,对专业技能人才的长期需求日益增长的当下。
如今,iMerit 是一家全球领先的 AI 数据解决方案提供商,服务于自动驾驶汽车、医疗 AI 和科技等关键任务领域。我们的工作确保客户的 AI 模型建立在高质量、可靠的数据之上,这在高风险环境中至关重要。
归根结底,我们的优势在于强大的技术基础和一支训练有素、积极进取的员工队伍,他们在互助互助、学习驱动的文化氛围中蓬勃发展。这种模式推动了我们的增长,保持了现金流正增长,并为我们赢得了高净推荐值 (NPS) 评分和忠实客户。
iMerit 目前与 200 多家客户合作,其中包括 eBay 和强生等科技巨头。您能否向我们介绍一下公司的成长历程——从早期发展到如今成为 AI 数据服务的全球领导者?
我们始终站在客户的前列,见证客户的 AI 之旅,从早期实验到大规模生产,我们始终与他们携手合作。我们的合作伙伴涵盖初创公司、全球自动驾驶汽车领导者以及大型企业。通过从零开始训练他们的模型,我们获得了无与伦比的洞察力,深刻理解在现实世界中真正实现 AI 规模化所需的条件。
这个领域持续快速发展。我很少看到一项技术在如此短的时间内取得如此显著的进步。我们已经从一家数据标注提供商转型为一家全栈 AI 数据公司,提供涵盖整个“人在环”(HITL)生命周期的专业解决方案:标注、验证、审计和红队测试。处理边缘情况和异常对于实际部署至关重要,需要在每个环节都具备深厚的专业知识和细致的判断力。
我们最大的垂直领域是自动驾驶,我们管理着完整的感知堆栈,包括覆盖乘用车、送货车、卡车和农用车的15个传感器的传感器融合。在医疗保健领域,我们推动临床影像AI的发展。在高科技领域,我们处于GenAI调优和验证的前沿,这要求我们的工作流程和人才更加精进。
在这些领域取得成功,不仅仅在于拥有专家,更在于培养专业知识:挑战、指导和理解 AI 模型的认知能力。这正是我们团队的与众不同之处。
我们的发展得益于长期的合作伙伴关系,我们十大客户中的大多数都与我们合作了五年以上。随着他们的需求日益复杂,我们不断提升领域知识、工具、培训和解决方案。我们的技术栈和员工都必须不断发展。
软件、自动化、注释和分析的融合,为高度灵活、快速、高精度、人机交互的干预创造了条件。70% 的新标识都基于我们自己的技术栈,这需要进行巨大的内部转型。同样,我们的文化确保了团队渴望学习并不断成长。
iMerit 历史上最关键的时刻是什么——无论是技术里程碑还是战略决策——帮助塑造了公司的发展轨迹?
在人工智能数据工作被视为基于众包的零工的时代,我们很早就押注它会发展成为一种职业,需要复杂性和企业关注度。通过组建专注于高级用例的内部团队,我们帮助客户快速扩张,最终在自动驾驶汽车领域达成了首笔1万美元的月经常性收入(MRR)交易,这一里程碑验证了我们的方法。
新冠疫情封锁考验了我们的敏捷性:我们几乎一夜之间就从完全在办公室办公过渡到完全远程办公,并在基础设施、安全和文化方面投入了大量资金。几周之内,客户业务就反弹了,当年我们的收入和员工人数都实现了增长。如今,我们19%的团队成员已返回办公室,我们继续利用远程人才,推出了“学者”(Scholars)——一个由GenAI调优和验证的全球主题专家组成的网络。无论是心脏病专家还是西班牙数学家,我们高接触度的文化都能吸引和激励顶尖人才,直接提升我们解决方案的质量和一致性。
2023年,我们收购了Ango.ai,一个基于AI的数据标记和工作流自动化平台,以推动下一代AI数据工具的发展。这一关键举措将iMerit的领域专业知识与Ango的先进工具相结合,扩展了我们在放射学、传感器融合和GenAI微调方面的能力。我们仍然与客户工具合作,但现在许多新客户直接选择使用Ango Hub,因为他们被其用户友好的工作流程和强大的安全性所吸引,而这些正是我们行业的基本要求。
企业不断告诉我们,他们寻求的是两全其美的解决方案:既需要专业的人力洞察来确保质量,又需要安全、可扩展的平台来提供自动化和分析功能。与 Ango 的强强联手正是我们所需要的,这让我们能够满足当今最雄心勃勃的 AI 项目的复杂需求,并自信地实现扩展。
iMerit 深度参与自动驾驶汽车、医疗 AI 和 GenAI 等先进领域。您在这些领域面临哪些独特的数据挑战?又是如何应对的?
数据相关任务通常占人工智能项目总时间的近80%,使其成为流程中的关键组成部分。如果处理不当且可扩展性不足,人工智能中以数据为中心的部分可能会耗时耗力,成本高昂。
数据质量,尤其是避免严重错误,对于我们运营的关键任务领域至关重要。无论是感知算法还是肿瘤检测器,干净的数据在训练到验证循环中都至关重要。
异常处理的价值远超乎寻常。人类能够洞察某些异常情况或场景为何会破坏模型,这在提升模型的完整性和稳健性方面创造了巨大的价值。
此外,上下文窗口也变得越来越大。我们正在总结整个医患问诊的临床记录,并不仅根据图像本身,还结合患者的医疗背景来分析核磁共振成像中的异常情况。学科专家必须制定评估标准,以准确分析数据并确保质量。
安全、隐私和保密性是热门话题。我们的首席安全官必须防范未经授权的数据访问、删除和存储。SOC2、HIPAA 和 TISAX 等信息安全协议一直是我们重点投资的领域。
最后,我们的工程师和解决方案架构师不断致力于定制集成和报告,以便在最后一公里内反映客户的独特需求。一刀切的方案在人工智能领域行不通。
您曾提到,将机器人技术与人类智能相结合是人工智能更安全的发展路径。您能否详细阐述一下这种工作流程在实践中的具体情况?以及为什么您认为这比试图消除人工智能的创造性分歧更好?
人工智能提供了规模化,这意味着企业正在开发工具来自动化传统上由人类执行的冗长流程。但人类提供了最后一公里的灵活性、确定性和弹性。随着软件交付服务在人工智能领域的持续增长,最成功的企业将有效地将机器人技术与人机协同实践 (HITL) 结合起来。
我们将 HITL 视为 AI 开发和部署生命周期每个阶段的一致层,也是信任和安全的支柱。因此,如果模型失败,人类智能对于纠正方向至关重要。这些关键应用需要人类思维来判断需要进行哪些更改。随着我们将 AI 融入生产和现场运营,HITL 服务将变得更加重要。
您的 Ango Hub 平台将自动化与人机交互技术完美融合。这种混合模式如何提升生产级 AI 系统中的数据质量和模型性能?
人工智能和自动化提供规模和速度,而人类则提供细微差别、洞察力和监督。HITL 确保人类在人工智能生命周期的关键节点参与其中——确保高质量的输入、验证输出、识别边缘案例、针对特定领域微调模型以及提供情境判断。人类通过审查和验证输出、在幻觉或逻辑错误造成危害之前发现它们,从而帮助确保准确性。他们还在伦理敏感或高风险的环境中提供监督,而法学硕士(LLM)不应在这些环境中做出最终决定。更重要的是,人类反馈能够促进持续学习,帮助人工智能系统随着时间的推移更加贴近用户目标。
HITL 有多种形式。人类专家进行有针对性的注释,对边缘案例进行复杂的推理,并使用结构化的 QA 界面审核 AI 生成的内容。通常情况下,它不会评估每个决策,而是会实施情境升级系统。这些系统只会将低置信度的输出或标记的异常发送给人工审核员,从而在监督和效率之间取得平衡。
HITL 的另一个关键用途是通过强化学习人类反馈 (RLHF) 对 AI 代理进行微调。人工审核人员会对代理的响应进行排名、重写或提供反馈,这在医疗保健、法律服务或客户支持等敏感领域尤为重要。同时,基于场景的测试和红队测试允许人工评估人员在对抗性或异常条件下测试代理,以便在部署前识别并修补漏洞。
只有当人类始终参与其中,引导、验证并改进每一步时,人工智能的潜力才能充分发挥。无论是优化代理输出、训练评估循环,还是管理可靠的数据管道,人类的监督都能增强人工智能所需的结构和责任,确保其可信度和有效性。
随着生成式人工智能工具的快速发展,iMerit 如何在提供评估、RLHF 和微调服务方面保持领先地位?
我们近期推出了 Ango Hub 深度推理实验室 (DRL),这是一个统一的平台,用于生成式 AI 调优以及与 AI 教师互动开发思维链推理。我们的 DRL 支持实时、循序渐进的流程和基于人类偏好的评估,从而能够为复杂问题提供更一致、更准确的模型响应。
GenAI 模型和应用程序开发的进步凸显了干净、专家创建且经过验证的数据的价值。借助 Ango Hub DRL,专家可以测试模型、识别弱点,并使用思维链推理生成干净的数据。他们可以实时与模型交互,并在单一界面中逐步反馈提示和修正。
利用 iMerit Scholars,Ango Hub DRL 改进了模型推理流程。它充分利用了 iMerit 在 HITL 工作流程方面的丰富经验。专家们为复杂任务设计多步骤场景,例如为高级数学问题创建思路链提示。iMerit Scholars 会审查输出、纠正错误并无缝捕捉交互。其魔力并不在于不加区分地招募大量人员。最好的数学家不一定是最好的老师。人们也不应该把心脏病专家当成零工。对学科专家的适应和指导,使其以最有利于模型训练过程的方式思考,以及参与度,才是关键所在。
在生成式人工智能微调的背景下,“专家在环”是什么意思?您能否分享一些人类专业知识如何显著提升模型输出的例子?
专家在环 (Expert-in-the-Loop) 将人类智能与机器人智能相结合,推动人工智能投入生产。它需要人类专家来验证、改进和增强自动化系统的输出。
具体来说,专家主导的数据标注可确保训练数据准确标注领域特定知识,从而提高预测性人工智能模型的精度和可靠性。通过减少偏差和错误分类,专家驱动的标注增强了模型在实际场景中有效泛化的能力。这使得人工智能系统更加可信、可解释,并更符合行业特定需求。
例如,一家美国跨国科技公司在获得大量医疗数据后,需要评估这些数据是否可用于其面向消费者的医疗聊天机器人,以确保为用户提供安全准确的医疗建议。他们向 iMerit 寻求帮助,利用我们广泛的美国医疗保健专家网络,组建了一支护士团队,采用由美国认证医师负责升级和仲裁的共识工作流程。护士首先评估包含定义的知识库,以评估准确性和风险。
通过边缘病例讨论和指南修订,护士们能够在99%的病例中达成共识。这使得团队能够将项目设计修改为单票制,并进行10%的审核,从而将项目成本降低了72%以上。与iMerit的合作使该公司能够不断探索以合乎道德且高效的方式扩展医疗数据注释的方法。
在全球拥有 8,000 多名全职专家的情况下,您如何大规模地保持质量、绩效和员工发展?
质量的定义始终根据每个客户的具体用例量身定制。我们的团队与客户紧密合作,定义和校准质量标准,采用定制流程,确保每个注释都能由主题专家快速验证。一致性对于高质量人工智能的开发至关重要。这得益于高员工保留率(90%)和对生产分析的高度重视,而生产分析是 Ango Hub 设计的一个关键差异化因素,其设计理念源于我们团队日常用户的反馈。
我们持续投资于自动化、优化和知识管理,并以我们专有的 iMerit One 培训平台为支撑。这种对学习和发展的投入不仅推动了卓越运营,也支持了员工的长期职业发展,从而营造了注重专业技能和不断成长的企业文化。
对于那些想要在技术和社会影响方面做出有意义贡献的人工智能企业家,您有什么建议?
人工智能发展速度令人眼花缭乱。超越技术栈,倾听客户的声音,了解他们的业务重点。了解他们对速度、变化和风险的偏好。早期客户可以尝试新事物。更大的客户需要知道,您会一直支持他们,并且会继续优先考虑他们。通过积极主动地确保透明度、安全性和问责制,让他们安心。
此外,要谨慎选择投资者和董事会成员,确保他们在价值观和关注点上保持一致。在iMerit,我们在新冠疫情等艰难时期得到了董事会和投资者的大力支持,这归功于我们之间的共识。
企业家在科技行业取得成功的关键品质不仅仅是敢于冒险,还包括建立一家盈利且包容的公司。
感谢您的精彩采访,想要了解更多信息的读者可以访问 优点.