访谈
拉达·巴苏,iMerit的CEO和创始人 – 采访系列

拉达·巴苏,iMerit的创始人和CEO,在HP公司度过了她的职业生涯,花了20年时间在这家科技巨头公司工作,并最终领导了其企业解决方案集团。她后来带领Support.com成为上市公司。拉达于2007年与迪帕克·巴苏一起创立了Anudip基金会,并于2012年创立了iMerit。她被认为是领先的科技企业家和导师,也是软件业务的先驱。
iMerit 通过结合自动化、专家人工注释和高级分析,提供多模式AI数据解决方案,以支持大规模高质量数据标注和模型微调。
您有着非凡的经历——从建立HP在印度的业务到创立iMerit,旨在提升不发达地区青年在不丹、印度和新奥尔良的生活水平。是什么启发您创立iMerit,您在从零开始打造一个包容性和全球性的劳动力时面临了哪些挑战?
在创立iMerit之前,我曾是SupportSoft的董事长和CEO,我带领公司完成了首次和二次公开募股,建立了公司作为支持自动化软件的全球领导者。那段经历让我看到将人和技术结合的力量。
虽然印度的科技繁荣创造了新的机会,但我注意到许多有才华的年轻人在欠发达地区被落在了后面。我相信他们的潜力和学习的动力。一旦他们看到软件如何赋予先进技术如AI的力量,他们就热切地接受了这些职业。
我们以一个小型、多元化的团队启动了iMerit,其中一半是女性,并且自此迅速发展。我们的团队的适应性和教练能力在数据驱动的AI需求增加时至关重要,尤其是对熟练的专家的长期需求。
如今,iMerit是自动驾驶汽车、医疗AI和技术等关键领域的AI数据解决方案的全球提供商。我们的工作确保客户的AI模型建立在高质量、可靠的数据之上,这在高风险环境中至关重要。
最终,我们的优势在于坚实的技术基础和一支受过良好训练、积极进取的员工队伍,他们在一个支持和学习驱动的文化中茁壮成长。这种方法推动了我们的增长,让我们保持了盈利,并获得了高NPS评分和忠实的客户。
iMerit现在与超过200个客户合作,包括eBay和强生等科技巨头。您能带我们了解公司的成长之路——从早期到成为AI数据服务的全球领导者吗?
我们有机会近距离观察客户的AI之旅,从早期实验到大规模生产。我们的工作涵盖了初创公司、全球自动驾驶汽车领导者和大型企业。通过从头开始训练他们的模型,我们对如何在现实世界中扩展AI有了无与伦比的见解。
该领域正在迅速和不断地发展。我很少看到技术在如此短的时间内取得如此戏剧性的进步。我们从数据注释提供商转变为全栈AI数据公司,提供整个人工在环(HITL)生命周期中的专业解决方案:注释、验证、审计和红队。处理边缘情况和异常对于现实世界的部署至关重要,需要在每个步骤中具备深厚的专业知识和细致的判断力。
我们的最大垂直领域是自动驾驶,我们管理整个感知堆栈,包括15个传感器的传感器融合,用于乘用车、配送车、卡车和农业车辆。在医疗保健领域,我们推动临床成像AI。在高科技领域,我们处于GenAI调优和验证的前沿,需要在工作流和人才方面具有更大的复杂性。
在这些领域成功并不仅仅是拥有专家——而是关于培养专家:挑战、指导和上下文化AI模型的认知能力。这就是我们的团队与众不同的地方。
我们的增长是由长期合作伙伴关系驱动的,我们最大的十个客户中有超过五年与我们合作的。随着他们的需求变得更加复杂,我们不断提高我们的领域知识、工具、培训和解决方案。我们的技术栈和人员必须不断演进。
软件、自动化、注释和分析的融合,创造了非常灵活、快速、精确的人工在环干预的框架。70%的新标志都在我们的技术栈上,这需要巨大的内部转变。同样,我们的文化确保团队渴望学习和不断成长。
iMerit的历史上最关键的时刻是什么——无论是技术里程碑还是战略决策——它们如何帮助塑造公司的轨迹?
在AI数据工作被视为人群外包工作时,我们早早地押注了这一领域将会发展成为一项职业,并且需要复杂性和企业关注。通过建立专门从事高级用例的内部团队,我们使客户能够快速扩展,导致我们在自动驾驶汽车领域达成了首个100万美元的月度收入,这验证了我们的方法。
COVID-19封锁考验了我们的敏捷性:我们几乎在一夜之间从完全办公室转变为完全远程,投资了大量的基础设施、安全性和文化。几周内,客户运营恢复了,我们在那一年增长了收入和员工人数。如今,70%的团队回到现场,我们继续利用远程人才,推出了学者计划,我们的全球主题专家网络,用于GenAI调优和验证。无论是心脏病专家还是西班牙数学家,我们的高接触文化吸引和激励顶尖人才,直接提高了我们的解决方案的质量和一致性。
2023年,我们收购了Ango.ai,一家AI驱动的数据标注和工作流自动化平台,以推动下一代AI数据工具。这一关键举动将iMerit的领域专业知识与Ango的高级工具相结合,扩大了我们在放射学、传感器融合和GenAI微调方面的能力。我们仍然与客户工具合作,但许多新客户现在直接在Ango Hub上注册,受到其用户友好工作流和强大的安全性的吸引,这是我们行业的基本要求。
企业不断告诉我们,他们正在寻找最好的两全其美的解决方案:专家人工洞察力,以确保质量,结合一个安全、可扩展的平台,提供自动化和分析。与Ango合并正好满足了这一要求,独特地将我们定位为满足当今最雄心勃勃的AI项目的复杂需求,并带来信心的扩展。
iMerit深入参与高级领域,如自动驾驶汽车、医疗AI和GenAI。在这些领域,您面临哪些独特的数据挑战,您如何解决它们?
与AI项目相关的任务通常占用了大约80%的时间,使其成为管道中的一个关键组成部分。AI数据相关的部分如果处理不当,可能会耗时且昂贵。
数据质量,尤其是避免严重错误,在我们运营的任务关键领域至关重要。不论是感知算法还是肿瘤检测器,干净的数据对于训练至验证循环都是必不可少的。
异常处理具有不成比例的价值。人类对为什么某事物不正常或为什么场景破坏了模型的洞察力,在使模型更加完整和强大的方面创造了巨大的价值。
此外,背景窗口正在变得越来越大。我们正在总结整个医生-患者咨询的临床笔记,并根据不仅仅是图像,还有患者的医疗背景分析MRI中的异常。主题专家必须建立评估数据的准则,以确保准确性和质量。
安全性、隐私性和保密性是热点话题。我们的首席安全官必须防止未经授权的访问、删除和存储数据。信息安全协议,如SOC2、HIPAA和TISAX,对我们来说是主要的投资领域。
最后,我们的工程师和解决方案架构师不断地致力于定制集成和报告,以确保客户的独特需求在最后一英里得到体现。万能的方法在AI中行不通。
您曾谈到将机器人技术和人类智能结合作为AI的更安全的途径。您能详细说明这种工作流程在实践中的样子,以及为什么您认为它比试图消除AI的创造性偏差更好吗?
AI提供了规模,这意味着公司正在开发工具来自动化传统上由人类执行的冗长过程。但人类提供了最后一英里的灵活性、确定性和恢复力。随着软件交付服务在AI中继续繁荣,结合机器人技术和人工在环(HITL)实践的公司将会非常成功。
我们将HITL视为AI开发和部署生命周期的每个阶段的一致层,以及信任和安全的支柱。因此,人类智能将在模型失败时进行课程更正至关重要。这些关键应用需要人类思维来确定需要进行的更改。这就是HITL服务将变得更加重要的地方,因为我们将AI集成到生产和现场操作中。
您的Ango Hub平台将自动化与人工在环专业知识相结合。这种混合模型如何提高生产AI系统中的数据质量和模型性能?
AI和自动化提供了规模和速度,而人类提供了细微差别、洞察力和监督。HITL确保在AI生命周期的关键时刻都有人类参与——确保高质量的输入、验证输出、识别边缘情况、为域微调模型并提供上下文判断。人类通过审查和验证输出、捕捉幻觉或逻辑错误来确保准确性,防止对系统造成伤害。他们还在伦理敏感或高风险的背景下提供监督,在这些背景下,LLM不应做出最终决定。更重要的是,人类反馈推动了持续的学习,帮助AI系统更好地与用户的目标保持一致。
HITL有多种形式。人类专家从事有针对性的注释,应用复杂的推理来处理边缘情况,并使用结构化QA界面审查AI生成的内容。与其评估每个决定,通常会实施上下文升级系统。这些系统仅将低置信度输出或标记的异常路由到人类审查员,平衡监督和效率之间的关系。
HITL的另一个关键用途是通过人类反馈的强化学习(RLHF)来微调AI代理。人类审查员对代理的响应进行排名、重写或提供反馈,这在医疗保健、法律服务或客户支持等敏感领域尤其重要。在此同时,基于场景的测试和红队测试允许人类评估员在部署前测试代理的对抗性或不寻常的条件,以识别和修复漏洞。
只有当人类保持在循环中,引导、验证和改进每一步时,AI的全部潜力才能得到发挥。无论是完善代理输出、训练评估循环还是策划可靠的数据管道,人类的监督都为AI添加了结构和问责制,使其值得信任和有效。
随着生成式AI工具的快速演进,iMerit如何在评估、RLHF和微调服务方面保持领先地位?
我们最近推出了Ango Hub Deep Reasoning Lab(DRL),这是一个用于生成式AI调优和与AI教师交互式开发链式思维推理的统一平台。我们的DRL使得实时、逐步的过程和基于人类偏好的评估成为可能,导致模型对复杂问题的响应更加连贯和准确。
GenAI模型和应用开发的进步凸显了干净、专家创建、验证数据的价值。使用Ango Hub DRL,专家可以测试模型、识别弱点并使用链式思维推理生成干净的数据。他们可以实时与模型交互,并一步一步地将提示和更正发送回去,所有这些都在一个界面中完成。
利用iMerit学者,Ango Hub DRL改进了模型的推理过程。它利用了iMerit在HITL工作流方面的丰富经验。专家为复杂任务设计多步骤的场景,例如为高级数学问题创建链式思维提示。iMerit学者审查输出、纠正错误,并捕获交互,所有这些都在一个界面中无缝完成。魔力不在于不加区别地招募大量人员,而在于最好的数学家不一定是最好的老师。也不应把心脏病专家当作零工工人对待。主题专家的匹配和培训,以最大限度地造福模型训练过程,并且参与度的提高,才是真正的差异所在。
“专家在循环中”在生成式AI的微调中意味着什么?您能分享一些人类专家显著改进模型输出的例子吗?
专家在循环中将人类智能与机器人智能结合起来,推进AI进入生产。它涉及人类专家,他们验证、改进和增强自动系统的输出。
具体来说,专家主导的数据注释确保训练数据准确地标记有领域特定知识,从而提高预测AI模型的精度和可靠性。通过减少偏差和误分类,专家驱动的注释提高了模型在现实世界场景中的泛化能力。这导致AI系统更加值得信任、可解释和符合行业特定需求。
例如,在收购了一大批医疗数据后,一家美国跨国科技公司需要评估这些数据,以便在其面向消费者的医疗聊天机器人中提供安全、准确的医疗建议。他们转向iMerit,利用我们在美国的广泛医疗专家网络,组建了一支由护士组成的团队,采用共识工作流程,并由一位美国委员会认证的医生提供仲裁。护士首先评估知识库,包括定义,以评估准确性和风险。
通过边缘情况讨论和指南修订,护士能够在99%的案例中达成共识。这使得团队能够将项目设计修订为单一投票结构,并进行10%的审计,从而将项目成本降低了72%以上。与iMerit合作使这家公司能够不断找到扩大医疗数据注释的方法,以确保其在道德和效率方面的可扩展性。
拥有超过8000名全职专家,您如何在规模上保持质量、性能和员工发展?
质量的定义始终根据每个客户的特定用例进行量身定制。我们的团队与客户密切合作,定义和校准质量标准,采用自定义流程,以确保每个注释都被主题专家快速验证。一致性对于开发高质量的AI至关重要。这得到了我们高员工留存率(90%)和对生产分析的强烈关注的支持,这是Ango Hub设计的关键不同iator,也得到了我们团队每日用户输入的支持。
我们不断投资自动化、优化和知识管理,这些都建立在我们的专有iMerit One培训平台之上。这种对学习和发展的承诺不仅推动了运营卓越,还支持了我们的员工的长期职业发展,培养了一个专家和成长的文化。
您会给那些想要在科技和社会影响力方面建立有意义事物的AI企业家什么建议?
AI正在以惊人的速度发展。超越技术栈,倾听客户,以了解对他们的业务来说什么是重要的。了解他们对速度、变化和风险的胃纳。早期客户可以尝试新事物。大客户需要知道您会一直陪伴他们,并且会继续优先考虑他们。通过您的主动方法来安抚他们,强调透明度、安全性和责任感。
此外,仔细选择您的投资者和董事会成员,以确保共享的价值观和关切一致。在iMerit,我们在挑战时期,如COVID-19,得到了董事会和投资者的显著支持,我们将其归功于这种一致性。
为企业家在科技行业成功做出的贡献超出了冒险;它涉及建立一个盈利的、包容的公司。
感谢这次精彩的采访,希望了解更多的读者可以访问iMerit。












