访谈

Toloka 的创始人兼 CEO 奥尔加·梅戈尔斯卡娅 – 采访系列

mm

奥尔加·梅戈尔斯卡娅,Toloka 的创始人兼 CEO,自 2020 年以来一直领导着公司,从最初的众包标注根源发展成为人工智能数据服务的主要参与者。在创立和领导 Toloka 之前,她在 Yandex 工作了十多年,最后担任众包和平台负责人,负责建设和扩展机器学习产品(包括搜索、语音、语音、自动驾驶、内容审核等)的众包数据标注基础设施。在她的领导下,Toloka 将自己定位为人工智能的全球数据合作伙伴,结合机器学习技术和人类专业知识,支持大规模人工智能模型和代理的训练、评估和安全。

Toloka 是一家总部位于阿姆斯特丹的荷兰公司,提供高质量、专业策划的数据用于人工智能开发,范围从标注和标签到自监督微调(SFT)和强化学习从人类反馈(RLHF)的自定义数据集。该公司支持广泛的模态——文本、图像、音频、视频,并与领域专家和全球众包共同合作,提供可扩展、准确的数据集用于训练和评估先进的人工智能代理和大型语言模型。他们的服务有助于改善诸如推理、多语言理解、图像/音频生成和人工智能安全等能力,跨行业和应用。

您在 Yandex 建立了多年的 human-in-the-loop 系统,然后在 2020 年联合创立了 Toloka。是什么时候让您意识到 Toloka 需要成为一家独立公司的,并且这种经历如何塑造了您对 Toloka 在人工智能开发中的角色的愿景?

在某个时候,我们意识到 Toloka 已经超出了其原始公司的范畴。来自世界各地的人工智能研究人员都在使用这个平台,我们认识到 Toloka 作为一个独立实体可以实现更多。因此,Toloka 能够依靠数百个人工智能团队的累积经验来收集训练数据,用于人工智能解决方案的整个范围——从网络搜索和语音助手到 GenAI 聊天机器人和人工智能代理。我们自那时起就将我们在管理人类努力方面的专业知识与建设和训练人工智能代理的能力相结合,创造了我们的新产品 Tendem。

您曾说真正的颠覆不会来自完全自治的代理。是什么让您得出这样的结论,即混合代理——将人工智能自动化与人类判断相结合——最终会获胜的模型?

虽然我相信在许多领域,仅依靠人工智能的解决方案很快就会达到令人惊叹的质量水平,以满足客户的需求,但总会有一些用例,基本模型永远无法优化。混合方法将在可预见的未来超越仅依靠人工智能或仅依靠人类的解决方案。我们过去十年反复看到同样的模式:人工智能可以美丽地扩展任务,但它在细微差别、背景和判断调用方面挣扎——这些在真正的商业环境中至关重要。专业人员想要速度,但他们也需要可靠性——完全自治的代理今天无法保证这一点。混合系统获胜,因为它们解决了等式的两边。人工智能处理它擅长的部分:速度、结构和可重复性。人类专业知识填补了空白:模糊性、边缘情况和解释。当您将两者原生地结合在一起时,您会得到一个既快速又值得信赖的工作流程。这就是专业人员最终会依赖的模型。

您指出人工智能在模糊性和多文档推理方面存在局限性。哪些任务最能揭示这些局限性?

需要长时间范围的任务——这些任务需要综合多个来源、协调相互冲突的信息或解释背景,并且需要人类数小时甚至数天才能完成——往往会暴露出当前人工智能的局限性。例如,市场研究、竞争分析、长篇文档摘要、从混合输入中创建原始内容或提取依赖于人类细微差别而非模式识别的见解。人工智能在产生第一稿方面非常出色。但是,一旦任务需要优先级、判断或协调模糊性,可靠性就会大幅下降。这就是人类专家至关重要的领域。

许多专业人士使用人工智能,但仍然不完全信任它。您的方法如何重建对将真正工作委托给人工智能辅助系统的信心?

当人们不再需要修复人工智能输出时,信任就会提高。我们的方法通过从一开始就将人类融入工作流程来重建信任,而不是将其作为人工智能失败时的升级路径。Tendem 中的每个任务都会流经一个人工智能项目经理,决定什么应该被自动化,什么需要人类专业知识。之后,自动化检查和人类质量保证确保最终输出是准确、完整和商业就绪的。对于专业人士来说,这意味着他们可以委托工作并实际期望一个经过验证的结果,而不是他们必须修复的草稿。

是什么机制确保工作流程中的人类专家能够保持高质量的输出而不减慢工作流程?

有两件事使得这一点成为可能:

  • 规模化专业化。Tendem 网络中的专家经过预筛选、培训,并根据领域专业知识进行匹配。他们不是试图即兴适应的普通自由职业者——他们已经具备了执行特定任务的资格。
  • 分层质量保证和智能路由。人工智能处理面包和黄油步骤,因此人类专家只需关注需要判断力的部分。然后,对于需要的人类验证,会有第二层自动化质量保证和智能路由。这使得人类专家能够专注于他们能够添加最多价值的领域,而不是制造瓶颈。

结果是速度与自动化媲美,而准确性则与专家审查媲美。

在需要准确性和合规性的行业中,混合系统如何提供可核实性和可审计性,以便企业可以依赖?

混合系统本质上允许审计,因为工作流程中的每个步骤都被跟踪、归属和质量检查。你知道哪些部分被自动化,哪些部分由经过审查的专家执行,哪些质量保证步骤验证了输出。在高度监管的行业中,这个过程至关重要。你不再依赖黑盒人工智能决策;你有一个可验证的判断链、更正和批准链。正是混合系统使其适合于准确性和合规性在商业中不可或缺的领域。

您预计哪些知识工作类别将首先转向混合代理,哪些类别将是最慢采用这种模型的?

总体而言,我认为混合方法比仅依赖人工智能的方法更容易采用,因此几乎任何领域都可以使用这种模型——不同之处在于人工智能和人类参与的比例。最早的采用者是那些速度和准确性都很重要,但工作仍然高度重复的角色。我们已经看到来自咨询、营销、销售运营、研究和内容创作的强烈需求。最复杂(也许也是最有趣)的领域是那些更接近物理世界的领域,例如建筑和施工。但是我也看到了一条清晰的技术道路来解决这些问题。

从运营角度来看,组织如何从自由职业者管理工作转向混合代理时受益?

混合代理消除了自由职业者管理工作中的两个最大低效率:管理开支和质量不一致。组织和专业人士不再需要招募、筛选、简报、管理或纠正自由职业者。混合代理自动处理工作流程编排,根据每个步骤自动分配正确的 AI 和人类专业知识组合。这减少了周转时间,标准化输出质量,并且在不增加人力的情况下扩展工作量。简而言之:您获得了自动化的速度和专家团队的可靠性,但无需管理任何一个。

混合系统获得主流认可时,预计这将如何影响更广泛的自由职业和零工经济?

我们认为这将重塑自由职业经济,而不是取代它。自由职业者将不再花时间从事低级、重复性的任务,而是可以作为特定领域的专家插入混合系统。工作变得更加结构化:具有更高的价值、更可预测、更稳定。专家不再追求不一致的项目,而是可以通过像 Tendem 这样的平台贡献他们的技能,这些平台将他们的技能与正确的任务相匹配,并支持 AI 系统以消除繁琐工作。

展望未来几年,混合代理成为数字工作的标准时,什么是“委托给 AI”的含义?

委托将感觉更像交给一支能干的团队,而不是使用工具。你将描述你想要的结果,混合代理将分解任务、路由子任务、应用正确的 AI 和人类专业知识混合、验证结果并在几小时内交付成品。这种转变将从使用 AI 作为起草助手到信任 AI 作为管理整个工作流程的项目经理。这就是真正的委托发生时:专业人士可以信任系统交付最终输出,而不仅仅是一个起点。

感谢这次精彩的采访,希望了解更多的读者可以访问 Toloka

安托万是一位具有远见的领导者和Unite.AI的创始合伙人,他被对塑造和推广AI和机器人人的未来充满不动摇的热情所驱动。作为一位连续创业者,他相信AI将对社会产生与电力一样的颠覆性影响,他经常被听到对颠覆性技术和AGI的潜力大加赞赏。

作为一位未来学家,他致力于探索这些创新将如何塑造我们的世界。另外,他也是Securities.io的创始人,这是一个专注于投资于重新定义未来和重塑整个行业的尖端技术的平台。