Interviews
Olga Megorskaya,Toloka创始人兼首席执行官 – 专访系列

Olga Megorskaya 是 Toloka 的创始人兼首席执行官,自 2020 年起领导公司,将其从最初的人群标注业务发展成为人工智能数据服务领域的主要参与者。在创立并领导 Toloka 之前,她在 Yandex 工作了十多年,最终担任众包与平台部门负责人,为包括搜索、语音、自动驾驶、内容审核等在内的机器学习产品构建并扩展了众包数据标注基础设施。在她的领导下,Toloka 已将自己定位为全球性的人工智能数据合作伙伴——将机器学习技术与人类专业知识相结合,为大规模人工智能模型和智能体的训练、评估及安全性提供支持。
Toloka 是一家总部位于荷兰阿姆斯特丹的公司,为人工智能开发提供高质量、专业策划的数据,服务范围涵盖标注、贴标,到用于监督微调(SFT)和基于人类反馈的强化学习(RLHF)的定制数据集。公司支持多种模态——文本、图像、音频、视频——并联合领域专家与全球人群,为训练和评估先进的人工智能智能体及大语言模型提供可扩展的、精确的数据集。他们的服务有助于提升推理、多语言理解、图像/音频生成以及跨行业和应用的人工智能安全等能力。
您在 Yandex 多年构建人机回圈系统后,于 2020 年共同创立了 Toloka。是什么时刻让您确信这需要成为一家独立的公司?那段经历如何塑造了您对 Toloka 在人工智能发展中角色的愿景?
在某个时刻,我们意识到 Toloka 已经超越了其起源公司。来自世界各地的 AI 研究人员都在使用这个平台,我们认识到公司作为独立实体可以取得更多成就。因此,Toloka 得以依赖数百个 AI 团队为全系列 AI 解决方案(从网络搜索和语音助手到生成式 AI 聊天机器人和 AI 智能体)收集训练数据的累积经验。此后,我们将管理人类工作的专业经验与构建和训练 AI 智能体的能力相结合,创造了我们的新产品 Tendem。
您曾说过,未来的真正颠覆不会来自完全自主的智能体。是什么让您得出结论,认为结合人工智能自动化与人类判断的混合智能体才是最终会胜出的模式?
虽然我相信在许多领域,纯 AI 解决方案很快将达到令人惊叹的质量水平,足以完全满足客户需求,但总会存在一个长尾用例,是基础模型永远无法优化的。在可预见的未来,混合方法将在这些领域胜过纯 AI 和纯人工解决方案。过去十年中,我们反复看到同样的模式:AI 可以出色地扩展任务规模,但在细微差别、上下文以及在真实商业环境中至关重要的判断决策方面存在困难。专业人士需要速度,但也需要可靠性——而完全自主的智能体目前根本无法保证这一点。混合系统之所以胜出,是因为它们解决了问题的两个方面。AI 处理其最擅长的部分:速度、结构和可重复性。人类专业知识则填补空白:模糊性、边缘情况和解释。当你将两者原生地结合起来,就能得到一个既快速又可信赖的工作流程。这才是专业人士最终会依赖的模式。
您指出,人工智能在模糊性和多文档推理方面会失效。哪些类型的任务最能清晰地揭示这些局限性?
长周期任务——那些需要综合多个来源、调和冲突信息或解释上下文,并且需要人类花费数小时甚至数天才能完成的任务——往往会暴露 AI 当前的局限性。例子包括市场研究、竞争分析、总结长篇文档、根据混合输入起草原创内容,或者提取依赖于人类细微差别而非模式识别的见解。AI 非常擅长进行初步处理。但一旦任务需要优先级排序、判断或调和模糊性,其可靠性就会急剧下降。这正是人类专家不可或缺的地方。
许多专业人士使用人工智能,但仍不完全信任它。您的方法如何重建将实际工作委托给人工智能辅助系统的信心?
当人们不再需要修正 AI 的输出时,信任就会提升。我们的方法通过从一开始就将人类整合到工作流程中来重建信心,而不是作为 AI 失败时的升级途径。Tendem 中的每项任务都经过一个 AI 项目经理,由其决定哪些部分应自动化,哪些部分需要人类专业知识。之后,自动化检查和人工质量保证共同确保最终输出的准确性、完整性和业务就绪性。对专业人士而言,这意味着他们可以委托工作,并真正期待一个经过验证的结果,而不是一份需要他们自己修补的草稿。
通过哪些机制确保参与回路的专家保持高质量输出,同时又不拖慢工作流程?
两点使之成为可能:
- 规模化专业化。Tendem 网络中的专家都经过预先筛选、培训,并根据领域专长进行匹配。他们不是需要临时适应的普通自由职业者——他们已经具备处理特定类型任务的资格。
- 分层质量保证与智能路由。AI 处理常规步骤,因此人类专家只需专注于需要判断的部分。然后,根据需要还有第二层的自动化质量保证和人工验证。这确保了人类在其能创造最大价值的环节参与,而不是在可能造成瓶颈的地方。
结果是速度堪比自动化,准确性堪比专家评审。
在要求准确性和合规性的行业中,混合系统如何提供企业可以依赖的可验证性和可审计性?
混合系统天生就允许审计,因为工作流程中的每一步都被跟踪、归因和质量检查。你知道哪些部分是自动化的,哪些部分是由经过审查的专家执行的,以及哪些质量保证步骤验证了输出。在高度监管的行业,这个过程变得至关重要。你不再依赖于一个黑盒式的 AI 决策;你拥有一个可验证的判断、修正和批准链条。这正是混合系统适用于那些准确性和合规性不容有失的领域的原因。
您预计哪些类别的知识工作会最先转向混合智能体,哪些类别采用这种模式会最慢?
总的来说,我认为混合方法比纯 AI 方法更容易采用,因此我们预计几乎任何领域都可以用这种模式覆盖——区别仅在于 AI 与人类参与的比例。最早的采用者是那些速度和准确性都很重要,但工作仍然高度重复的角色。我们已经看到来自咨询、市场营销、销售运营、研究和内容创作领域的强劲需求。最复杂(可能也最有趣)的待解决领域是那些更接近物理世界的领域,例如建筑和施工。但我确实也看到了一条清晰的技术路径能将我们带到那里。
从运营角度来看,当组织从自由职业者管理的工作转向混合智能体时,会获得哪些好处?
混合智能体消除了自由职业者管理工作中的两大低效问题:管理开销和质量不一致。组织和专业人士不再需要招募、筛选、布置任务、管理或纠正自由职业者。混合智能体自动处理工作流程编排,为每个步骤分配恰当的 AI 与人类专业知识组合。这减少了周转时间,标准化了输出质量,并且无需增加人员编制即可扩展工作规模。简而言之:你获得了自动化的速度和专家团队的可靠性,但无需管理任何一方。
随着混合系统获得主流关注,您预计这种转变会对更广泛的自由职业和零工经济产生什么影响?
我们认为这将重塑自由职业经济,而不是取代它。自由职业者不再将时间花在低层次、重复性的任务上,而是可以作为特定领域的专家接入混合系统。工作将变得更加结构化:价值更高、更可预测、更稳定。专家们不必追逐不稳定的项目,而是可以通过像 Tendem 这样的平台大规模地贡献其技能,在那里他们的技能与合适的任务相匹配,并由 AI 系统支持,从而摆脱繁琐工作。
展望未来几年,一旦混合智能体在数字工作中成为标准,“将工作委托给 AI”会是什么样子?
委托将不再像是“使用一个工具”,而更像是将工作交给一个能干的团队。你将描述你想要的结果,混合智能体会将其分解、路由子任务、应用恰当的 AI 与人类专业知识组合、验证结果,并在几小时内交付成品。这种转变将从将 AI 用作起草助手,转变为信任 AI 作为监督整个工作流程的项目经理。那时,真正的委托才会发生:当专业人士可以信任系统交付最终成果,而不仅仅是一个起点。
感谢您接受这次精彩的采访,希望了解更多信息的读者请访问 Toloka。












