人工智能
揭开 Manus AI 之谜:中国在完全自主 AI 代理方面的突破
就在 DeepSeek 的尘埃开始落定之时,另一项来自中国初创公司的突破性成就又引发了互联网的热议。这一次,不是生成式 AI 模型,而是一款完全自主的 AI 代理—— Manus ,由中国公司 Monica 于 2025 年 3 月 6 日推出。与仅响应提示的生成式 AI 模型如 ChatGPT 和 DeepSeek 不同,Manus 被设计为独立工作,做出决定,执行任务,并在最少的人类干预下产生结果。这一发展标志着 AI 开发的范式转变,从反应式模型转向完全自主的代理。这篇文章探讨了 Manus AI 的架构、其优缺点以及其对未来自主 AI 系统的潜在影响。
探索 Manus AI:混合式自主代理
“Manus” 这个名字来源于拉丁短语 Mens et Manus ,意为心灵和手。这个命名完美地描述了 Manus 的双重能力:思考(处理复杂信息和做出决定)和行动(执行任务和生成结果)。对于思考,Manus 依赖于大型语言模型(LLM),而对于行动,它将 LLM 与传统自动化工具集成在一起。
Manus遵循 神经符号式 AI 方法来执行任务。在这种方法中,它采用 LLM(包括 Anthropic 的 Claude 3.5 Sonnet 和 阿里巴巴的 Qwen )来解释自然语言提示并生成可执行计划。LLM 得到确定性脚本的增强,以进行数据处理和系统操作。例如,当 LLM 可能会草拟 Python 代码来分析数据集时,Manus 的后端会在受控环境中执行代码,验证输出并在出现错误时调整参数。这种混合模型 平衡 了生成式 AI 的创造力和编程工作流的可靠性,使其能够执行复杂任务,如部署 Web 应用程序或自动化跨平台交互。
在其核心,Manus AI 通过模仿人类决策过程的结构化代理循环来运作。当给定任务时,它首先分析请求以确定目标和约束。接下来,它从工具箱中选择工具(例如 Web 抓取器、数据处理器或代码解释器),并在安全的 Linux 沙盒环境 中执行命令。这个 沙盒 允许 Manus 安装软件、操纵文件并与 Web 应用程序交互,同时防止未经授权访问外部系统。在每个操作之后,AI 评估结果,迭代其方法,并完善结果,直到任务满足预定义的成功标准。
代理架构和环境
Manus 的一个关键特性是其多代理架构。这种架构主要依赖于一个中央 “执行器” 代理,负责管理各种专用子代理。这些子代理能够处理特定任务,例如 Web 浏览、数据分析,甚至编码,这使得 Manus 能够在不需要额外的人类干预的情况下处理多步骤问题。另外,Manus 在基于云的异步环境中运行。用户可以将任务分配给 Manus,然后断开连接,知道代理将在后台继续工作,一旦完成就会发送结果。
性能和基准测试
Manus AI 已经在行业标准性能测试中取得了显著的成功。它在 GAIA 基准测试 中展示了最先进的结果,该测试由 Meta AI、Hugging Face 和 AutoGPT 创建,以评估代理式 AI 系统的性能。这个基准测试评估 AI 的逻辑推理能力、多模态数据处理能力以及使用外部工具执行实际任务的能力。Manus AI 在此测试中的性能使其领先于 OpenAI 的 GPT-4 和 Google 的模型,确立了它作为当今最先进的通用 AI 代理之一的地位。
用例
为了展示 Manus AI 的实际能力,开发人员 展示了一系列令人印象深刻的用例。在一个这样的用例中,Manus AI 被要求处理招聘流程。当给定一组简历时,Manus 不仅仅按关键词或资格对它们进行排序。它更进一步地分析每个简历,交叉引用技能与职位市场趋势,并最终向用户呈现详细的招聘报告和优化的决定。Manus 完成了这一任务,而无需额外的人类输入或监督。这表明它能够自主处理复杂的工作流程。
同样,当被要求生成个性化旅行行程时,Manus 不仅考虑了用户的偏好,还考虑了外部因素,如天气模式、当地犯罪统计和租赁趋势。这超出了简单的数据检索,反映了对用户未明确需求的更深入理解,展示了 Manus 的独立、上下文感知任务处理能力。
在另一个演示中,Manus 被要求撰写一位科技作家的传记并创建个人网站。几分钟内,Manus 从社交媒体数据中抓取信息,撰写了一份全面传记,设计了网站,并将其部署到线上。它甚至在网站上自动修复了托管问题。
在金融领域,Manus 被要求对过去三年内 NVDA(NVIDIA)、MRVL(Marvell Technology)和 TSM(台湾半导体制造公司)的股票价格进行相关性分析。Manus 首先从 YahooFinance API 收集相关数据。然后,它自动编写了必要的代码来分析和可视化股票价格数据。之后,Manus 创建了一个网站来显示分析和可视化,并生成了一个可分享的链接以便于访问。
挑战和伦理考虑
尽管 Manus AI 有着显著的用例,但它也面临着几个技术和伦理挑战。早期采用者报告了系统进入 “循环” 的问题,在那里它反复执行无效操作,需要人类干预来重置任务。这些故障突出了开发能够一致地导航非结构化环境的 AI 的挑战。
此外,虽然 Manus 在安全目的上运行在隔离的沙盒中,但其 Web 自动化功能引发了对潜在滥用的担忧,例如抓取受保护的数据或操纵在线平台。
透明度是另一个关键问题。Manus 的开发者强调了成功的故事,但对其能力的独立验证是有限的。例如,虽然其展示仪表板生成的演示运行顺畅,但用户在将 AI 应用于新或复杂场景时观察到了不一致性。这缺乏透明度使得建立信任变得困难,尤其是当企业考虑将敏感任务委托给自主系统时。此外,缺乏明确的指标来评估 AI 代理的 “自主性” 留下了怀疑的空间,关于 Manus 是否代表真正的进步或仅仅是精明的营销手段。
结论
Manus AI 代表着人工智能的下一个前沿:能够独立执行跨多个行业任务的自主代理,无需人类监督。其出现标志着一个新时代的开始,在这个时代,AI 不仅仅是协助工具,而是一个能够从头到尾处理复杂工作流程的完全集成系统。
虽然 Manus AI 的开发仍处于早期阶段,但其潜在的影响是明确的。随着像 Manus 这样的 AI 系统变得更加复杂,它们可能会重新定义行业,重塑劳动力市场,甚至挑战我们对工作的理解。AI 的未来不再局限于被动的助手——它是关于创建能够独立思考、行动和学习的系统。Manus 只是开始。












