关注我们.

人工智能

揭秘 Manus AI:中国在全自动人工智能代理领域取得突破

mm

发布时间

 on

就在尘埃落定之时 DeepSeek,中国初创公司的又一项突破在互联网上引起轰动。这一次,它不是生成式人工智能模型,而是完全自主的人工智能代理, 马努斯,由中国公司莫妮卡于 6 年 2025 月 XNUMX 日推出。与 ChatGPT 和 DeepSeek 等仅响应提示的生成式 AI 模型不同,Manus 旨在独立工作,做出决策、执行任务并在极少的人工参与下产生结果。这一发展标志着 AI 开发的范式转变,从反应模型转向完全自主的代理。本文探讨了 Manus AI 的架构、优势和局限性,以及它对未来自主 AI 系统的潜在影响。

探索 Manus AI:自主代理的混合方法

“马努斯”这个名字源于拉丁语 男人与男人 意思是“心智”和“手”。这个命名法完美地描述了 Manus 的双重能力:思考(处理复杂信息并做出决策)和行动(执行任务并产生结果)。在思考方面,Manus 依赖于大型语言模型 (LLM),而在行动方面,它将 LLM 与传统自动化工具相结合。

马努斯遵循 神经符号方法 用于执行任务。在这种方法中,它采用了 LLM,包括 Anthropic 的《克劳德 3.5 十四行诗》阿里巴巴的 Qwen,解释自然语言提示并生成可操作的计划。LLM 还增加了用于数据处理和系统操作的确定性脚本。例如,虽然 LLM 可能会起草 Python 代码来分析数据集,但 Manus 的后端会在受控环境中执行代码、验证输出并在出现错误时调整参数。这种混合模型 结余 生成式人工智能的创造力与程序化工作流程的可靠性相结合,使其能够执行复杂的任务,例如部署 Web 应用程序或自动化跨平台交互。

Manus AI 的核心是通过模仿人类决策过程的结构化代理循环来运作的。当被赋予任务时,它首先分析请求以确定目标和约束。接下来,它从工具包中选择工具(例如网络抓取工具、数据处理器或代码解释器),并在安全的环境中执行命令 Linux 沙盒环境。 这个 沙箱 允许 Manus 安装软件、操作文件和与 Web 应用程序交互,同时防止未经授权访问外部系统。每次操作后,AI 都会评估结果、迭代其方法并优化结果,直到任务满足预定义的成功标准。

代理架构和环境

Manus 的一个关键特性是其多代理架构。该架构主要依赖于一个中央“执行器”代理,该代理负责管理各种专门的子代理。这些子代理能够处理特定任务,例如网页浏览、数据分析甚至编码,这使得 Manus 无需额外的人工干预即可处理多步骤问题。此外,Manus 在基于云的异步环境中运行。用户可以将任务分配给 Manus,然后脱离,因为知道代理将继续在后台工作,并在完成后发送结果。

性能和基准测试

Manus AI 已经在行业标准性能测试中取得了重大成功。它在以下领域展示了最先进的结果: GAIA 基准,由 Meta AI、Hugging Face 和 自动GPT 评估代理 AI 系统的性能。该基准测试评估 AI 的逻辑推理能力、处理多模态数据的能力以及使用外部工具执行真实世界任务的能力。Manus AI 在这项测试中的表现使其领先于其他知名公司,例如 OpenAI的GPT-4 以及谷歌的模型,使其成为当今最先进的通用人工智能代理之一。

使用案例

为了展示 Manus AI 的实际能力,开发人员 展出 在发布期间,Manus AI 就展现了一系列令人印象深刻的用例。在其中一个案例中,Manus AI 被要求处理招聘流程。当收到一份简历时,Manus 不仅仅按关键字或资格对其进行排序。它进一步分析每份简历,将技能与就业市场趋势进行交叉引用,最终向用户提供详细的招聘报告和优化决策。Manus 无需额外的人工输入或监督即可完成此任务。这个案例展示了它自主处理复杂工作流程的能力。

同样,当被要求制定个性化旅行行程时,Manus 不仅考虑用户的偏好,还考虑天气模式、当地犯罪统计数据和租赁趋势等外部因素。这超出了简单的数据检索,反映了对用户未说明需求的更深入理解,表明 Manus 能够独立执行情境感知任务。

在另一个演示中,Manus 的任务是为一名科技作家撰写传记并创建个人网站。几分钟之内,Manus 就抓取了社交媒体数据,撰写了全面的传记,设计了网站并上线。它甚至自主修复了托管问题。

在金融领域,Manus 的任务是对过去三年的 NVDA(NVIDIA)、MRVL(Marvell Technology)和 TSM(台湾半导体制造公司)股价进行相关性分析。Manus 首先从以下来源收集相关数据: 雅虎财经API。然后,它自动编写了必要的代码来分析和可视化股票价格数据。之后,Manus 创建了一个网站来展示分析和可视化,并生成了一个可共享的链接,方便访问。

挑战和伦理考虑

尽管 Manus AI 的用例非常广泛,但它也面临着一些技术和道德挑战。早期采用者已经 报道 系统会进入“循环”,反复执行无效操作,需要人工干预来重置任务。这些故障凸显了开发能够持续驾驭非结构化环境的人工智能的挑战。

此外,虽然 Manus 出于安全目的在隔离沙箱内运行,但其 Web 自动化功能引发了对潜在滥用的担忧,例如抓取受保护的数据或操纵在线平台。

透明度是另一个关键问题。Manus 的开发人员强调了成功案例,但对其功能的独立验证却很有限。例如,虽然其演示展示了仪表板生成工作顺利进行,但用户在将 AI 应用于新的或复杂的场景时观察到了不一致之处。这种缺乏透明度的情况使得建立信任变得困难,尤其是当企业考虑将敏感任务委托给自主系统时。此外,由于缺乏评估 AI 代理“自主性”的明确指标,人们怀疑 Manus 是代表了真正的进步还是仅仅是复杂的营销。

底线

Manus AI 代表了人工智能的下一个前沿:能够独立、无需人工监督地执行各行各业任务的自主代理。它的出现标志着一个新时代的开始,在这个时代,人工智能不仅仅是辅助——它充当一个完全集成的系统,能够从头到尾处理复杂的工作流程。

虽然 Manus AI 的开发还处于早期阶段,但其潜在影响显而易见。随着 Manus 等人工智能系统变得越来越复杂,它们可能会重新定义行业、重塑劳动力市场,甚至挑战我们对工作意义的理解。人工智能的未来不再局限于被动助手——而是要创建能够独立思考、行动和学习的系统。Manus 只是一个开始。

Tehseen Zia 博士是伊斯兰堡 COMSATS 大学的终身副教授,拥有奥地利维也纳科技大学的人工智能博士学位。 他专注于人工智能、机器学习、数据科学和计算机视觉,在著名科学期刊上发表论文,做出了重大贡献。 Tehseen 博士还作为首席研究员领导了多个工业项目,并担任人工智能顾问。