业界动态
对话OpenManus团队:他们是如何3小时复刻Manus的?
2025-03-14 08:59

图片

就在昨天, 在国内媒体间爆火,其号称 “ 全球首个通用 AI 智能体 ”。

官方也晒出了几十个Demo,供大家玩赏。

图片

网友们惊艳于其效果后当然跃跃欲试,却发现试用需要邀请码。我们问了一圈 AI 专家,都说没用过,也没听自己哪个同行用过,“目前都是媒体在用吧?”

到这里就需要谨慎了,没有较大规模公开测试、没有专家实名自发背书过的技术或产品( ChatGPT、NotebookLM、 等都是有的 ),实力终归是存疑的。

从产品体验来看,Manus 虽然效果惊艳,但是很多人其实不买账,因为写 PPT、写 HTML、Python 数据分析、生成 Excel、搜索等功能目前各个通用模型都能做。即便 Manus 说自己比 OpenAI 的 DeepResearch 更厉害,但这和 Cursor 说自己比 Claude 更厉害有什么区别?两者的可比性是错位的。

功能上,Manus 是整合了 Computer use、虚拟机、Multi agent 协同的套壳产品。技术实现上是基于 Claude 模型生成能力、开源模型后训练增强的规划能力,再结合各种预制的 Agent,按照设定好的工作流:构建 todo 清单、新建虚拟机环境、调用工具、结果整合、自我检查、输出结果,来解决任务。

所以,Manus 技术上有其复杂性,但没有太多创新,当然,其功能多样性导致工程量极大,业内专家认为很有可能是基于 MCP 协议的聚合模式。

过去 Agent 更多是在专业领域做深耕,而 Manus 通过工程上极致整合、酷炫低门槛的 UI 交互套壳产品想让 Agent 直接出圈了。

总有人说,套壳到极致就是胜利,就是价值,确实,至少从 Manus 的演示视频来看,是这样。

既然有价值,那么很快就会有人跟上,这不,为了实现 Manus 的价值,metaGPT 团队花费了 3 小时开发了 OpenManus 并开源,无需邀请码就能使用。

图片

项目地址:
https://github.com/mannaandpoem/OpenManus

在项目的演示视频中,输入提示词:“对 Karpathy 的网站( https://karpathy.ai/ )进行全面的 SEO 审核,并提供详细的优化报告,包括可操作的改进建议。”

接下来,OpenManus 会展开思考,拆分执行步骤:

•检查网站,收集基本信息;

•分析关键SEO要素;

•检查 SEO 技术方面的问题;

•整理优化建议;

接下来就是一步一步地执行任务了。

可以看到,演示视频展示的结果远不如 Manus 那么细致和丰富,OpenManus 目前功能还很初级,但团队还公开了后续的开发路线,照这个路线,基本上全面复刻 Manus 不是问题:

• 更优的规划系统

• 实时演示功能

• 运行回放

• 强化学习微调模型

• 全面的性能基准测试

知危:OpenManus 是怎么来的?

metaGPT:两个月前的一次边吃饭边头脑风暴的过程中,我们想到,一个极简的 Agent 框架,应该是可插拔的 Tools 和 System prompt 的组合,之后我们沿着这个思路,写了一个完整的 Agent 迷你框架。

前天晚上看到 Manus 时,凌晨就和同事商量,下班后的晚上就可以搞一个,应该 3 小时够了。

知危:为什么要采用可插拔的 Tools 和 System prompt?

metaGPT决定一个 ReAct Agent( Reasoning and Action Agent,一种结合了反应和行动规划能力的智能体 )的效果的关键是 prompt( 提示信息 )和 Action( 行动 ),prompt 控制了 Agent 整体的行为逻辑,Tools 给定了 Agent 的行动空间,二者被定义就能完整诠释一个 ReAct Agent。

可插拔的优点是可组合,我可以把几个不同场景下的 Tools 组合到一起来创造一个新的 Agent,定义也很方便,不需要单独写内部逻辑,只需要修改动作空间( Tools )。Tools 本身就该是可组合的,我们的工作是把抽象做得更干净,目前 HuggingFace 的 Smolagents 也是类似的思路了。

Manus 效果上让大家觉得很新奇,实际上主要是由于 Browser Use 和 Computer Use 的使用,所以只要给了 Agent 这两个工具,那它就都能做到。

知危:OpenManus 在实现中,有哪些关键技术挑战?

metaGPT:在 OpenManus 的实现中,前端界面的实现很关键。Manus 很出彩的地方是产品展示很漂亮,我当时打算用 Streamlit 写前端,方便做类似的展示,但 Streamlit 的底层和 Browser Use 冲突,后来就换了 Gradio,但信息展示有一些问题,当时没办法做到实时更新,最后还是改成了 log,直接在命令行里做展示。

如何有效复现和优化 PlanningTool 的使用也是非常重要的一环,这样才能充分发挥 Agent 的规划和工具调用能力,探索其能力上限。Manus 的用例展示了 Agent 在线性任务规划中的强大表现,而 OpenManus 需要解决如何设计更复杂的规划结构( 如使用 DAG 有向无环图表示任务依赖关系 ),以及如何让 Agent 动态更新规划以适应变化的需求,这不仅考验技术实现,还涉及算法设计和智能体的自适应能力。

目前 OpenManus 的规划设计与 Manus 保持一致,都是线性的,而DAG规划对于处理现实世界中更复杂的任务,在一定程度上会更准确,Data Interpreter 就是一个很好的例子。

知危:听起来 OpenManus 的规划已经有要超越 Manus 的苗头了,你们对这个产品有什么期望吗?

metaGPT:OpenManus 前期目标打算达到原始 Manus 的相同的效果,后续会不断优化 Computer Use、Browser Use 和 Planning Use,以及工具调用的能力,从而超越 Manus。

Manus 产品交互做的挺好的,有很多技术也值得学习,比如对后训练技术的结合,流程设计上比如规划、Multi Agent 系统也是很优秀的,具体细节我们还在研究。至于 OpenManus 我们没有单独调效果,目前达到的效果其实很一般。后续主要靠开源社区小伙伴来贡献,我们希望开源协作能带来更高的智能涌现~

好了,到这里知危编辑部与 metaGPT 团队的沟通就到这里了,我们也可以期待一波 OpenManus 未来的效果。

最后,或许我们可以探讨一下到底什么应该是好的 Agent ?

Manus 有优点、有亮点,但有夸大之嫌。人们在试用的时候,还是能发现 Manus 有不少毛病,用错了假数据、来源引用错误、表格读取错误等等毛病一个不落,幻觉问题还是不小。

Agent 应用的一大通病是,自动化执行过程越复杂,错误发现和查找原因就越困难,而且 Agent 的执行需要经过多个 LLM,每个 LLM 的幻觉一路累积下来的误差将是巨大的,比如 95% 的准确率,连续经过 10 个 LLM,最后准确率能直接降到约 60% 。

在全面拥抱 Agent 之前,我们首先还是得多关注一下,目前市面上的通用大模型,它们的幻觉率仍然不是一般的高。

所以,想实现真正好用的 Agent,我们仍然要攻克大模型底层能力的提升。里子不够好,套太多的壳也没用。

与此同时,我们还需要强调的一点是,追求 Agent 的过程中,我们一定是要回归实用主义的:不是所有问题都需要用 Agent 来做。

Devin 前不久还被爆出出错率极高并且出错方式没有规律可循,还不如用 Cursor 一步一步来,加上之前的演示造假事件,过于激进的 Agent 产品越来越受到质疑。

与此同时,Agent 的一大通病是,步骤拆解越多,token 消耗量越大,对所有任务一律无脑使用 Agent,对于企业的成本控制而言具有极大的风险。

Agent 的最关键的作用就是工作流编排,简单的任务其实并不需要 Agent 的参与,反而会导致客户等待时间过长。

Anthropic 就曾经分享过构建智能体的基本原则,就是 “ 简单为王,实用至上 ”,能用 API 就不要用工作流,能用工作流就不要用智能体。

这些都是手段,哪个不能交付结果呢?

Agent 终究是一个产品概念,不像 LLM 有无法预测的潜在价值( 比如推理能力的发现和增强 )值得冒极大风险押注。

    以上就是本篇文章【对话OpenManus团队:他们是如何3小时复刻Manus的?】的全部内容了,欢迎阅览 ! 文章地址:http://www78564.xrbh.cn/news/35253.html 
     文章      相关文章      动态      同类文章      热门文章      栏目首页      网站地图      返回首页 迅博思语移动站 http://www78564.xrbh.cn/mobile/ , 查看更多   
最新文章
中交地产1元“退房”:战略转型与债务困境下的断臂求生
中交地产的这次“断臂求生”,不仅是企业自救的手段,更是一种行业趋势的缩影。中房报记者 梁笑梅丨北京报道7月25日,深陷退市危
邛崃市2025年7月招聘信息第四期共30家企业
四川金忠食品股份有限公司(邛崃市新邛路517号)1.研发工艺员 1名要求:40岁以下,大专以上学历,食品类专业,具备食品(肉制品
浙江义乌“大企帮小店”探索共富新路径
方静“张大酥是专门经营养生糕点的店铺,今年初才进驻李祖。当时‘大企’主动帮我们设计了具有李祖特色的糕点套装,义乌市市场监
北京移动应急通信保障恢复怀柔区72座基站,抢通40个行政村
7月28日北京青年报记者从北京移动了解到,截至18时,北京移动已抢通怀柔区雁栖开发区至汤河口48芯光缆一条,恢复汤河口、宝山、
小猫看伤花5000元,宠主质疑:诊所每天对小猫进行抽血检查等诊疗行为属于“过度医疗”
近日,芜湖繁昌区法院参考专家辅助人的意见,引导双方申请司法鉴定。调解过程中,专家辅助人详细分析了小猫病历,明确指出检查报
克莱斯勒300C 2.7汽车配件前羊角轴头刹车盘
克莱斯勒300C/2.7三元催化器 峰哲汽车尾灯后保险杠 切诺基大灯 我公司是一家专业从事别克与克莱斯勒汽车配件销售与服务的汽配企
他们是CS上海Major的“幕后功臣”,完美电竞合作伙伴联盟成立
从2019年的第九届DOTA2国际邀请赛(TI9),到2020年的英雄联盟全球总决赛(S10)、2024年的反恐精英世界锦标赛(CS上海Major),
军事资讯AI速递:昨夜今晨军事热点一览 丨2025年8月21日
  军事领域动态复杂,事件可能迅速改变全球安全格局。我们整理了昨夜今晨最重要的军事新闻,包括关键行动和政策变化,让您清晰
刚出炉!上海崇明成功认证“国际湿地城市”,将迎来什么发展机遇?
《湿地公约》第十五届缔约方大会于7月23日至31日在津巴布韦维多利亚瀑布城举行。全球共16个国家31个城市获得第三批“国际湿地城
疑似OPPO Find X9 Pro核心硬件曝光:搭载天玑9500 主频突破4GHz
【TechWeb】去年10月,OPPO推出了OPPO Find X8 Pro,这是全球首款配备双潜望长焦的天玑旗舰,拥有一颗5000万像素3倍索尼LYT-600