又黑又红的Manus尚有四大问题待解 还要闯三关(图)



“AI一天,人间一年”。

3月6日凌晨,Manus亮相,瞬间点燃了整个科技圈。它被称为全球首款通用型AI Agent(人工智能代理)产品,由国内一家创业团队——Monica.im打造。但这场技术狂欢,迅速陷入争议旋涡。发布仅两天,Manus的口碑经历了数次剧烈反转。

Manus官方将自己定义为一款连接思维与行动的通用人工智能代理,特点是擅长处理各种任务,不仅能思考(听懂复杂指令进行推理),还能交付成果(顺滑对接完成该任务的各个环节,将最终结果给到用户)。

举个简单的例子。

如果让Manus筛选简历,用户只需将存有多份简历的压缩包直接发给Manus,剩下的任务就全部交由它完成。Manus会自动解压缩文件,浏览找出重要信息,给出候选人评估结果,还可以将候选人姓名和重要信息做成表格,方便用户查阅。

在此过程中,用户不仅可以关闭电脑,还能随时添加其他任务。

有了Manus,普通HR的日常工作似乎变得“多余”。这也让许多人惊呼,取代打工人的“AI牛马”真的来了。

不过,Manus属于“黑红”体质。

发布之初,它被冠以“炸裂”、“拳打ChatGPT”、“比肩DeepSeek”、“震撼硅谷”等名头,风光无限。不久后质疑声接踵而至,有人认为它过度营销,技术没有太大突破实为“套壳”,噱头远大于实际能力。

紧接着,其内测邀请码被炒到10万元天价的消息传出;它在X平台上的官方账号被冻结,显示原因为“违反平台规则”。随后,Manus联合创始人兼首席科学家季逸超公开回应称,账号被冻结可能与第三方提及加密货币诈骗有关,该领域与Manus的运营完全无关。

这一系列事件,更加深了外界对Manus的疑虑。这款备受瞩目的产品,究竟是真正的技术革新,还是营销噱头?未来又能火多久?

一、争议中的Manus,真有实力还是套壳工具?

Manus爆火两天,外界对它的评价极为两极分化。

一部分人觉得Manus让AI Agent又上了一个台阶,马上就要抢走打工人的饭碗,也有一部分人认为它只是个套壳工具。

来看它“封神”的点。

相比市面上已经出现AI Agent(比如豆包、文小言都内置了很多智能体),Manus的优点之一在于,处理复杂任务时具备自主性、连续性。

比如用户只需给出一段比较详细的提示词,Manus便能自主解读、拆解并给出结果,还能进行自我检查,省去了一步步的对话引导步骤。

由于Manus是基于云端异步运行,用户下达完指令后关闭页面都不会影响Manus处理指令,任务完成后还会自动通知用户结果。  

Manus的另一大亮点,是号称全球首款通用型AI Agent产品。

需要注意的是“通用”二字,指它能够处理各种各样的任务,不限任何领域,比如支持筛选简历、房产调研、股票分析等多场景。



然而,对于这两大亮点,也存在着不少质疑的声音。

首先,由于Manus处于内测阶段,采用邀请码制度,大多数用户尚未真正使用过该产品,目前对其“惊艳”的评价大多源自官方发布的演示视频。鉴于过往许多AI产品都存在“样片水平大于实际实力”的情况,部分从业者认为Manus的真实能力有待进一步考量。

其次,对于Manus的“通用性”,部分从业者认为,存在套壳嫌疑。

有从业者评价,Manus没有自研底层大模型的能力,其模型能力主要来源于国外Anthropic的Claude。而且,很多场景和功能早已在其他Agent中实现。比如,Devin作为全球首个AI程序员,也是一个能独立完成写代码任务(学习新技术、调试代码到部署应用程序)的AI Agent,在去年年底便面向公众开放。

从这个角度来看,Manus更像是给现有的各类AI应用加了个壳子,把DeepResearch(OpenAI推出)、Computer Use(Anthropic推出)等应用汇总了起来。

AI软件工程师覃相告诉“定焦One”,Manus是基于现有大语言模型的调用,并未涉及底层技术突破。比如在进行股票分析时,Manus通过调用雅虎金融API获取数据,再借助编程语言生成可视化图表,依赖的都是现有的技术和工具。

参加了Manus闭门分享会的AI博主自动华也对“定焦One”表示,制作团队分享了Manus作为AI员工主要做的三件事:配电脑(赋予AI访问浏览器和工具的能力)、配权限(接入私有API和权威数据源)、给培训(用户可以通过反馈实时调整AI行为)。

可见,Manus本质上是将各种工具进行拼接,其能完成跨应用这类复杂任务,依赖的是Claude模型,以及接入的各类智能体工具。

至于“套壳”“拼接”是否算作创新,业界观点不一。支持者认为,这种整合方式能够快速实现多种功能,为用户提供一站式解决方案,具有一定的实用价值;反对者则认为,这种模式只是基于现有技术进行简单组合。

但从业者基本都认同,从技术维度上看,Manus还远称不上是下一个DeepSeek。

二、如何正确看待Manus?

比起技术,Manus走红的关键在于用户体验。

减少了操作步骤,执行过程中不用反复和AI对话,还可以关闭界面,这都是过往AI Agent产品所不具备的。

自动华认为,AI Agent的意义在于帮助普通人提效,Manus重新定义了AI应用的价值指标,由重视DAU(用户留存)变到AHPU(Agentic Hours Per User,用户使用AI完成任务所耗费的时间)。

“正是这样的benchmark(可简单理解为评估指标),决定了产品优化路线,让Manus和市面上其他AI Agent产品有了区别。”自动华表示。

他解释,传统互联网产品都是“注意力经济”,希望占据用户更多的使用时间,最终通过广告变现,所以将五花八门的垂类Agent放到了产品中。

Manus的定位是通用型AI Agent,在执行同量任务情况时,试图让用户花的时间越短越好,所以它做了一个大整合,希望用越快的操作方式、越少的操作步骤为用户提效。

这与团队的过往背景有关。Manus背后的团队在2023年开发了AI浏览器插件助手Monica,他们发现浏览器作为单用户场景存在人机控制权冲突,AI频繁打断用户体验的痛点,由此得出“AI应拥有独立云端浏览器”。

自动华觉得,正是由此他们提出了“Less structure, more intelligence”,主张减少对AI的结构化限制,依赖模型自主进化能力,而非人工预设流程,才让Manus区别于传统 AI Agent。

这也是大部分用户对Manus感到兴奋的点。覃相将Manus比作“数字代理人”,能自动拆解复杂指令、替用户完成多个任务,而且执行速度快,在任务执行和用户体验上超越了豆包和百度的AI Agent。

覃相还进一步分析Manus核心优势背后的技术原理:多代理架构、强自主学习能力。

首先,Manus具备多代理架构与任务分解能力,它采用了多智能体系统架构,能够将复杂任务分解为多个子任务,并通过不同的智能体协同完成。这种架构使其能够高效处理长尾任务。

其次,它具备自主学习与记忆功能,能够记住用户的偏好,并在后续任务中主动调整策略。这种自主学习能力使其能够不断优化任务执行逻辑,逐渐从被动响应转向主动服务。

不过,在速度提升时,准确率也是需要重点考虑的要素。

Manus官方指出其具有低错误率,在GAIA(一个专为通用人工智能助手设计的基准数据集,主要用来评估 AI的基本能力)中,面对基础(整理文件、数据分析)、中等(调用API、写代码)、复杂(逻辑推理、多模态处理)三个级别的任务测试,其分数都超过了OpenAI的DeepResearch,但低于人类平均正确率92%,仍不如人脑聪明。

正如前文所说,由于产品还未大范围铺开,从业者对其实际效果持怀疑态度。很多博主在测评中发现,Manus在处理中等复杂的任务时,出现了长耗时问题;在访问需要登录的网站或处理付费墙内容时,也会出现卡顿,还是需要用户手动接管。

三、Manus的下一步,成本、技术、市场竞争

Manus的争议不小,但被捧得很高。很多人担心,Manus正式上线后,如果实力与预期不符,很有可能消耗掉DeepSeek为国内AI积攒下来的正向价值。

自动华告诉“定焦One”,在Manus的闭门分享会上,官方也提到了将面临的一些问题。比如未来的产品战略会朝着优化成本和提升运行速度努力,同时他们也在寻找一个与成本相平衡的商业化定价模式,所以距离公开上线还会有一段时间。 

这些挑战中,成本问题尤为突出。

“Manus单任务运行成本约2美元,虽然仅为竞品DeepResearch的1/10,但相比于豆包的单次任务调用回答,却昂贵了非常多倍。”自动华表示,在他看来,Manus调用的算力和生成结果的质量与竞品存在差异,但在目前国内大模型产品普遍免费的背景下,这种AI一次性完成高质量结果对应的付费模式,还有待探索。

目前,大多数普通用户为AI产品付费的意愿较低,尽管是功能强大的AI软件工程师Devin,高昂的月费(500美元)导致使用它的人很少。

这也是Manus需要邀请码才能使用的重要原因。从业者认为,官方之所以不全面放开使用权限,一方面可能是“饥饿营销”,但更重要的是,要考虑商业价值和成本的平衡。



用户多了很有可能导致算力跟不上。“Manus的底层是依靠大模型能力,算力紧张可通过加显卡解决,但很多公司支付不起背后高额的成本,特别是Monica还是一家创业公司。”自动华表示,Kimi在刚推出市场时也遭遇过类似问题,也没有轻易选择加显卡。

其次,当前AI Agent还做不到像人类一样聪明,解决问题的能力相对有限,Manus也同样面临着这一问题。

比如,最容易出现的情况是对用户问题理解不清晰,同一个问题反复问AI Agent好几遍,生成的答案还是无法达到与人类认知相匹配的标准。

因为AI Agent在执行任务时的思考方式是,复现成熟的任务流程或通过训练数据对问题进行简单拆分,归根究底,还是依赖于大模型的基础能力。Manus并没有在这方面做出强技术突破。有使用者指出,Manus对复杂问题的拆解能力仍处于较低水平。

以及Manus即将面临的市场竞争压力也不小。

覃相认为,豆包和百度的AI Agent也有各自的市场定位和技术优势,未来它们可能会通过技术升级或差异化竞争,缩小与Manus的差距,而且这两家公司的资金实力更强。

对于Manus的火爆,很多人持观望态度。不止一位投资人对“定焦One”表示,虽然他们很看好今年AI Agent的发展,但由于之前有类似AI程序员Devin的出现,Manus并没有太惊艳到他们,核心技术问题也没有得到根本性提升。

此刻,相比DeepSeek护城河较低的Manus,已经有不少开源复刻版项目出现,留给Manus的时间不多了。

一夜爆火的Manus是下一个DeepSeek吗?尚有四大问题待解

3月5日晚,一款叫作Manus的Agent(智能体,一种能够自主行动、感知环境、做出决策并与环境交互的智能应用或实体)产品发布。24小时内,它成为国内AI大模型领域讨论度最高的产品。“通用Agent终于实现了”“这是继DeepSeek之后的又一技术革命”。3月8日,董明珠在采访中谈及Manus称“科技时代就是不断呈现新技术的”,进一步引发热议。那么,Manus究竟是一款怎样的应用,是技术创新,还是不明觉厉?一夜爆火的Manus会是下一个DeepSeek吗?3月9日,上游新闻记者对公开报道进行了梳理,并就此采访了业内专家。



最近Manus很火。 视觉中国。

问题1:Manus是款什么应用?

近日,一款名叫Manus的AI Agent智能体产品在国内科技媒体和社交网络上刷屏,甚至被冠以“全球首款通用型智能体”的名号。在Manus官网,上游新闻记者看到,Manus这样介绍自己:“是一款通用型AI助手,能将想法转化为行动:不止于思考,更注重成果。Manus擅长处理工作与生活中的各类任务,在你安心休息的同时,一切都能妥善完成。”

Manus官方给出了三个演示案例:求职简历筛选、房产研究和股票分析。在接收到用户发送的复杂任务指令时,能够将任务分解为多个子任务,无需用户进行额外的提示或干预,自动完成从规划到执行的全流程。

以筛选简历为例,Manus会首先自动理解,需要解压打包文件这一隐藏指令,自主完成解压缩,并逐一浏览15份简历,同时记录其中的重要信息。最终,Manus不仅会生成自动排名建议,还会根据工作经验等重要维度,将候选人分为不同等级,提供全面且有条理的筛选结果。在这个过程中,无需用户进行额外的提示或干预,便能够自主地完成整个筛选流程。

另一个演示案例中,结合家庭收入情况和孩子的上学要求,让Manus在纽约筛选一个安全、犯罪率低的社区,并购买符合标准的房产。面对这类复杂任务,Manus同样是有条不紊地将其拆解为多个步骤,并创建详细的待办清单:搜索并阅读关于纽约最安全社区的文章;研究纽约的中学情况;编写Python程序来计算预算;基于预算,在房地产网站上筛选合适的房源;整合所有信息,撰写详细报告并整理相关资料。

Manus还能在虚拟环境中调用各类工具,来完成编写和执行代码、浏览网页、操作应用等复杂任务。在分析股票价格之间的相关性的场景中,Manus先是通过API访问雅虎金融等信息网站,获取股票历史数据,同时还会交叉验证数据准确程度,避免被单一信息来源误导。之后,它使用Python进行数据分析和可视化,引入金融相关的专业工具进行深入分析,最终通过数据可视化图表搭配详尽的综合分析报告,向用户清晰地反馈其中的因果关系。

在这些案例中,Manus化身不同岗位身份,完成从规划到执行的全流程,展示了真正的Agent能力。与DeepSeek的深度思考与对话不同,Manus的最大特点是“实干”——它不是在那里与你对话聊天,而是真的去调用工具、写代码。它不仅能提供解决方案,还能直接帮你干活、交付成品。简单而言,用户提出“一句话任务”,一段时间之后,便可以得到一个质量颇高的成品交付。

问题2:创始团队有何背景?

Manus的爆火,令外界更为关注其背后的创始团队的来历。

有媒体此前报道,Manus背后的创始人肖弘是一名“90后”,毕业于华中科技大学软件工程专业。毕业后,他连续创业,2015年创立夜莺科技,研发了用于企业微信服务的微伴助手和新媒体工具壹伴助手,服务超200万B端用户,获腾讯、真格基金等投资。

2022年4月,肖弘创立了北京蝴蝶效应科技有限公司,并推出一款号称All-in-One的AI助手Monica,该产品最初以浏览器插件的形式推出,集成了当前主流的大模型,可处理聊天、翻译、处理文案等工作,用户数量超过400万人,并被推向海外。

Manus背后团队为Monica.im。天眼查显示,Monica.im在国内的关联公司为北京红色蝴蝶科技有限公司,该公司成立于2023年7月。Manus核心创始团队有3人,除了创始人肖弘之外,联合创始人、首席科学家季逸超和合伙人张涛均常驻北京。

季逸超和肖弘一样,也是一名90后连续创业者。他曾就读于北大附小、北大附中,本科、硕士均就读于北京信息科技大学计算机学院。季逸超自高中时代就潜心科技创新创业,本科时,他推出了iOS浏览器猛犸4,获得Macworld2011特等奖。20岁时,创立了从事信息提取与检索技术研发的Peak Labs,并获得红杉资本和真格基金投资。

季逸超还曾开发Magi知识图谱系统,这也被称为“中文互联网最大通用知识图谱”,其开发的Steiner开源大模型还复现了OpenAl o1架构,推动了AI技术开源生态。

张涛此前曾在字节跳动、光年之外等公司担任产品负责人,与肖弘、季逸超共同成立Manus AI并担任合伙人后,目前负责产品战略、市场沟通及用户体验优化,主导构建了Manus的多代理架构设计,提出“用户体验应从答案交付转向成果交付”的产品理念。



Manus官方网站公布的GAIA基准测试得分,黑色为Manus的分数。Manus官网截图

问题3:营销策略“出口转内销”?

与此同时,Manus的营销方式也引起了不少发烧友的热议,有观点认为,Manus发布的策略类似于“出口转内销”,产品目前使用英文发布,注册账号还须开通国外支付,有那么点“吊国内用户胃口”的感觉,加上不少用户在讨论该产品时,也下意识将其与此前的大火的DeepSeek进行对比,进一步加深了辨识度。

上游新闻记者发现,Manus目前仍处于内测阶段,没有公开上线,采用的是邀请码机制,而只能通过官网预约、社交媒体活动或合作伙伴渠道获取邀请码‌,获得邀请码的用户才能实测体验。据此前媒体报道,在一些二手交易平台,一个Manus内测的邀请码被炒到了5万元以上,但却有价无市。



Manus邀请码闲鱼价格高涨。 视觉中国

这一举动被业界质疑为“饥饿营销”。迫于舆论压力,Manus AI合伙人张涛最近两次澄清“从未投入任何市场推广预算”,采用邀请码机制是“服务器容量有限不得已而为之”。

针对Manus的争议之一是“套壳”,即没有自研底层大模型的能力。Manus的模型能力来自Anthropic的Claude。但根据参加过沟通会的行业人士表述,Manus并不讳言自己是一个“套壳”产品。

在已有的实测体验中,Manu近乎于DeepResearch、Computer Use以及Cursor等众多AI应用的集合体。一名获得实测资格的用户表示,他的体验基本都很顺畅,必须承认这当中没有太多新技术,但整合得很完美。上游新闻记者在Manus官网看到,基准测试方面,Manus自称,在全部三个难度等级上都达到了新的最先进(SOTA)表现。

问题4:是“套壳”应用还是业界新神话?

在Manus火爆的时候,一些人兴奋地将其视为“下一个DeepSeek”或者说是“AI Agent的DeepSeek时刻”,认为Manus是中国AI颠覆行业的又一个代表。

然而,Manus爆红不足三日,隶属于国内AI Agent初创公司DeepWisdom(深度赋智)的MetaGPT 团队,就进行了产品复刻,并将产品Open Manus上传至开源社区。该团队完成这一项目仅仅花费了3小时,业界也有人提出“Manus门槛不高”的质疑。

“Manus确实有被指‘套壳’,我觉得这是对于Manus的一个误解。”重庆星环云科技有限公司联合创始人、上海交通大学重庆人工智能研究院大模型专家黄山告诉上游新闻记者,Manus本身就是基于各种大模型研发的一个智能体,至于它没有自研底层大模型的能力,这不是非常重要的问题,重要的是它作为一个AI新产品,是否为AI的发展开辟一条新的道路。

黄山认为,Manus的爆火出圈,反映的是大众对于以Manus为代表的这一类AI Agent产品的期待,抛开“套壳”带来的争议,当智能体的价值被更多人看到,智能体时代有望加速到来。Manus在客观上促进了超级Agent的发展。“至于是不是Agent的DeepSeek时刻,看最后这个产品如何完善,我相信后期广大用户会自己‘投票’做出决策。”

“从目前的内测体验来看,确实用起来令人兴奋,事实上只有真正用起来才会体会到这种Agent的长处和短处。”黄山说,Manus把通用场景的用户体验做得很好,“我们需要尊重和期待产品创新,致敬带我们探路的产品团队,AI产品迭代很快,不要吃不到葡萄说葡萄酸,我们也要以平常心和包容心看待工具的长处和短处。”

作为未来AI发展的一个重要方向,AI智能体何时会有一个质的飞跃?在上海交通大学人工智能学院长聘教轨副教授谢伟迪看来,这和底层大模型能力的跃迁有很大关系。如果底层大模型比如DeepSeek变得更加强大,集纳和调用大模型的AI智能体也会变得更强大。从逻辑上来说,先要实现通用人工智能,才会有强大的通用AI智能体。

此前,Manus出现之前,业内便已经纷纷预测:“2025年将成为AI Agent商业化应用元年。”DeepSeek爆火之后,其背后的V3、R1等多款AI大模型带来的工程优化和能力提升,快速引爆了市场热情,在此基础上,谁能基于这些模型能力打造出下一个超级App、超级Agent,成为大众关注的焦点。

上游新闻记者 李坐廷