时政·财经·军事 | 生活·家庭·娱乐 | 体坛·历史·科技 | 摄影·旅游·文化 | 移民·教育·就业 | 数码·健康·奇闻 | 社区·评论·问卷
留园网首页 · 新闻速递首页 · 【繁體閱讀】 【网友评论:15 条】 【 热评新闻排行 】 【 热门新闻排行 】 【 即刻热度新闻排行 】 【 72小时神评妙论 】   

Manus横空出世:中国首款通用AI代理刷屏朋友圈(组图)

新闻来源: 金十新数据/极客公园 于2025-03-05 23:30:43  提示:新闻观点不代表本网立场





Manus在GAIA基准测试中取得了最高分,标志着其作为一款高度先进的通用AI助手的地位。

3月6日,在苹果新品发布的同时,很多人为了拿到Monica.im研发的世界首款AI Agent产品Manus的邀请码而通宵达旦。Manus在GAIA基准测试中取得了最高分,标志着其作为一款高度先进的通用AI助手的地位。

朋友圈几乎被Manus刷屏,上一次出现类似情景还是在GPT和DeepSeek发布时。二级市场已经注意到Manus,阿里、腾讯等股票在开盘后迅速上涨。昨晚美股交易时段,相关逻辑已经显现,ADR(美国存托凭证)市场也有所反应。

与传统AI模型不同,Manus不仅能够生成想法,还能在现实世界中执行任务,使其能够自主完成复杂任务。一项演示展示了其撰写报告和创建定制化表格的能力。这款AI代理还配备了高度自适应的“数字大脑”,能够进行独立学习、处理复杂指令并实现跨领域协作。

据其团队介绍,Manus是一款真正自主的AI代理,能够处理各种复杂和动态的任务。与传统AI助手不同,Manus不仅提供建议或答案,还能交付完整的任务结果。

Manus采用由多个独立模型驱动的多签名(multisig)系统。这意味着Manus的核心功能由多个独立的AI模型共同完成。每个模型可能专注于不同的任务或领域,例如自然语言处理、数据分析、推理等。这些模型协同工作,能够处理更复杂、多样化的任务,同时提高系统的鲁棒性和准确性。今年晚些时候,官方计划开源部分模型,特别是Manus的“后处理”(推理)部分。

据了解,Manus采用了“虚拟机 + 计算使用 + 生成物(artifacts) + 内置多个agents”的综合架构。可以理解为在类似Cursor的产品上增加了一层外壳,并整合了多个小模型。Cursor类产品对普通人门槛较高,而Manus降低了使用门槛。

目前业界普遍采用类似思路,OpenDevin等团队也有类似产品。Claude在处理此类任务时表现也很强。如果这种模式跑通,Coze、Dify等产品也可能推出类似路线,同时这类能力可能被大模型内化。

与Manus同时受到关注的,还有一个4分钟的演示demo。在这些案例中,Manus自主完成了从规划到执行的整个过程,展示了真正的代理能力,而非简单的助手功能。

例如,第一个任务是从15份简历中筛选出适合强化学习算法工程师职位的候选人。Manus展现出类似人类实习生的特质,手动解压文件并逐页查看每份简历,同时记录关键信息。官方团队表示,所展示的只是Manus能力的冰山一角。

当AI Agent通过调用长链思维和工具利用,最终输出一个完整且专业的结果时,用户开始惊叹于AI真正能够帮助人类完成任务。

为确保结果的可重复性,Manus使用了与其官方版本相同的配置进行评估。

据官网介绍,在GAIA基准测试(评估通用AI助手解决现实世界问题的能力)中,Manus在所有三个难度级别上都达到了新的最先进(SOTA)性能。

Manus AI背后的创始人肖弘毕业于华中科技大学软件工程专业。毕业后,他开启了一系列创业之旅,2015年创立了夜莺科技,并推出了壹伴助手和微伴助手,服务超过200万B端用户,获得了腾讯、真格基金等投资。

他还开发了Monica,一款被称为“全能”的AI助手产品,最初作为浏览器插件推出。通过整合主流大模型(如Claude 3.5、DeepSeek等),Monica提供聊天、翻译、文案撰写等功能。Monica最初专注于海外市场,用户数突破百万,成为AI插件领域的领先产品。今年2月,Monica中文版开始内测,目前对国内用户免费开放。该版本基于DeepSeek R1和V3模型,具备深度推理能力,支持记忆功能和实时互联网搜索。

Manus秉持“少结构多智能”的技术理念,这与主流观点有所不同。他们认为,当数据质量足够高、模型足够强大、架构足够灵活、工程足够稳健时,计算机使用、深度研究、编码代理等能力自然会涌现,无需将其设计为特定的产品功能

AI Agent的“GPT 时刻”,Manus炸醒整个AI圈




离用户最近,做出最好的 AI Agent

2025 年是 AI Agent 元年——这句话,在北京时间 3 月 6 日凌晨,得到了应验。

「DeepSeek 之后,又一个科技圈的不眠之夜。」

不少用户在社交媒体上如此点评。

所有人彻夜蹲守,只为该产品的一个使用邀请码——它就是 Monica.im 研发的全球首款 AI Agent 产品「Manus」。

据团队介绍,「Manus」是一个真正自主的 AI 代理,能够解决各类复杂多变的任务。与传统 AI 助手不同,Manus 不仅能提供建议或答案,还能直接交付完整的任务成果。

Manus 的介绍视频只有短短的 4 分钟,却威力惊人|图片来源:Monica.im

正如「Manus」的名字寓意,它在拉丁文里象征着「手」。也就是说,知识不仅要在脑子里,还要能用手执行。这正是 Agent 和 AI Bot(聊天机器人)产品的本质进阶。

Manus 牛在哪里?最直观的是看官方网站展示、以及用户自发展示的使用用例,极客公园部分整理如下:

旅行规划:不仅整合旅行信息,还为用户创建定制旅行手册。例如,为用户规划日本四月旅行,提供个性化的旅行建议和详细手册。

股票分析:进行深入的股票分析,设计视觉上吸引人的仪表盘展示全面的股票洞察。例如,对特斯拉股票进行深度分析,创建可视化仪表盘。

教育内容创建:为中学教师创建视频演示材料,解释动量定理等复杂概念,帮助教师更有效地教学。

保险政策比较:创建清晰的保险政策比较表,提供最佳决策建议,帮助用户选择最适合的保险产品。

供应商采购:在整个网络中进行深入研究,找到最适合用户需求的供应商,作为真正公平的代理为用户服务。

财务报告分析:通过研究和数据分析捕捉市场对特定公司(如亚马逊)的情绪变化,提供过去四个季度的市场情绪分析。

创业公司列表整理:访问相关网站识别符合条件的公司,并将其整理成表格。例如,整理 YC W25 批次的所有 B2B 公司列表。

在线商店运营分析:分析亚马逊商店销售数据,提供可操作的洞察、详细可视化和定制策略,帮助提升销售业绩。

当 Agent 通过一长串思维链和工具调用,最终输出一个无比完整、专业的结果时,用户们开始感叹「真的能帮人类做事了」。

根据官方网站信息,在GAIA基准测试(评估通用AI助手解决真实世界问题的能力)中,Manus在所有三个难度级别上都取得了新的最先进 (SOTA) 表现。

总结成一句话——Manus 更想做的,是你在数字世界中,字面意义上的「代理人」。而它做到了。

就像你想的一样,凌晨推出的 Manus,一下子把所有 AI 圈的人都炸醒了!

01

Manus,你的「数字代理人」


首先,Manus 在体验上与此前 LLM 最大的不同:

它强调直接交付最终结果的能力,而不只是给出一个单纯的「答案」。

Manus 目前采用 Multiple Agent 架构,运行方式与此前 Anthropic 发布的 Computer Use 类似,完全运行在独立虚拟机中。同时可以在虚拟环境中调用各类工具——编写和执行代码、浏览网页、操作应用等,直接交付完整成果。

在官方发布的视频中,介绍了三个 Manus 在实际使用场景中所完成的工作案例:

第一个任务是筛选简历。

从 15 份简历中,为强化学习算法工程师职位推荐合适的候选人,并根据其强化学习专业知识对候选人进行排名。

在这个演示中,你甚至不需要给压缩文件解压、将其中的简历文件一份份手动上传。Manus 这时候就已经展现出了像人类「实习生」的一面,手动解压缩文件,并逐页浏览每一份简历,同时记录其中的重要信息。

Manus 像实习生一样,自动理解「解压老板扔过来的打包文件」这个隐藏指令 | 图片来源:极客公园

在 Manus 给出的结果中,不仅有自动生成的排名建议,它还会根据工作经验等重要维度,将候选人分为不同等级。在接受到用户更希望以 Excel 表格的方式呈现后,Manus 还能自动将这些内容通过现场编写 Python 脚本的方式,来生成对应的表格。

Manus 甚至还能通过记忆能力,在这个实践过程中记录下「用户更喜欢通过表格的方式接受结果」这样的信息,下一次处理类似的任务结果时,会优先使用表格的形式来呈现。



Manus 能记住用户在内容生成流程中的偏好 | 图片来源:极客公园

第二个案例,更为国人量身打造,就是遴选房产。

案例中用户希望在纽约购买房产,输入的要求是希望同时有安全的社区环境、低犯罪率,以及优质的中小学教育资源—— 当然还包括最重要的预算,足够在每月固定收入的情况下负担的起。

在这个需求中,Manus AI 将复杂任务分解为待办事项列表,包括研究安全社区、识别优质学校、计算预算、搜索房产等。并通过网络搜索,仔细阅读有关纽约最安全社区的文章,收集相关信息。

其次,Manus 通过编写一个 Python 程序,根据用户收入计算可负担的房产预算。结合房地产网站上相关的房价信息,根据预算范围筛选房产列表。



Manus 能够自动搜索、并过滤掉条件不符合用户要求的房源 | 图片来源:极客公园

最后,Manus 会整合所有收集的信息,撰写详细报告,包括社区安全分析、学校质量评估、预算分析、推荐房产列表以及相关资源链接——就像一个专业的房地产经纪人一样。而且由于 Manus 自带「完全基于用户利益考虑」的属性,其使用甚至体验更好。

在最后一个案例中,Manus 展示了对股票价格的分析能力。

案例给出的任务是分析过去三年中英伟达、迈威尔科技和台积电股票价格之间的相关性:众所周知这三支股票之间存在紧密的关联性,但对于新手用户来讲,很难快速将其中的因果关系整理清楚。

而 Manus 的操作,与一个真正的股票经纪人非常相似,它先是通过 API 访问雅虎金融等信息网站,来获取股票历史数据,同时还会交叉验证数据准确程度,避免被单一信息来源误导,对最终产生结果带来重大影响。

在这个案例中,Manus 同样用到了编写 Python 代码、进行数据分析和可视化的能力,同时还引入了金融相关的专业工具进行分析,最终通过数据可视化图表,搭配详尽的综合分析报告的方式,向用户反馈其中的因果关系——真的就像一个金融领域「实习生」做的日常工作。

不仅如此,在 Manus 官网还展示了十多个 Manus 能够使用的场景:直接使用 Manus 帮你整理行程、个性化推荐旅游路线,还能让它学习使用各种复杂工具,来流程化的完成日常工作。

在这个过程中,真正让 Manus 展现出与往常工具不同的,是它的自主规划,来确保执行任务的能力。

自主学习的能力也让 Manus 的工作能力提升逻辑更像是真正的人类——即使现阶段,它可能还无法在某一个特定领域做到专家级别的精通,但已经能看到巨大的潜力。

随着自主学习能力的加入,AI Agent 的泛用性得到了巨大的提升,在用户对 Manus 的实际测试中,你甚至可以做到直接对它描述一个视频画面中的相关内容,Manus 最终能够直接根据对应的信息,跨越平台内容对于搜索引擎的限制,精准找到某个抖音短视频的链接。

由于目前版本的 Manus 完全基于云端异步运行,因此实际上 Manus 的能力并不被你所使用的端侧平台形态或算力等因素限制——用户甚至可以做到在向 Manus 下达指令之后,暂时关闭电脑,当 Manus 执行完成活动结果后,会自动通知你结果。

这个操作逻辑同样非常眼熟——就像一个人下班以后,在微信上喊实习生「文件整理好发我」。只不过,现在,这个实习生是真的可以 7x24 小时的响应你了,并且不用担心他会「整顿职场」。

02

多代理+自查,跑通 AI Agent 流


从上面这些案例,其实不难看出 Manus 真正的杀手锏,并非 Computer Use 中已经出现过的「AI Agent」概念,而是它「模拟人类方式工作方式」的能力。

比起「运行计算」,Manus 的工作逻辑更像是「思考并执行命令」。它并没有做到哪些人类当前真正无法做到的事;这也就是为什么一些已经体验过当前版本 Manus 的用户,将它形容为「一个实习生」。

在 Manus 官网,展示着众多 Manus 能够完成的任务,其中就有一个案例,展示了在 B2B 业务中,如何使用 Manus。快速精准的将你的订货需求,与全球供应商实现精准匹配。

在类似需求的常规产品中,在平台内整合全球供应链企业信息,来帮助用户完成供货商/需求方匹配这件事,是业内通行的逻辑。但这件事在 Manus 的案例中,你能看到完全不同的实现方式。

Manus AI 使用一套名为「Multiple Agent」的架构,运行在独立的虚拟机中。通过规划代理、执行代理、验证代理的分工协作机制,。来大幅提升对复杂任务的处理效率,并通过并行计算缩短响应时间。

在这个架构中,每个代理可能基于独立的语言模型或强化学习模型,彼此通过 API 或消息队列通信。同时每个任务也都在沙盒中运行,避免干扰其他任务,同时支持云端扩展。每个独立模型都能模仿人类处理任务的流程,比如先思考和规划,理解复杂指令并拆解为可执行的步骤,再调用合适的工具。

换言之,通过 Manus 的这套多代理架构,它更像是由多个助理,通过协助的方式,分别完成检索资源、对接、验证信息是否有效等工作,来帮你完成整个工作流程——这实际上不仅像是你招了一个「实习生」,更像是直接当上了一个微缩版的「部门主管」。

在 B2B 业务这个案例中,Manus 通过网页爬虫以及代码编写、执行能力,Manus 会自动在互联网这片汪洋大海中检索,根据你自己的需求,对潜在供应商从产品质量、价格、交货能力等方面,为你匹配到最合适的货源。不仅可以将结论以图表的方式直观呈现在你眼前。还能对这些数据进一步给出更加详细的操作建议。

Manus 完成 B2B 场景下的需求,或许比单一平台的内建工具更好用 | 图片来源:极客公园

至于 Monica 团队到底如何、用何种技术实现的视频效果,根据消息,团队或将在北京时间 3 月 6 日为大家揭晓。

03

「缝合」的极致,就是炸裂


Manus 背后的 Monica.im,到底是家什么公司?

Monica 是一款 All-in-One 的 AI 助手,产品形态从浏览器插件、慢慢拓展至了 App、网页端。主流的使用场景是,当用户在浏览器中点开它的小图标,就能直接使用其接入的各大主流模型。通过对细分场景用户需求的准确理解,Monica 摘到了大模型「低垂的果实」。

其创始人肖弘(昵称小红,英文名 Red)是一位年轻的连续创业者,1992 年生,毕业于华中科技大学。2015 年,他毕业后创业,早期创业不算顺利(如校园社交、二手集市)。2016 年,他创业微信公众号运营者提供编辑与数据分析工具,获得了百万用户、并完成了盈利,最终产品于 2020 年出售给了某独角兽公司。

等到 2022 年大模型浪潮后,他正式创立 Monica,专注海外市场,通过独立开发者产品 ChatGPT for Google,产品快速完成了冷启动。

2024 年,在 GPT-4o、Claude 3.5、OpenAI o1 系列上线的第一时间,Monica 让用户可以获得最新 SOTA 模型。随着接入模型的新进展,Monica 推出的专业搜索、DIY Bot、Artifacts 写小程序、记忆等功能也受到用户喜爱。而 Monica 在 YouTube、Twitter、Gmail、The Information 等不同功能的网页里呈现出不同的交互形态和功能,以适配特定场景的用户需求,更新了数百个网页的个性化 AI 体验。

2024 年,Monica 用户数量翻番,达 1000 万。同时,其保持着可观的盈利,在海外同类产品中,位居头部。

Monica 的强劲表现验证了一件事:

套壳到极致,既是 TPF、也是 PMF,最后都通往用户价值。



Monica 首页 | 图片来源:Monica

Manus 或许延续了 Monica 团队这种思路——肖弘接受媒体人张小珺的访谈时表示,产品不能只有聊天机器人一种形态,Agent 会是新增的形态、需要新的产品去承接。

他从 AI 编程产品 cursor 和 Devin 中获得了灵感。据极客公园了解,前者主要是 copilot 模式、后者则是 autopilot 模式,后者更符合人性需求。Agent 也应该像 Devin 一样,面向大众人群、真正由 ai 主导进行执行。但过去的问题是,模型不够聪明。

但基于模型已有能力去做场景的封装服务,或许正是 Monica 团队的优势。肖弘说,目前 Agent 产品团队并不多,因为它需要很多复合能力,比如说团队要搞过 chatbot、AI 编程、浏览器相关(因为都在浏览器上跑)、而且对模型的边界要有不错的感知——今天发展到什么水平,接下来会发展到什么样的水平等等。

「同时拥有这些能力的公司没那么多,而有这些能力的公司,可能手头正在干一个很具体的业务,但我们恰好有同学刚好有时间一起把这件事情做出来。」他说。

为什么是 Monica 做出来了,他总结道,「第一,我觉得我们是比较幸运的。第二,某种程度上,如果今天大家都去做 reasoning 了,可能是不是又多出了一些时间给创业公司?模型预计能力外溢还能走多远?」

他认为,目前 Agent 还在早期阶段。一是目前 Agent 还在规划阶段,还没到物理世界的执行;二是大模型的能力还在往上发展,一切还不可预料。

「我肯定不知道 Agent,是可以被用这样的方式被出来的,它是一个未知的事情。」他说。

耐人寻味的是,「不知道怎么做 Agent」的 Monica,现在做出了一个让整个 AI 圈感到炸裂的产品。

Manus 可能未必是最终的 AI Agent,但它无疑在 DeeoSeek 爆火之后,再次将人们对 AI 的期望拉升了一个数量级。

			
			
网编:睿文

鲜花(2)

鸡蛋(1)
15 条
【手机扫描浏览分享】

扫一扫二维码[Scan QR Code]
进入内容页点击屏幕右上分享按钮


敬请注意:新闻内容来自网络,供网友多视角阅读参考,观点不代表本网立场!若有违规侵权,请联系我们。
热门评论当前热评  更多评论...
评论人:苏浩[♂★★声望品衔9★★♂][个人频道][个人动态] 2025年03月06日1:35 回复
新加坡又要抓人及有人被抓了
  1
新闻速递首页 | 近期热门新闻 | 近期热评新闻 | 72小时神评妙论 | 即刻热度新闻排行
科技频道】【宠物情缘
前期相关精彩新闻
新闻速递首页·向留园新闻区投稿·本地新闻·返回前页