网易首页 > 网易号 > 正文 申请入驻

Manus走了,原生Agent登场:“AI助手”的第三次重新定义

0
分享至


Siri → ChatGPT → ???

回顾过去十几年,市场对“AI助手”的想象经历过三次大规模的预期校准。

第一次是Siri诞生时,语音控制带来了交互的新鲜感,人们以为电影里的智能管家 Jarvis 就在眼前,但随后发现它更多时候只是一个语音闹钟;

第二次是ChatGPT横空出世,流畅的对话与推理能力让人觉得 AI 终于有了“脑子”,但很快市场意识到,它依然只是一个在对话框里坐而论道的智者,看不到对话框之外的世界。

2025年初,Manus的出现,让Agent的概念有了实感。这一次的冲击不同以往——很多人第一次看到 AI 不仅在“说”,而且在“做”。它当着你的面打开浏览器、编写代码、调试错误、甚至因为网页加载太慢而主动刷新。

当 Manus 的热度随着被收购而逐渐平息,人们才发现,无论技术外壳如何变迁,人类对 AI助手的核心渴望从未改变:用户不只想要一个仅仅能听懂话的陪聊,也不只想要一个会在黑底白字界面里写代码的极客工具;大家想要的,一直都是一个更聪明、真正能把活儿干完的帮手。

随着 Manus 完成它的历史使命,Agent 的下半场大幕正在拉开。

01
Manus
完成了它的历史使命:Agent 的启蒙运动

作为一家公司,Manus 的最终归宿或许存在争议;但作为一个产品现象,Manus 已经完成了它的历史使命——它是Agent时代的启蒙者。

在 Manus 之前,Agent 更多停留在学术论文和极客的 Python 脚本里。Manus 的成功之处在于,它通过可视化的交互,第一次向普通用户展示了Claude模型背后潜藏的Agent能力。它把“拆解任务-自主执行-环境反馈-修正路径”这一整套复杂的黑盒逻辑,变成了一个让用户盯着屏幕看的直观过程。

Manus 与 Claude 模型是典型的“互相成就”。Claude 稳定的计算机使用(Computer Use)能力、代码能力、工具调用能力是地基,而 Manus 是那座拔地而起的样板房。Manus的流行,本质上是Anthropic技术愿景在应用层的一次成功落地。

然而,Anthropic 自家产品 Claude Code 的持续破圈,影响力逐渐从技术圈外溢,也揭示了一个道理:Agent的天花板,依然由底层大模型决定。

当应用层的交互红利被吃透后,竞争会回归到模型本身。Manus展示了过程,但受限于模型对虚拟环境的适配度、API成本和推理稳定性,它依然难以成为大家日常工作的依赖。与此同时,国内外的其他基模创业公司——无论是 OpenAI 还是国内的DeepSeek、Kimi——都已将Agent作为发力方向:通过把 Agent 能力直接“内化”进模型里。

但这并不意味着第三方Agent创业者的末日,一个更有价值的方向已经浮出水面:基于独有知识库的深度Agent当通用执行力被第一方产品“内化”成模型能力时,第三方 Agent 的核心竞争力就从“执行力”转向了“信息不对称”。

最典型的例子是金融研报 Agent。一个能够调取过去二十年、数百万份非公开独家研报数据库,并能根据这些高价值信息进行分析的 Agent,其价值远超一个只能翻翻网页的通用工具。在法律、医疗、审计等垂直领域,这种基于孤岛数据构建的Agent产品,才是第三方厂商真正能守住的护城河。

现在,行业正处于一个微妙的瓶颈期:基模的 Agent 能力在飞速提升,不同的基模厂商会有各自希望重点突出的 Agent 能力侧重点,但在产品形态上,大多数厂商还在摸索,试图找到让这些能力真正渗透进普通人日常工作流的路径。

02
A
gent的“iPhone时刻”:从炫技到日常

所有现在的 AI 助手,终将进化为 Agent。这已是行业共识。

如果说 2025 年是 Agent 的“功能机时代”——大家还在比拼谁能多轮联网搜索、谁调用的工具多;那么2026年,行业正在呼唤Agent“iPhone时刻这场战争的决胜点在于两端:一端是模型原生 Agent 能力的硬核比拼,另一端是产品设计的范式革命。

在国内的赛场上,这种角逐尤为激烈。

最早嗅到这一气息并拿到入场券的,是Kimi判断一个产品是否切中刚需,有一个极具中国特色的指标——“闲鱼认证”。在 Kimi 在25年6月上线“深度研究”功能,由于免费用户能使用的次数有限,闲鱼上出现了大量倒卖付费会员次数和代跑服务的现象。这种“求而不得”,验证了用户对于“AI 帮我做完一件事”的真实渴望。


随后的故事不仅发生在应用层。Kimi 推出的 K2 模型,是国内较早旗帜鲜明主打 Agentic 能力的基座模型。这直接催生了 Kimi 的通用 Agent 模式。与传统的“聊天框”不同,Kimi 的 Agent 模式更像是想要打造一个全栈能力的虚拟工作环境。通过Agent模式,Kimi尝试打破对话的边界:从处理百万行 Excel 数据到生成复杂的 PPT,它不再是“聊完即走”,而是像人类一样,从列计划、做调研开始,一步一步去完成一个项目。

2025 年双 11 期间,随着 Kimi 编程套餐的上线,他们也推出了 Kimi CLI 工具。这是一款在命令行里运行的 Agent,与 Anthropic 的 Claude Code 类似,专门服务于开发者的代码场景,但也开始外溢到非技术人员的非编码工作场景。

与此同时,国内战局并未大定。DeepSeek 新模型主打的重点是 Agent 能力。智谱选择了一条差异化的路径,他们开源了 Phone Use 模型。这个模型更侧重于通过视觉识别,像人手一样去操作现有的手机App 界面……

03
聊天时代结束,中国的Anthropic竞赛开始

ChatGPT 开启的 Chat 时代也正在落幕。

未来的AI助手,衡量标准将变得非常务实:能不能帮我定位这个线上 Bug,自行搜索解决方案,写好修复代码,跑通测试,并把补丁推上线?能不能帮我整理完这 200 份财报并画出图表?能不能帮我把本周 5 场产品评审会的录音听完,整理出所有需求变更点,同步更新到 PRD 文档,并自动在项目管理软件里创建好对应的开发任务?

在这场从“聊”到“做”的转型中,Anthropic 提供了一个参考样本。从早期的 Claude Code 到最近刚刚上线、面向大众协作的 Cowork,尽管 Cowork 作为一个新产品,其实际体验和用户口碑还有待时间验证,但它所代表的方向是清晰的:最强大的Agent,一定来自基模厂商。

在中国,谁能成为那个“中国的 Anthropic”?

答案不在于谁的模型跑分更高,而在于谁能最先做出第三代 AI 助手。这个助手需要满足三个严苛的条件:

第一、它必须具备原生的Agent能力,而不是靠外部提示词工程堆砌出来的“伪智能”;

第二、它必须能处理长时任务(Long-horizon tasks),能像人类员工一样,为了一个目标连续工作数小时甚至数天,而不是聊几句就“断片”;

第三、它必须拥有闭环的数据飞轮,让每一次任务执行的成败,都能成为模型进化的养料。

在这个维度上,国内的模型创业者们正在加速。行业看到,DeepSeek 选择了能把Agent推理价格持续降下去的底层方案做突破,暂时没有在产品层发力;而 Kimi 依托自己的K2系列模型Agent 能力,在“深度研究”“PPT””数据分析“等生产力场景上有了忠实用户群,也初步验证了他们的会员付费能力。智谱则通过开源AutoGLM模型,想让会操作手机的Agent给每个人日常生活带来帮助。

对于用户而言,谁是“中国的 Anthropic”并不重要。重要的是,当那个对话框消失,取而代之的是一个真正能独立思考、并在后台默默把活儿干完的帮手时,市场才算真正迎来了 Agent 的时代。

毕竟,最好的AI,不是让你惊叹技术有多强,而是能让你觉得自己有多强。

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
卢比奥驱逐伊朗前副总统儿子一家,苏莱曼尼侄女求救

卢比奥驱逐伊朗前副总统儿子一家,苏莱曼尼侄女求救

移光幻影
2026-04-12 18:52:51
柏林联合官方:女主帅埃塔接任鲍姆加特执教到赛季末;成德甲首位女性主帅

柏林联合官方:女主帅埃塔接任鲍姆加特执教到赛季末;成德甲首位女性主帅

懂球帝
2026-04-12 06:41:05
纽卡悄悄爬到第3,水晶宫保级无忧后踢得像在交作业

纽卡悄悄爬到第3,水晶宫保级无忧后踢得像在交作业

篮坛第一线
2026-04-12 18:33:03
伊朗果然上当!24小时不到,以色列大量回血,70架运输机抵达中东

伊朗果然上当!24小时不到,以色列大量回血,70架运输机抵达中东

轩逸阿II
2026-04-12 03:11:24
卡塔尔宣布12日起“全面恢复海上航运”

卡塔尔宣布12日起“全面恢复海上航运”

界面新闻
2026-04-12 12:20:27
4.12日早评|谈崩了!美伊未达成协议!A股要爆了!

4.12日早评|谈崩了!美伊未达成协议!A股要爆了!

龙行天下虎
2026-04-12 11:46:41
黎巴嫩一国两军:真主党这个“国中之国”,为何彻底绑架黎巴嫩?

黎巴嫩一国两军:真主党这个“国中之国”,为何彻底绑架黎巴嫩?

环球情报员
2026-04-11 21:23:51
字节员工:工作9年,北京全款房子一套,40多万的车,存款237万

字节员工:工作9年,北京全款房子一套,40多万的车,存款237万

蚂蚁大喇叭
2026-04-12 16:57:57
雪浪环境将被“ST”,公司股价年内涨超130%,“90后”中科院博士或成新实控人

雪浪环境将被“ST”,公司股价年内涨超130%,“90后”中科院博士或成新实控人

红星资本局
2026-04-12 19:36:53
全民考公考编,是这个时代的悲哀。

全民考公考编,是这个时代的悲哀。

老陆不老
2026-04-12 12:19:50
苹果高管晒娃照片,开发者集体盯上键盘数字

苹果高管晒娃照片,开发者集体盯上键盘数字

报错免疫体
2026-04-11 08:42:53
网友提醒刘芸注意儿子内八问题,郑钧在线回应,感谢云爹妈操碎心

网友提醒刘芸注意儿子内八问题,郑钧在线回应,感谢云爹妈操碎心

露珠聊影视
2026-04-11 15:14:00
中将在芜湖当地委副书记,毛主席大怒:重新分配,就说是我要求的

中将在芜湖当地委副书记,毛主席大怒:重新分配,就说是我要求的

墨道荣
2026-04-12 09:56:26
别被骗了!宋朝官帽那两根“翅膀”,根本不是用来防交头接耳的

别被骗了!宋朝官帽那两根“翅膀”,根本不是用来防交头接耳的

疯狂的小历史
2026-04-11 08:47:51
晚间公告丨4月12日这些公告有看头

晚间公告丨4月12日这些公告有看头

新浪财经
2026-04-12 18:39:22
穿过你的裆下的我的手?美媒晒图:勇士为了防詹姆斯啥招都用

穿过你的裆下的我的手?美媒晒图:勇士为了防詹姆斯啥招都用

懂球帝
2026-04-12 16:24:20
男子出门上班把5个月大的孩子留在家,宝宝躺在床上不哭不闹自己玩,男子:每4个小时回来一次给孩子喂奶,我也不想这样的,可要挣钱

男子出门上班把5个月大的孩子留在家,宝宝躺在床上不哭不闹自己玩,男子:每4个小时回来一次给孩子喂奶,我也不想这样的,可要挣钱

观威海
2026-04-11 17:40:04
遇上这样“奇葩邻居”,我连夜挂中介卖房,只想过个普通人的生活

遇上这样“奇葩邻居”,我连夜挂中介卖房,只想过个普通人的生活

家居设计师苏哥
2026-03-14 13:13:59
哇,这大身板,丰腴有度,放到唐朝不是皇后,也得是个贵妃

哇,这大身板,丰腴有度,放到唐朝不是皇后,也得是个贵妃

可乐谈情感
2026-04-12 08:22:47
伊朗果然上当!24小时不到,以色列大量回血,70架运输机抵达中东

伊朗果然上当!24小时不到,以色列大量回血,70架运输机抵达中东

老赳说历史
2026-04-12 13:39:50
2026-04-12 21:08:49
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7184文章数 20744关注度
往期回顾 全部

科技要闻

理想称遭恶意拉踩,东风日产:尊重同行

头条要闻

上海阿婆被"干儿子"分80次转走95万气瘫 毕生积蓄没了

头条要闻

上海阿婆被"干儿子"分80次转走95万气瘫 毕生积蓄没了

体育要闻

创造历史!五大联赛首位女性主教练诞生

娱乐要闻

赌王女儿何超蕸病逝,常年和乳癌斗争

财经要闻

美伊谈判破裂的三大症结

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

旅游
教育
亲子
本地
公开课

旅游要闻

秀美风光汇成“海”,北京密云发布城市新名片

教育要闻

难哭学霸的思维题,家长都不会做

亲子要闻

有些孩子就爱打着和你玩的名义占你便宜

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版