网易首页 > 网易号 > 正文 申请入驻

效率狂飙数倍后:Coding Agent已然成熟,但开放世界仍是“无人区”

0
分享至


作者|冬梅

如果说 2024 年是属于大模型的“奇迹之年”,那么刚刚过去的 2025 年,则可以被定义为 Agent(智能体)的“工程落地元年”。

在技术圈的语境里,大模型正经历从“被动问答”到“主动干活”的范式转移。过去没有 Agent 的时候,大模型是在被动地回答问题;Agent 诞生后,它变成了主动执行。这不仅仅是业务模式的变化,更是从聊天程序到生产组件的根本性变革。

但这种根本性的变革却不是一蹴而就的,而是由多个重要的、里程碑式的“协议”和框架强力驱动的。这一点与早期互联网协议定义推动 Web 应用爆发式增长的逻辑类似——标准化不是为了漂亮的规范,是要真正去解决跨系统、跨场景、跨团队协作的实际工程痛点。

1 2025 年,两大协议推动了 Agent 应用的爆发

阿里云容器计算服务 ACS Agent Sandbox 技术负责人黄涛在最近的一次深度对谈中将其归结为三个关键事件:MCP 协议的爆火、A2A 协议的发布,以及多智能体协同的工程化实现。

首先是 Anthropic 发布的 MCP(Model Context Protocol,模型上下文协议),旨在定义 AI 模型如何访问外部工具、数据库和服务的标准化方式。与过去每个模型厂商根据自有接口定制不同,MCP 提供了类似 “USB-C 接口” 的统一协议,使得智能体能跨平台访问外部能力。

例如,MCP 能够让智能体通过统一的协议访问数据库、库存系统、工作流 API 等,而不需要针对每种服务和接口写特定的适配代码。 这种标准化的好处,在企业级应用场景中尤为显著:

  • 减少集成成本:应用方不再为大量不同的 API 写 glue code。

  • 提升可靠性与一致性:统一格式、统一调用流程让错漏减少。

  • 加速自动化能力落地:智能体能快速理解系统数据并据此执行任务。

起初,这看起来只是一个单纯的技术协议,但在刚刚过去的一整年,它彻底引爆了应用层。

以阿里集团内部为例,为了加速 AI 在电商领域的渗透,阿里孵化出了名为“TMCP”的电商 MCP 网关平台。大量业务方通过编写 MCP Server,将复杂的供应链、库存数据、用户信息等通过标准化协议“喂”给 Agent。

“MCP 解决的是 Agent 看世界、调工具的‘语言统一’问题。”黄涛解释道。以前 Agent 调用工具需要针对每个接口做定制,现在有了标准网关,Agent 可以更快速地理解客户需求,从一个只会聊天的程序,变成真正能调度阿里复杂业务逻辑的“超级组件”。

此外,另一款协议也值得重点关注。Agent-to-Agent(A2A)是由谷歌发布的,其核心目标是定义智能体间的“通用语言”和协作规范,使不同背景、不同厂商或不同开发框架下的智能体,可以像微服务一样,通过标准化方式互相发现、协商任务、交换状态、协调工作流。

这类似于 Web 发展的历史中 HTTP、REST API 为服务间通信提供标准一样——如果没有可互操作的通讯协议,大规模协作系统无法自然形成。

在过去,不同功能的 Agent 之间想要对话,往往需要开发者编写极其复杂的“粘合代码”。而 A2A 标准的出现,意味着不同背景、不同厂商的 Agent 可以像人类员工一样,通过一套标准的交互准则进行协作。

协议能力上看,MCP 与 A2A 都可以用于描述智能体之间的交互,但二者的设计侧重点存在差异。MCP 更强调通用的调用与连接能力,统一智能体与外部工具、系统乃至其他智能体的交互方式;相比之下,A2A 在设计上更聚焦于多智能体场景本身,试图为智能体之间的协作、状态同步与交互模式提供更直接的抽象支持。因此,在早期多 Agent 系统实践中,即便采用了 MCP 这类通用协议,智能体之间的协调逻辑仍常常依赖开发者手工实现,难以随着系统规模的增长而自然演进。

与此同时,Manus 等框架提出的多智能体协同概念,不仅停留在交互层,更深入到了底层的基座能力。比如安全沙箱(Sandbox)技术的引入,解决了 Agent 在执行代码或处理敏感数据时的隔离问题,让“协作”不再是裸奔。

2 繁荣背后的工程陷阱:多 Agent 协作的“收敛性”困局

尽管应用层呈现爆发趋势,但当 Agent 真正走进企业级生产环境时,工程性挑战接踵而至。最让开发者头疼的,莫过于多 Agent 协作中的“低效”与“幻觉”。

OpenAI CEO 奥特曼曾描绘过一个超级个体带领一堆 Agent 协作的未来。但在实际操作中,守辰发现了一个尴尬的现实:Agent 之间会产生大量“无效沟通”。

“多个 Agent 协作时,经常会出现不聚焦的情况,聊着聊着就聊开了。”阿里云智能容器服务高级专家, OpenKruise Agents 项目发起人张振举例说,有些框架下,Agent 之间会互相委派任务,甚至出现死循环。这种“社交式发散”直接导致了 Token 消耗的激增,但最终得到的推理效果却可能不如一个定义明确的单 Agent。

这种成本不仅仅是金钱上的,更是算力资源的浪费。对于企业而言,如何量化 Agent 之间的协作模式,识别并固化有效的沟通路径,避免像人类会议一样的“低效扯皮”,是目前的重难点。

另一个挑战在于 Agent 的“自制能力”尚浅。在传统的 BPM(业务流程管理)或 RPA(机器人流程自动化)领域,追求的是强约束、强工程化。

目前的 Agent 虽然有灵性,但离完全自制还有很大差距。黄涛认为,现阶段 Agent 与 BPM 的关系并非“替代”,而是“融合”。“我们要给 Agent 定义清晰的边界和子系统,明确它的输入、输出和约束,而不是把它当作一个泛化的、人格化的机器人。”

在阿里的实践中,开发者尝试在现有的工具流中加入 Agent 节点,让它处理那些“不那么确定”的子任务,而将确定性的逻辑依然留给脚本或流程引擎。

黄涛的这一观点,为 Agent 当前的发展阶段进行了精准锚定。它摒弃了不切实际的科幻幻想,转而拥抱一种务实、可工程化的演进路径:Agent 并非一个从天而降、全知全能的“取代者”,而是一个需要被精心设计和集成到现有生产体系中的“增强组件”

这种“融合”思维,决定了 Agent 价值的兑现方式——它必须深入具体业务的血肉之中,在解决真实痛点、优化既有流程的过程中证明自己。那么,Agent 究竟在哪些场景里产生了真实价值?

业内普遍认为,最先被 Agent 攻陷的堡垒是编程和运维。

AI Coding 是目前 Agent 落地最成熟、收益最可观的领域。黄涛分享了自己的体感:“以前写一段代码需要一个小时,现在 Agent 一分钟生成,我再改个十来分钟,效率提升是巨大的。”

更显著的变化发生在自动化运维。2024 年的运维 AI 更多是基于 RAG 查手册,而 2025 年的 Agent 则学会了“模仿工程师经验”。当系统报错时,Agent 会自动执行一系列命令去定位问题,甚至能感知真实的运行环境并做出反馈。

张振对 2026 年最期待的突破点是“开放世界训练”。随着 Agent 被装进手机(如字节跳动与中兴的合作)或机器人(如宇树机器人),它面临的是未知的、非实验室的环境。一个典型的挑战是:Agent 操作某个 App 时被封禁了,它该怎么办?

“让 AI 知道自己不知道,是走向真智能的关键一步。”张振提到。阿里云正在通过发布像 OpenKruise Agents 这样的基础设施,提供检查点(Checkpoint)和克隆功能,来加速这种在开放世界中的训练效率。值得一提的是,OpenKruise Agents 是阿里云容器计算服务 ACS 的 Agent Sandbox(ACS Agent Sandbox)逐步开源的能力之一。与 OpenKruise Agents 不同,ACS Agent Sandbox 面向企业级 AI Agent 应用规模化落地,内存级休眠唤醒与 checkpoint 克隆能力 ,支持结合云端弹性调度与微虚拟化隔离,以缩短沙箱启动与恢复时间,提升并行探索效率以及降低训练成本。

3 Agent 的终极形态:超级自动化还是数字员工?

从攻克编程与运维的确定性堡垒,到勇敢迈向充满未知的开放世界训练,Agent 的能力边界正在实践中被不断拓展和重新定义。

这种从“专用工具”到“适应环境”的演进路径,自然引发了更深层次的思考:Agent 进化的终点究竟在何处?是成为无所不能的超级自动化智能,还是先成为我们身边协同工作的可靠伙伴?

关于 Agent 的终极形态,黄涛和张振两位专家给出了略有分歧但互补的视角。

黄涛的视角更偏向“高度自制的智能体”:他认为 Agent 最终会演化成在家庭助理、工厂、无人驾驶等场景中完全自主运行的实体。它能完美感知环境差异,自主决策,彻底解放人类。

而张振的视角则更务实,倾向于“数字员工”:他认为短期内,AI Agent 会以数字员工的身份在企业中入职。“员工”这个角色方便企业进行 KPI 评估,也方便人类与之协作。

尽管愿景不同,但共识已成:Agent 将不再是特定领域的应用,而是一种像数据库、中间件一样的“新兴基础设施”。

这一年,我们经历了对 Agent 能力的盲目崇拜,也正在经历对其工程化落地的痛苦磨合。当 MCP 协议把业务的大门敲开,当沙箱技术把安全的篱笆扎紧,当开放世界训练让 AI 开始学会“思考”,Agent 就不再是 PPT 上的概念,而是真正开始改变生产力逻辑的底层变量。

正如张振所强调的那样,AI 可能无法立即成为那个“超级智能体”,但它会以无数个“数字员工”的身份,渗透进代码的每一行、运维的每一次报警、以及每一个复杂的商业决策中。

这才是 Agent 时代的真实叙事:不在于取代,而在于进化。

采访嘉宾简介:

  • 黄涛 ,阿里云容器计算服务 ACS 技术负责人

  • 张振,阿里云智能容器服务高级专家, OpenKruise Agents 项目发起人

会议推荐

InfoQ 2026 全年会议规划已上线!从 AI Infra 到 Agentic AI,从 AI 工程化到产业落地,从技术前沿到行业应用,全面覆盖 AI 与软件开发核心赛道!集结全球技术先锋,拆解真实生产案例、深挖技术与产业落地痛点,探索前沿领域、聚焦产业赋能,获取实战落地方案与前瞻产业洞察,高效实现技术价值转化。把握行业变革关键节点,抢占 2026 智能升级发展先机!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中日交恶80天后,高市痛哭流涕,中方停止仁慈,董军已通知俄罗斯

中日交恶80天后,高市痛哭流涕,中方停止仁慈,董军已通知俄罗斯

乐天闲聊
2026-01-30 14:42:42
广东捕获蓝环章鱼,男子上手摸被警告:一只能干掉26个成年人!

广东捕获蓝环章鱼,男子上手摸被警告:一只能干掉26个成年人!

狸猫之一的动物圈
2026-01-29 10:35:02
国民党赴陆交流遭绿营攻击,萧旭岑:反映主流民意,不能够退缩

国民党赴陆交流遭绿营攻击,萧旭岑:反映主流民意,不能够退缩

海峡导报社
2026-01-30 12:14:08
楼兰是犯了什么天条吗?让中原人如此痛恨,古诗里一堆“斩楼兰”

楼兰是犯了什么天条吗?让中原人如此痛恨,古诗里一堆“斩楼兰”

收藏大视界
2025-12-16 18:48:56
50岁张智霖自曝无性生活:结婚十年,就是睡一张床的兄弟

50岁张智霖自曝无性生活:结婚十年,就是睡一张床的兄弟

素衣读史
2026-01-27 18:11:39
星光黯淡!海斯布莱恩特参加扣篮大赛 三届扣篮王麦克朗不再参赛

星光黯淡!海斯布莱恩特参加扣篮大赛 三届扣篮王麦克朗不再参赛

罗说NBA
2026-01-30 06:38:29
中方下达两则通告,态度明确划红线,不许高市早苗肆意妄为

中方下达两则通告,态度明确划红线,不许高市早苗肆意妄为

纪中百大事
2026-01-30 14:24:56
新冠病毒3大结局已经不可避免,60岁以上的老年人尤其要注意

新冠病毒3大结局已经不可避免,60岁以上的老年人尤其要注意

医护健康科普
2025-08-31 17:07:58
别去撩中年女人:她不是猎物,是你惹不起的人间清醒

别去撩中年女人:她不是猎物,是你惹不起的人间清醒

青苹果sht
2026-01-13 03:43:56
黄磊女儿黄多多有意进圈,脸是真的小,身材也是真的好,应该会爆

黄磊女儿黄多多有意进圈,脸是真的小,身材也是真的好,应该会爆

民间平哥
2026-01-18 21:36:22
这6个家居习惯,你以为很干净,实际却很脏,可惜很多人没察觉!

这6个家居习惯,你以为很干净,实际却很脏,可惜很多人没察觉!

家居设计师苏哥
2026-01-30 12:48:15
一口气搞懂16种酒,吹牛更显学问

一口气搞懂16种酒,吹牛更显学问

混知
2026-01-09 12:27:20
雷军没想到,离过年仅20天,刘强东走上王宝强之路

雷军没想到,离过年仅20天,刘强东走上王宝强之路

大眼妹妹
2026-01-30 04:14:39
悲剧!35岁男子自行泡制中药汤,中毒丧命,医生:含有剧毒乌头碱

悲剧!35岁男子自行泡制中药汤,中毒丧命,医生:含有剧毒乌头碱

上观新闻
2026-01-30 11:39:10
20分惨败+篮板完爆!新疆崩塌不止三分17% 为何雪藏冯傲李炎哲?

20分惨败+篮板完爆!新疆崩塌不止三分17% 为何雪藏冯傲李炎哲?

去山野间追风
2026-01-30 14:57:22
美机恶意绕飞052D驱逐舰!中方指挥员果断下令瞄准,这一幕太解气

美机恶意绕飞052D驱逐舰!中方指挥员果断下令瞄准,这一幕太解气

嫹笔牂牂
2026-01-30 11:49:23
捧牢A是病态表现

捧牢A是病态表现

灰白笔记
2026-01-29 14:30:41
英国首相在云南菜馆用餐,为何近年来外国政要企业家青睐云南菜?

英国首相在云南菜馆用餐,为何近年来外国政要企业家青睐云南菜?

之乎者也小鱼儿
2026-01-29 13:37:31
下一个深圳?海口十五五规划出炉,这些区域身价暴涨,有你家乡吗

下一个深圳?海口十五五规划出炉,这些区域身价暴涨,有你家乡吗

智慧生活笔记
2026-01-29 17:32:31
670亿美元高铁梦即碎,越南竟找上“基建泥菩萨”?中国笑而不语

670亿美元高铁梦即碎,越南竟找上“基建泥菩萨”?中国笑而不语

诺诺谈史
2026-01-30 14:14:19
2026-01-30 15:35:00
InfoQ incentive-icons
InfoQ
有内容的技术社区媒体
12001文章数 51726关注度
往期回顾 全部

科技要闻

单季狂赚3000亿;iPhone 17 全球卖疯了!

头条要闻

美智库民调:近四分之三美国人预计中国将超越美国

头条要闻

美智库民调:近四分之三美国人预计中国将超越美国

体育要闻

敢揍多尔特,此子必成大器?

娱乐要闻

金晨出事前 曾灵魂发问未收到春晚邀请

财经要闻

血铅超标工人,挡在“劳动关系”门槛外

汽车要闻

全面科技化 新款梅赛德斯-奔驰S级发布

态度原创

房产
时尚
数码
艺术
军事航空

房产要闻

跨海高铁,四大新机场,G98扩容…封关元年,海南配套大爆发!

推广|| 冬天利用率超高的裙子,怎么搭都对!

数码要闻

机构:Meta Ray-Ban Display预估带动今年全球AR眼镜95万台出货量

艺术要闻

风景画选刊 | 中国油画学会三十年艺术展

军事要闻

新西兰拒绝特朗普:不加入"和平委员会"

无障碍浏览 进入关怀版