网易首页 > 网易号 > 正文 申请入驻

Agent接管工作流后,企业最在意的三件事

0
分享至

阿里云容器服务负责人易立每天和超过2500个智能体协作的同事一起工作。这位同事用10个月重写了过去团队10年才能完成的代码库,每天消耗Token超过10亿。这不是科幻场景,而是Agentic AI爆发后的真实工作流。

Agent正在从实验走向生产。Docker《State of Agentic AI》报告显示,94%的受访者在开发或生产环境中使用容器,其中98%延续了传统云原生工作流。行业没有舍弃已有基础设施,反而更加依赖这些经过验证的交付和治理能力。


这种转变把一批过去不够显眼的基础设施问题推到台前。过去两年,市场谈AI算力有一种简化认知:几乎等同于GPU。类似的简化也发生在云上——云计算等同于"租算力"。这套认知已经脱离产业事实。

AI产业正从单纯聚焦模型训练,转向同时重视部署、推理效率与真实应用落地。Agent负载变得更碎片化、更动态,也更依赖高频任务调度、内存管理、工具调用与系统编排。云计算和CPU都被委以新的使命。

CPU正在重新获得更高关注度。Agent负载的特点催高市场对高核心数CPU的需求,尤其在云端多租户、沙箱执行、会话并发和多Agent协作等场景里,CPU承担任务编排、执行铺开与资源调度的关键职责。AMD全球副总裁、中国区互联网事业部总经理刘宏兵表示,过去几个月公司一直在尽最大可能保障客户需求及AI基础设施。

云计算的角色也在变化。阿里云智能集团研究员、容器服务负责人易立指出,过去云主要提供算力,现在还要提供让智能体安全运行、稳定交付、持续进化的平台能力。作为云原生操作系统,容器的重要性再次凸显——它是Agent在云端部署的主流承载方式,提供标准化、轻量隔离的运行环境,协同编排系统实现任务调度、弹性扩容。

这背后对应的,正是Agent开发和使用者最在意的三件事:安全、稳定和可持续迭代。最近爆火的Agent项目,包括Kimi深度研究、通用Agent模式"OK Computer"、MiniMax的MaxClaw、MaxHermes等产品,背后都有阿里云支撑,而AMD也为阿里云提供底层算力支撑。

易立已把Agent真正嵌入工作流。他在不同环境部署不同角色的Agent:云上Agent在上班路上提前整理关注的新闻、热点和技术论文;SRE Agent 24小时值守,帮助分析线上集群问题、处理异常;桌面端Agent负责日程整理、技术规划、会议安排和纪要输出。

与此同时,一些平台开始让Agent之间直接通信与协作,智能体逐渐形成网络结构。刘宏兵打趣说,也许未来会出现一个"龙虾社会"——当越来越多人同时拥有、调用、依赖多个Agent,而这些Agent又彼此协作时,这个说法正在变成现实。

这轮增长不只是技术能力带来的,也与商业闭环比过去更快有关。刘宏兵提到,互联网客户过去一直有时间焦虑——前期大规模投入究竟何时真正变现。无论是早年云计算还是后来的AI,产业都曾经历很长投入期。这一轮Agent热潮的特别之处在于,从模型、平台到应用,整个链条变现速度明显加快。

随着Agent应用规模化落地,AI工作负载正经历结构性分化。与传统软件处理确定性任务不同,Agent需面向开放式目标自主决策、持续环境交互与长链路任务执行。这种范式转变使Agent在应用、推理与训练三个层面呈现不同技术特征。

应用层面,Agent不再仅是文本生成,它可以调用工具、连接系统、执行代码。安全、隔离和可控性成为首要前提。每个Agent都需要运行在沙箱环境中,依托计算、存储和网络的协同控制。Agent常将复杂任务拆解成多步并行操作,对冷启动延迟、并发吞吐能力提出高要求。任务跨越多轮对话和多阶段执行,状态保存与休眠唤醒能力成为保障连续性和降低成本的关键。

推理层负载特征也发生显著变化。Agent的上下文窗口不仅包含用户指令,还需动态嵌入规则定义、工具返回数据及历史交互轨迹,导致内存占用与计算开销呈非线性增长。这要求底层架构打破单一GPU加速的传统思路,转向CPU、GPU、内存与高速网络的协同优化。

易立还指出,Agent模型训练与传统预训练很不一样。传统预训练更关注GPU性能,但Agent模型必须在真实场景中模拟、学习复杂任务决策,其能力很大程度上取决于对工具调用的掌控。这意味着CPU计算吞吐、内存带宽以及分布式调度架构的协同效率,反而成为影响训练迭代速度的关键瓶颈。

整体而言,Agent Infra的核心命题早已不再是高效运行模型,而是实现智能体的安全隔离、状态管理与规模化运行。AI负载的变化也在改变行业真正关心的指标。刘宏兵说,过去大家更关注模型刷分,看榜单、看参数、看单点能力;但到了生产环境里,客户最终关心的是能不能稳定交付业务结果,以及端到端体验和ROI。

在这种前提下,Agent Infra至少要解决四个问题:强隔离、高并发和低时延、状态和记忆管理,以及长链路执行。

首先是强隔离。Agent不只是生成文本,它还会调用工具、连接系统、执行代码,安全风险远高于传统AI应用。多租户环境下,一个Agent的异常行为不能影响其他Agent或底层基础设施。这要求容器和虚拟化技术提供更细粒度的隔离机制,同时保持足够轻量以避免性能损耗。

高并发和低时延是第二个挑战。Agent工作流的碎片化特征意味着大量短生命周期任务需要快速启动和销毁。当用户同时触发多个Agent协作时,系统需要在毫秒级完成资源分配和环境初始化。这对云平台的调度算法、缓存策略和预热机制都提出更高要求。

状态和记忆管理是Agent区别于传统应用的关键。Agent需要在多轮交互中保持上下文连续性,支持随时休眠和唤醒。这意味着平台必须提供可靠的状态持久化方案,同时优化存储成本——毕竟并非所有Agent都需要24小时常驻内存。

长链路执行则考验系统的容错和可观测性。一个复杂任务可能涉及数十个步骤、跨多个Agent协作、持续数小时甚至数天。任何中间环节失败都需要精准定位、快速恢复,而非从头重来。这要求基础设施具备细粒度的执行追踪、中间状态检查和断点续传能力。

面对这些需求,云计算和芯片厂商正在调整各自的技术路线。阿里云在容器服务层面强化了对Agent工作负载的原生支持,包括更灵活的资源配额策略、更智能的弹性伸缩机制,以及针对长链路任务的专项优化。AMD则在CPU产品线上加大高核心数、大内存带宽型号的供给,并与云厂商深度协同优化调度效率。

双方的合作体现在具体的技术细节中。例如,针对Agent沙箱启动延迟问题,阿里云与AMD联合优化了CPU的虚拟化开销和内存初始化速度;针对多Agent协作场景,双方共同测试了不同核心数配置下的任务编排效率,找到性价比最优的硬件组合。

这种协同正在成为一种行业范式。当Agent从单点工具演变为工作流核心,基础设施的边界也在模糊——云不再是简单的资源池,芯片也不再是纯粹的算力单元,两者需要围绕Agent的实际运行特征重新耦合。

刘宏兵观察到,客户询价时的关注点已经变化。过去问的是"你们GPU多少钱",现在问的是"跑我这个Agent场景,端到端成本多少、稳定性如何"。这种从硬件参数到业务结果的视角转换,正在重塑云厂商和芯片厂商的产品定义方式。

易立则强调,容器作为承上启下的关键层,需要同时向上理解Agent的应用语义,向下调度异构算力资源。这要求容器平台具备更强的智能——不是简单的资源分配,而是基于任务特征预测资源需求、预判瓶颈位置、主动优化执行路径。

回到企业最在意的三件事:安全运行、稳定交付、持续进化。这三者构成了Agent时代基础设施的评估坐标。安全运行是底线,没有隔离保障,Agent无法进入生产环境;稳定交付是能力,考验端到端的工程成熟度;持续进化则是长期竞争力,决定企业能否在快速迭代的技术浪潮中保持领先。

当Agent开始真正接管工作流,基础设施的竞赛规则已经改写。不再是单点性能的比拼,而是全栈协同的效率;不再是技术参数的堆砌,而是业务价值的兑现。云计算和芯片厂商正在这条新赛道上重新站位,而企业的选择标准也愈发清晰——谁能把Agent跑得更稳、更省、更可持续,谁就能赢得下一个阶段的基础设施话语权。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
林诗栋处罚尘埃落定 国际乒联公开力挺 少年不负乒乓荣光

林诗栋处罚尘埃落定 国际乒联公开力挺 少年不负乒乓荣光

乐悠悠娱乐
2026-05-14 15:31:27
中行将关停独立信用卡App,系国有大行首例

中行将关停独立信用卡App,系国有大行首例

看看新闻Knews
2026-05-14 22:28:06
印度举办的金砖峰会,王毅外长不去了,给出的理由新德里只能接受

印度举办的金砖峰会,王毅外长不去了,给出的理由新德里只能接受

牛锅巴小钒
2026-05-15 01:42:27
俄总统新闻秘书:只要美国不再把经贸合作与乌克兰问题挂钩,俄愿同美开展商业往来

俄总统新闻秘书:只要美国不再把经贸合作与乌克兰问题挂钩,俄愿同美开展商业往来

极目新闻
2026-05-14 09:58:58
周总理只是让他去经商,为党赚取经费,他却给组织赚回个商业帝国

周总理只是让他去经商,为党赚取经费,他却给组织赚回个商业帝国

文史达观
2026-04-18 09:29:56
73岁车田正美再执笔,圣斗士星矢天界篇第一话正式登场!

73岁车田正美再执笔,圣斗士星矢天界篇第一话正式登场!

坠入二次元的海洋
2026-05-14 18:04:37
女大十八变,全红婵近照美到认不出,少女感十足,气质温婉又灵动

女大十八变,全红婵近照美到认不出,少女感十足,气质温婉又灵动

黔乡小姊妹
2026-05-15 08:15:14
5月14日,广东队传来3大消息:徐杰表态 萨林杰想降薪 奖金正常发

5月14日,广东队传来3大消息:徐杰表态 萨林杰想降薪 奖金正常发

锅锅爱历史
2026-05-14 14:09:35
不要错过!5月15日早上09:00比赛!中央5套CCTV5、CCTV5+直播表

不要错过!5月15日早上09:00比赛!中央5套CCTV5、CCTV5+直播表

寒律
2026-05-15 06:42:55
刘震云:当你一无所有时,死心塌地跟着你的女人,就是你的贵人

刘震云:当你一无所有时,死心塌地跟着你的女人,就是你的贵人

杏花烟雨江南的碧园
2026-04-29 14:15:03
张本美和真敢说!发布会直言:王曼昱赛场胆怯,出手不果断太犹豫

张本美和真敢说!发布会直言:王曼昱赛场胆怯,出手不果断太犹豫

观鱼听雨
2026-05-14 22:25:52
“十年烧烤无人问,一墙书法天下知!”女孩在父亲店写《将进酒》

“十年烧烤无人问,一墙书法天下知!”女孩在父亲店写《将进酒》

一丝不苟的法律人
2026-05-12 21:58:34
《给阿嬷的情书》总票房破2亿!制片人曾说:“我说票房能过亿,他们觉得我疯了”

《给阿嬷的情书》总票房破2亿!制片人曾说:“我说票房能过亿,他们觉得我疯了”

上观新闻
2026-05-14 12:36:09
特斯拉中国官宣全新优惠,5.59 万即可提 Model 3 了!

特斯拉中国官宣全新优惠,5.59 万即可提 Model 3 了!

XCiOS俱乐部
2026-05-13 14:22:27
吃过大亏才清醒:愚蠢的人逢人就诉苦,聪明的人到处讲道理,而真正通透的人,早已悟透这两条闭嘴天规

吃过大亏才清醒:愚蠢的人逢人就诉苦,聪明的人到处讲道理,而真正通透的人,早已悟透这两条闭嘴天规

心理观察局
2026-05-15 08:30:07
参宿四爆炸后,地球夜空会亮如白昼,至少半年不用开灯了

参宿四爆炸后,地球夜空会亮如白昼,至少半年不用开灯了

观察宇宙
2026-05-13 20:18:32
恭喜!陈思诚又当爹!26岁小女友晒生日照,一脸孕相得到父母认可

恭喜!陈思诚又当爹!26岁小女友晒生日照,一脸孕相得到父母认可

八卦王者
2026-05-14 11:39:43
白宫记者随专机抵京,被解放军军姿震撼拍爆外网,登上头条!

白宫记者随专机抵京,被解放军军姿震撼拍爆外网,登上头条!

大稻网络科技
2026-05-14 09:11:51
女子称丈夫买榴莲时将1万错付成11万,几个月后联系商家退款却被告之已退还,当事人:当时销售知道多付了钱,让财务把钱退到他自己账户了

女子称丈夫买榴莲时将1万错付成11万,几个月后联系商家退款却被告之已退还,当事人:当时销售知道多付了钱,让财务把钱退到他自己账户了

潇湘晨报
2026-05-14 20:45:03
《歌手2026》终版确认:首发9位歌手,2位国际,刘宪华缺席

《歌手2026》终版确认:首发9位歌手,2位国际,刘宪华缺席

音乐钢琴娱乐咖
2026-05-14 11:55:06
2026-05-15 09:08:49
闪存猎手
闪存猎手
全网蹲好价的野生捕手,算力与羊毛都不可辜负。
2766文章数 26关注度
往期回顾 全部

科技要闻

两年联姻一地鸡毛,传苹果OpenAI濒临决裂

头条要闻

欢迎宴会座位公开:马斯克黄仁勋与中国企业家同桌吃饭

头条要闻

欢迎宴会座位公开:马斯克黄仁勋与中国企业家同桌吃饭

体育要闻

争议抽象天王山,和季后赛最稳定中锋

娱乐要闻

何九华官宣当爸!全程不提孩子妈

财经要闻

特朗普的北京时刻

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

游戏
健康
家居
手机
军事航空

万字解析:大叔萝莉的组合为什么经久不衰?"/> 主站 商城 论坛 自运营 登录 注册 万字解析:大叔萝莉的组合为什么经久不衰? 神堡薛师傅 2026-0...

专家揭秘干细胞回输的安全风险

家居要闻

精神奢享 对话塔尖需求

手机要闻

英特尔试产苹果部分A/M系列芯片 台积电独家代工地位或就此松动

军事要闻

乌克兰首都基辅遭空袭 死亡人数增至12人

无障碍浏览 进入关怀版