网易首页 > 网易号 > 正文 申请入驻

华为云,换一种打法

0
分享至



编辑|吴昕

这一年多来,Agent「外挂」几乎快把打工人「爽」上天。

只需一句话,它就能秒级吐出数万字深度报告,甚至直接交付一款软件。把孩子照片剪成 Vlog 发给老公,或者替你操控浏览器订机票、填表单,也不在话下。

如今,这种「起飞」的丝滑体感正在反向挤压底层云服务,掀起一场「土地」风暴。

「 4 年前做 AI 要买算力卡,3 年前要卷大模型,而今天,做 AI 就是开发和用好智能体。」在 6 月 5 日的 INSPIRE 创想者大会上,华为公司董事、华为云 CEO 周跃峰用一句话点破了行业拐点,并将一个新概念推向台前——硅基黑土地。



华为公司董事、华为云CEO周跃峰

过去,云服务被称为「算力黑土地」。企业要种 AI,先得有地、有水、有电,也就是算力、存储、网络和数据库。但 Agent 时代,它必须变成适合「种植」智能体的「硅基黑土地。」

也是在这一天,华为云一口气砸下四大层面、十余款 Agentic AI 新品。

从「算力」到「硅基」,两字之变,背后是大厂解题思路的重要转向:不再倒卖散装算力,而是重新定义 Agent 时代智能体生长和进化的底层土壤。

先把 Agentic Infra 这层土壤变厚

当一批数字「劳动力」进入企业流程,一次看似简单的任务,背后可能是几十次模型调用、多个工具链切换、一串沙箱环境启动、长时间上下文保存,以及 CPU、NPU、存储、网络之间连续不断的资源调度。

这时候,仅仅死磕模型参数、 GPU 数量,远远不够。谁能把 Token 效率、记忆、调度、安全这些底层能力做得扎实,才有可能让上面的 Agent 真正长出来。

这正是华为云提出「硅基黑土地」的原因。

在这次 INSPIRE 创想者大会上,华为云正式提出 Agentic Infra 新范式:高效 Token 工厂、持续学习、通智一体化调度、安全自治。



四个关键词,正好对应 Agent 大规模落地的四个基础难题。

第一个难题,是 Agent 不能慢。

人和聊天机器人对话,等几秒还能接受。但 Agent 要连续思考、连续调用工具、连续执行任务。每一步慢一点,整条任务链路就会被拖成「龟速」。

一旦进入客服、研发、金融风控、工业调度这些真实生产系统,慢和不稳定都会变成业务风险。

所以,华为云推出 AICS 灵衢智算集群——凭借创新性的灵衢 UnifiedBus(UB)统一总线协议+基于 SuperPoD 超节点架构,AICS 打破传统服务器的物理边界,让大规模智算集群更像一台逻辑上的「巨型计算机」,也把云底座变成了一个高效 Token 工厂。



在集群规模与算力上,最大可落地 10 万卡超大型智算集群,整体总算力达 200EFLOPS。

在 Token 生产能力上,千卡硬件每秒 Token 吞吐量达 500 万,推理单 Token 生成时延压缩至 10ms 以内,满足 Agent 实时交互、高并发在线推理需求。

在服务稳定性上,灵衢智算集群基于全链路可观测与多级快恢能力,支持在线推理服务达到 99.95% 的可用性。

第二个难题,是 Agent 不能只有「鱼的记忆」。

AMS Agentic 记忆存储解决方案,通过 PB 级记忆空间、KV Cache 分层池化、长上下文和多轮记忆管理,让 Agent 可以保存更长时间的任务状态和经验。换句话说,就是给智能体配一个更大的「工作记忆」和「长期记忆」。

这对企业级 Agent 很关键。真正的企业任务很少一次问答就结束。一个研发任务可能跑几个小时,一个数据分析任务可能跨多个系统,一个行业智能体甚至要在多轮反馈里不断修正策略。

Agent 要从「能回答」走向「能长期干活」,记忆能力必须成为基础设施的一部分。

第三个难题,是算力资源要调得动。

Agent 的工作流很杂。有时要跑大模型推理,有时要启动沙箱执行代码,有时要读写存储,有时要调用传统业务系统。训练、推理、Agent 负载、通用微服务,都会混在一起抢资源。

如果底层调度还停留在传统云原生时代,就很容易出现尴尬局面:算力拼不起来、调不动也用不满,任务一多还打架。

通智一体化调度引擎 CCE VolcanoNext ,利用精密的「软件调度技术」、通过两个关键动作,立马让整体硬件利用率提升了 30% 以上。

一个是「训推共池」。

把原本割裂的训练和推理算力揉成一张网,让训练、推理、Agent 等多种负载可以在同一资源池里动态复用。

另一个是「碎片整合」,变废为宝。

训练任务里常常会有很多细碎的资源空隙。 CCE VolcanoNext 能将极其零碎的算力「偷」出来,瞬间打包塞给正在等待响应的在线推理任务(比如去生成一个 Token ),让算力流失率趋近于零。

第四个难题,是 Agent 必须管得住。

企业不是不想用 Agent,而是不敢随便让 Agent 进生产系统。毕竟能力越强,风险越大,企业越容易紧张。

这也是 AgentSphere 的定位——它提供的是生产级智能体运行环境,把沙箱隔离、身份权限、意图防护、双向网络防护、行为审计放进同一个底座里。

同时,它还足够快。

AgentSphere 通过羽量级沙箱技术,实现 100ms 级启动和每分钟十万级批创能力,既能支撑 Agent Serving 里的工具调用,也能支撑 Agentic RL 里大规模沙箱高频创建。

ModelArts+AgentArts:

再让企业级智能体触手可及

话又说回来,企业真正需要的,是上面这些裸算力吗?其实不是。

与其说人们需要的是电,不如说是那些真正进入生活、解决问题的电器。传统企业也一样,他们更需要可自由支配的模型和智能体能力。

所以,在 Agentic Infra 之上,华为云继续铺了两层能力:ModelArtsNext 和 AgentArts。前者解决「模型怎么用得更好」,后者解决「 Agent 怎么跑进企业」。



先看 ModelArtsNext

过去很多 MaaS 平台像一个模型货架:这里有 DeepSeek,那里有 Qwen,还有自家的模型,用户自己选、自己调、自己试。

但 Agent 时代,这种方式会很快遇到问题。一个企业任务可能并不只适合一个模型。写代码、做客服、查知识库、跑推理、处理多模态内容,不同环节对成本、速度、效果的要求都不一样。

这时候,关键不只是「有多少模型」,而是能不能把合适的请求,分给合适的模型。

ModelArtsNext 的模型路由能力,应运而生。它可以根据请求特征、实时负载和使用体验,动态选择更合适的模型。用户可以选择成本优先、效果优先,或者均衡模式,让系统在不同任务之间自动做取舍。

这听上去像一个后台调度功能,但对企业来说很重要。

因为企业不是在玩模型评测榜,而是在算真实成本:同样一个任务,能不能少花一点 Token?同样一套应用,能不能既保证效果,又把推理成本压下来?

除了模型路由,ModelArtsNext还把 RLaaS、机密推理和模型矩阵打包进来。

RLaaS(强化学习服务)让企业可以用强化学习继续优化自己的智能体,让模型在真实业务反馈中越用越聪明。

机密推理面向金融风控、AI 编码等高敏感场景,解决数据可信和安全调用问题。

此外,华为云提供丰富的模型矩阵能力,实现了主流 SOTA 模型(如 DeepSeek、Kimi、智谱GLM等)Day0 上线,能力覆盖编程、多模态等丰富场景。企业可通过 Tokens API、工具链、Agent 开发平台、智能体应用 4 种形态轻松调用。



再往上,就是 AgentArts,负责把模型能力封装成靠谱、合格的「数字员工」。

企业级 Agent 一旦进入生产环境,就如同可能影响业务结果的数字员工,怎么样才能让这位「员工」稳定、可控、可持续地进入工作流?

AgentArts 对应的,正是这套生产级要求。

其中,长程任务,解决的是 Agent 能不能连续干活的问题。企业任务往往不是一问一答,而是持续数小时甚至数天的流程。AgentArts 要保障任务不中断、异常能恢复、上下文能延续。

企业级安全,解决的是 Agent 能不能放心用的问题。它需要会话隔离、权限管控、隐私数据保护和安全沙箱,不能让一个能调用工具的智能体随便越权。

行业知识深度,解决的是 Agent 能不能懂业务的问题。不同企业、不同岗位、不同流程,都有自己的知识、规则和经验。Agent 要真正干活,就必须把这些行业资产吃进去。

全链路可观测,解决的是 Agent 出问题后能不能查清楚的问题。它做了什么、调用了什么工具、哪一步失败、为什么失败,都要能被追踪和复现。

基于华为云 AgentArts 平台,企业可以从 300 多个行业资产中灵活选取,组合出适合自己的智能体能力。从实际落地来看,这套能力已经开始跑进真实业务场景。

例如,温氏集团通过华为云 AgentArts,基因组分析效率提升 50%,AI 解读成功率高达 95 %以上。此外,遗传评估准确率同步提升 15%。

比起数Token,华为云更关心它们去了哪里

过去一年,AI 云厂商被 Token 卷上了天。

模型调用量、Tokens 产出、推理成本、API 价格,几乎成了衡量 AI 云热度的新尺子。

谁能承接更多模型调用,谁能生产更多 Token,谁就更像握住了 AI 云时代的新增长入口。

华为云没有回避 Token 经济,也在建设高效 Token 工厂、MaaS 模型即服务和 Agentic Infra,但它又不想陷入互联网的这套排行榜里。

在媒体见面会上,周跃峰说得很直白:华为云「不太在乎 Token 总量是多少」,也「不太在乎收入的总量是多少」,更在乎国产化算力系统生产出来的 Tokens 背后,能不能带来健康提升、节电和生产力提升,而不只是情绪价值。



这句话听起来有点反增长叙事,其实点出了华为云和互联网云厂商的关键差异。

来看一个医疗案例。针对中国病理医生缺口高达14 万的结构性挑战,上海瑞金医院联合华为,历时一年半打造了 RuiPath 病理大模型。

这是国内首个进入医院生产流程的临床级病理大模型,可覆盖 90% 的常见癌种和 90% 的下游诊断任务。



研发过程中,瑞金医院提供了百万张高质量数字病理切片和宝贵临床数据。华为云提供的是数据工程、模型工程、应用工程以及全流程工具链支持。

现在,RuiPath 正在按照「顶级医院研发验证—地市三甲医院扩展—县域医院复制应用」的路径向外扩散。短短几个月,朋友圈已扩展到全国 20 多家医院。

比如,邯郸市中心医院,通过每轮几十张切片的小样本微调,让本地乳腺癌有无肿瘤判别准确率提升到接近 100%。

涉县医院、武安市第一人民医院这样的区域医院,也可以在数据不出域、安全可控的前提下,通过端云协同享受到顶尖专家的诊断能力。

这才是华为云口中「有价值的 Token」。

它对应的不是一次聊天、一段生成文本、一个 API 调用,而是一次更准确的病理判断,一次基层医院诊断能力的提升,一次优质医疗资源的下沉。

这一核心差异化,可以追溯到华为最初进入云市场时的底色。

早在多年以前,华为云就曾明确提出,未来 AI 的主场在行业,并把公有云作为面向未来的重要战略。那时,很多政府和企业客户才刚刚开始上云,而政企、运营商、金融、制造、能源等 2B 场景,恰恰是华为长期深耕的领域。

所以从一开始,华为云的云业务就带着很强的行业属性,关心的是怎样把云、AI、数据和行业系统结合起来,变成真实生产力

相比之下,互联网大厂的基因造就了另一套打法。

他们天然拥有高频流量场景、C 端应用、内容平台和开发者生态。这些会带来海量模型调用,也会反过来推动模型能力、推理平台和工具链快速迭代。

他们的 2B 能力,很多时候也是从高频互联网场景、开发者生态和大规模模型调用中外溢出来的。

如果 Token 要真正转化为生产力,就必须进入政企、传统企业的业务流程,一对经典矛盾也接踵而至:

传统企业组织机构复杂、业务系统复杂、手握高敏感数据、安全合规要求极高,对本地化部署、数据不出域、业务连续性都有明确诉求。但模型和算力迭代又非常快。如果企业完全自建,很容易「部署完就落后」。

这就引出了华为云另一个关键差异化:坚持公有云和面向国计民生的混合云「两条腿走路」。

RuiPath 就是一个很典型的样本,将原本对立的「数据安全」与「先进模型便利」统一起来。

在医院端,先通过轻量化工具对原始病理切片进行预处理,提取少量疑似肿瘤区域特征,再经过加密后上传云端。这样一来,原始数据和核心诊疗流程仍然留在医院可控范围内。

在云端,华为云通过全密态、「可用不可见」等机制,支撑诊断推理、模型增训和持续迭代。云端提供的,是瑞金与华为共建的基础模型能力、算力能力和工具链能力。

基层医院只需要利用相当于传统训练约 10% 的本院小样本数据,就可以在基础模型之上做本地化适配,快速得到更贴合本院病例特点的专属模型。



值得一提的是,虽然云厂商都在讲「全栈」,但与华为云「全栈」的「含硅量」和国产化率,存在天差地别

华为是做通信设备和硬件出身,它的全栈逻辑也向下扎到了最底层的物理世界,如昇腾 NPU、鲲鹏 CPU、CloudMatrix 超节点等硬核实体。

而且,从最底层的「一粒沙子」(芯片算力),到中间层的底层使能(如CANN 架构),再到最上层的智能体平台,全部都是自研。用周跃峰的话说,华为云要打造不同于「万国牌」的「另一个算力平面」

对中国企业而言,这不只是「多了一家云厂商」,而是在主流 GPU 路线之外又多了一种算力选择、多了一套生态选择,也多了一条基础设施路线。

开放才能致远

除了把硅基黑土地做厚,真正让 AI 长进千行万业,还需要把已经验证过的技术、工具链和行业经验开放出去,这也是 INSPIRE 创想者大会发布「行业 AI 梦工厂」的意义。

首批「梦工厂」包括医疗、具身智能、科学计算、智能制造等垂直领域,开放华为长期积累的技术能力、工具链和实践经验,让行业 AI 不再停留在少数标杆项目里,而是进入可复制、可共建、可持续迭代的新阶段。



开放,也贯穿在华为云的底层生态里。

从鲲鹏、昇腾,到欧拉操作系统、CANN 系统,再到 CCE Volcano、ModelArts 工具链,以及与AgentArts 企业版内核同源度超过 90% 的openJiuwen,华为云正在把更多能力以开源开放的方式交给产业。

周跃峰说,希望华为云在智能体时代成为一朵最开放的云。最终,让智能体开发这件事变得更普惠。



任正非曾说,在方向大致正确的情况下,要先开一枪,不能等,大胆往前走。过去多年,华为云押注行业、押注国产化、押注全栈能力,这条路并不轻松,也不会立刻见效,但也从未动摇。

有人说,一旦认定一件事,便全力以赴。在业内,华为的执行力令许多竞争对手忌惮。

确实。没有一件事情可以随随便便成功,但是认真干起来,也不可能不成功。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国家金融监督管理总局答证券时报记者提问:与上海市公安、检察机关分别率先建立协同共治、协作配合办公室

国家金融监督管理总局答证券时报记者提问:与上海市公安、检察机关分别率先建立协同共治、协作配合办公室

证券时报
2026-06-12 15:55:26
60岁朱丽蒨在超市被偶遇!穿衣打扮土味十足,被嘲像刘德华的保姆

60岁朱丽蒨在超市被偶遇!穿衣打扮土味十足,被嘲像刘德华的保姆

星娱叨叨社
2026-06-04 14:58:10
C罗惨败10倍!皇马球迷亲手把梅西投成GOAT,那老詹拿什么超乔丹?

C罗惨败10倍!皇马球迷亲手把梅西投成GOAT,那老詹拿什么超乔丹?

生活观察员啊
2026-06-12 01:46:39
SpaceX今日上市,马斯克身价或破万亿美元

SpaceX今日上市,马斯克身价或破万亿美元

IT之家
2026-06-12 07:04:06
北京男篮或交易范子铭,北控欲交易王少杰,上海潜力锋线出国打球

北京男篮或交易范子铭,北控欲交易王少杰,上海潜力锋线出国打球

中国篮坛快讯
2026-06-12 17:12:00
美媒曝骑士太阳交易方案

美媒曝骑士太阳交易方案

体坛周报
2026-06-12 00:18:16
李想:明天起全新理想L8进入全国门店

李想:明天起全新理想L8进入全国门店

IT之家
2026-06-12 12:01:07
贝尔服了!你可以成为最强,但成不了梅西,因为他早已超越了最好

贝尔服了!你可以成为最强,但成不了梅西,因为他早已超越了最好

体育闲话说
2026-06-12 06:34:41
三年套现15亿,卖掉摩拜单车的创始人胡玮炜,竟然活成了这样!

三年套现15亿,卖掉摩拜单车的创始人胡玮炜,竟然活成了这样!

琴琴有氧运动
2026-06-05 22:12:10
“刚高考完就花了我一万多”,普通家长晒三件套,网友:真没必要

“刚高考完就花了我一万多”,普通家长晒三件套,网友:真没必要

泽泽先生
2026-06-10 19:49:25
网友拍到100式坦克新图!四代坦克批量服役,99B还在继续制造,三代坦克还有什么用?

网友拍到100式坦克新图!四代坦克批量服役,99B还在继续制造,三代坦克还有什么用?

军武速递
2026-06-11 19:21:44
钟南山发现:能活到90岁的老人,基本在60岁,就已经不做这6事了

钟南山发现:能活到90岁的老人,基本在60岁,就已经不做这6事了

番外行
2026-06-08 08:20:59
瀑布秋千绳索断裂致游客坠亡,四川华蓥:涉事公园已停业整顿

瀑布秋千绳索断裂致游客坠亡,四川华蓥:涉事公园已停业整顿

界面新闻
2026-05-05 20:05:10
异性对接吻一定要慎重,一旦“接吻”了,关系就会发生重大变化!

异性对接吻一定要慎重,一旦“接吻”了,关系就会发生重大变化!

皓皓情感说
2026-05-15 12:29:38
长沙市召开领导干部会议宣布有关人事安排决定 沈晓明出席并讲话

长沙市召开领导干部会议宣布有关人事安排决定 沈晓明出席并讲话

三湘都市报
2026-06-12 19:50:47
一碗隔夜米饭毒死7人?医生警告:米饭尽量别这样吃,比砒霜还毒

一碗隔夜米饭毒死7人?医生警告:米饭尽量别这样吃,比砒霜还毒

路医生健康科普
2026-05-31 20:15:03
人为什么要结婚,一位富婆说:“人真正需要的其实不是婚姻,也不是性,甚至都不是伴侣,而是这两种正向的亲密关系。”

人为什么要结婚,一位富婆说:“人真正需要的其实不是婚姻,也不是性,甚至都不是伴侣,而是这两种正向的亲密关系。”

心理观察局
2026-06-12 06:34:20
亚洲之光!韩国连续3届世界杯赢球:韩国葡萄牙吃瘪,新核大闪耀

亚洲之光!韩国连续3届世界杯赢球:韩国葡萄牙吃瘪,新核大闪耀

李喜林篮球绝杀
2026-06-12 13:30:08
蒙古勾结日本!想双路夹击中国,坐地分赃?

蒙古勾结日本!想双路夹击中国,坐地分赃?

李云飞Afey
2026-06-12 22:12:41
金莎被关在地铁里那一刻,孙丞潇的反应,我看哭了

金莎被关在地铁里那一刻,孙丞潇的反应,我看哭了

乡野小珥
2026-06-12 13:57:03
2026-06-12 23:15:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13246文章数 142668关注度
往期回顾 全部

科技要闻

鸿蒙7发布,余承东:首个完成AI化改造系统

头条要闻

男子毕业16年后学位证"无法认证" 高校最新通报

头条要闻

男子毕业16年后学位证"无法认证" 高校最新通报

体育要闻

欧洲恐韩?肉德维德?

娱乐要闻

一天4个瓜,肖战热巴最意外

财经要闻

万亿美元顺差背后,透露这些信号

汽车要闻

标配激光雷达/双动力可选 昊铂S600限时售17.99万起

态度原创

家居
艺术
游戏
手机
军事航空

家居要闻

空间微调 移形换境

艺术要闻

这组照片真迷人,SSS级颜值和身材!

《剑星》Xbox独不占?官方回应移植:我们需要时间

手机要闻

狂飙突进!鸿蒙 6 终端设备突破 6600 万,国产系统成第二大手机系统

军事要闻

伊朗媒体:已故最高领袖葬礼推迟举行

无障碍浏览 进入关怀版