网易首页 > 网易号 > 正文 申请入驻

DeepSeek V4支持华为昇腾,AI底座重构引发热议。

0
分享至


图1:DeepSeek V4成为近期国产AI算力讨论的核心事件

DeepSeek V4适配华为昇腾,表面上看是一条模型发布新闻,实质上是中国AI产业链的一次压力测试:顶级开源模型能不能不只停留在论文、榜单和发布页,而是真正跑在国产算力底座上,支撑高并发、长上下文和智能体应用。

这件事不能简单理解为“国产芯片已经全面替代英伟达”。更准确的说法是:在大模型推理侧,国产算力开始从“能跑”进入“可交付、可优化、可规模化验证”的阶段。这个变化比单一模型分数更重要。

一、这次适配为什么重要不是

过去很多大模型发布时,默认优先适配的是英伟达GPU和CUDA生态。开发者、云厂商和企业客户也习惯把训练、推理、部署工具都围绕这一套体系来做。DeepSeek V4把华为昇腾NPU写入适配路径,意味着国产AI芯片开始进入前沿模型的正式验证清单。

这背后的价值不在“宣传口径”,而在工程闭环。大模型不是安装一个软件就能跑得好,尤其是万亿参数MoE模型,还要面对专家并行、KV Cache、长上下文、显存调度、算子融合、服务调度等一整套难题。模型侧和芯片侧能够同步推进,说明国产算力已经不只是备选项,而是进入了模型设计、推理优化和部署决策的前台。

二、DeepSeek V4真正带来的压力

DeepSeek V4最显眼的升级,是上下文长度从上一代的128K扩展到1M级别。对普通读者来说,可以把它理解为:模型一次能读、能记、能处理的材料大幅增加,长文档、长代码库、多轮工具调用和复杂Agent任务都能被放进同一个任务窗口里。

但长上下文不是免费能力。上下文越长,推理时要保存和读取的KV Cache越大,注意力计算和访存压力也越高。V4之所以被关注,是因为它通过滑窗、压缩和混合注意力机制,试图把长上下文的成本降下来。也就是说,它不只是“能读更多字”,而是希望在读更多内容时仍然有可接受的速度和成本。


图2:DeepSeek V4技术报告中的性能、FLOPs与KV Cache对比

三、昇腾接住的是推理侧商业负载

大模型上线后,最直接的成本来自推理。用户每问一次,系统都要完成输入处理、模型计算、Token生成和结果返回。企业真正关心的不是单卡纸面峰值,而是三个问题:同一时间能服务多少请求?每个Token返回要等多久?单位Token成本能不能降下来?

华为昇腾在这次适配中的重点,正是围绕低时延和高吞吐做工程优化。公开信息中提到,昇腾950通过融合Kernel、多流并行、量化算法等方式降低Attention计算和访存开销;A3超节点则面向规模化部署,强调大EP模式、vLLM推理引擎和多卡协同。

这里需要分清两件事:适配推理,不等于所有训练都已经完全迁移到国产芯片;提供训练参考实现,也不等于立刻替代所有现有训练集群。当前更现实的突破口,是先把高频、持续、成本敏感的推理服务做稳,再逐步扩大训练和微调场景。


图3:华为发布超节点互联技术,强调以系统工程承接AI算力需求

四、为什么是“超节点”

国产AI芯片短期内最大的挑战,是单颗芯片在制程、HBM、生态成熟度上仍要追赶国际最高端GPU。华为选择的工程路线,是用超节点和高速互联把多颗NPU组织成一个更大的逻辑计算单元。

这条路线的关键,是减少多卡之间“等数据”的时间。MoE模型尤其依赖专家路由,不同Token会被分配到不同专家网络,卡与卡之间通信频繁。如果互联带宽低、延迟高,算力就会被通信拖住。超节点的价值,就是让多卡协同更像一台机器,而不是一堆松散服务器。

因此,DeepSeek V4适配昇腾的意义不只是“芯片能跑模型”,而是“模型结构、推理引擎、算子优化和集群互联能不能形成组合优势”。AI时代的硬件竞争,已经从单卡参数竞争,变成系统工程竞争。



图4:DeepSeek V4的压缩稀疏注意力结构,直接关系到长上下文推理成本

五、生态才是下一场硬仗

真正决定国产算力能走多远的,不是一次适配,而是开发者迁移成本。企业不可能为了换芯片,把模型服务、推理框架、监控运维和业务系统全部重写一遍。国产算力要被大规模采用,必须让常见工具链尽量保持熟悉:PyTorch、vLLM、SGLang、Triton、TileLang、MindSpore、CANN,都要在实际项目里被反复打磨。

这也是这次新闻最值得跟进的部分。DeepSeek V4如果能在昇腾生态中持续优化,后续其他开源模型、行业模型、企业私有模型也会更容易迁移。对云厂商来说,这是服务成本问题;对政企客户来说,这是供应连续性和数据本地化问题;对开发者来说,这是能不能少踩坑、少改代码、少等适配的问题。


图5:MWC 2026上华为展示面向AI基础设施的SuperPoD产品路线

六、热度会落到哪里

第一,云服务价格会被重新计算。如果国产算力能够稳定承接长上下文推理,API价格就有继续下降空间,更多企业会把内部知识库、代码助手、客服、研报生成、数据分析等高频任务迁到大模型上。

第二,智算中心建设会更重视“模型适配能力”。过去建算力中心容易只看卡的数量,现在还要看能不能稳定跑主流模型,能不能支持MoE、长上下文、Agent框架和多租户调度。算力中心不再只是机房项目,而是模型服务能力项目。

第三,国产芯片产业链会被推到更前面。服务器整机、交换设备、液冷、光模块、连接器、运维软件都会受益,但真正能留下来的,仍然是能够把稳定性、能耗、成本和交付周期做平衡的公司。

我的判断是,DeepSeek V4适配昇腾不会马上改写全球AI芯片格局,却会改变国内AI企业的选型心态:以前国产算力更多是政策选项和备份选项,现在开始成为部分真实业务可以认真评估的主选项。接下来最值得看三件事:V4在昇腾上的真实线上吞吐能否持续优化;更多开源模型是否会跟进适配;云厂商和政企客户是否愿意把核心推理负载长期放到国产算力上。答案如果逐步变成“是”,国产AI的底座就会真正热起来。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
无人机禁飞之后,大量北京网友低价进行甩卖

无人机禁飞之后,大量北京网友低价进行甩卖

映射生活的身影
2026-05-02 22:42:01
斯诺克世锦赛:17-15,决赛出1席,墨菲淘汰希金斯,吴宜泽4阶段

斯诺克世锦赛:17-15,决赛出1席,墨菲淘汰希金斯,吴宜泽4阶段

郝小小看体育
2026-05-03 01:25:58
境外势力被披露,知名躺平网红180度改变,马上打扮干净开车拉货

境外势力被披露,知名躺平网红180度改变,马上打扮干净开车拉货

新游戏大妹子
2026-05-02 12:44:44
高圆圆赵又廷五一游三亚,牵手逛街好甜蜜,赵又廷穿搭松弛接地气

高圆圆赵又廷五一游三亚,牵手逛街好甜蜜,赵又廷穿搭松弛接地气

扒虾侃娱
2026-05-02 18:39:50
皇家马德里将以耻辱性纪录载入足坛史册

皇家马德里将以耻辱性纪录载入足坛史册

本泽体育
2026-05-02 17:21:59
8.84亿的美国工厂说关就关?曹德旺:美国不讲理,我就不陪玩了

8.84亿的美国工厂说关就关?曹德旺:美国不讲理,我就不陪玩了

阿讯说天下
2026-05-02 12:53:45
请大家做好准备:地方因为缺钱,正在发生很明显的变化

请大家做好准备:地方因为缺钱,正在发生很明显的变化

财经保探长
2026-05-02 21:23:41
2-0!西蒙尼神换人,替补神兵纷纷进球,马竞下一场决战阿森纳

2-0!西蒙尼神换人,替补神兵纷纷进球,马竞下一场决战阿森纳

足球狗说
2026-05-03 00:15:42
港独、骂中国人,如今却还想来内地捞金,这3位香港明星令人作呕

港独、骂中国人,如今却还想来内地捞金,这3位香港明星令人作呕

傲傲讲历史
2026-04-19 01:20:08
网络疯传赖清德妻子在美国购买亿元豪宅,赖办回应了

网络疯传赖清德妻子在美国购买亿元豪宅,赖办回应了

海峡导报社
2026-05-02 10:52:21
这幅画把中国美协钉在耻辱柱上

这幅画把中国美协钉在耻辱柱上

深度报
2026-05-02 21:50:49
贝家颜值神话落幕,小七也没能接住贝克汉姆的神颜

贝家颜值神话落幕,小七也没能接住贝克汉姆的神颜

述家娱记
2026-05-02 10:05:12
全民83%反对!瑞典一场逆天变革,揭开人性最大陷阱

全民83%反对!瑞典一场逆天变革,揭开人性最大陷阱

爆角追踪
2026-05-02 21:25:36
10年了,为什么无人机还是送不了外卖?

10年了,为什么无人机还是送不了外卖?

有界UnKnown
2026-05-01 07:54:56
惨烈!五一票房11年来最差,陈思诚呼吁给中国电影机会

惨烈!五一票房11年来最差,陈思诚呼吁给中国电影机会

文娱春秋Plus
2026-05-02 13:45:48
第3冠!德比斯感谢张雪:给了我一台很好的车 一骑当先 游刃有余

第3冠!德比斯感谢张雪:给了我一台很好的车 一骑当先 游刃有余

念洲
2026-05-02 21:09:58
地铁喷辣椒水男子社会性死亡!底裤被扒,正脸曝光,结局大快人心

地铁喷辣椒水男子社会性死亡!底裤被扒,正脸曝光,结局大快人心

阿凫爱吐槽
2026-05-02 11:49:43
广东一男子在楼梯铺满100张粘鼠板“硬核灭鼠”:半年前用过这招,一次黏住了28只

广东一男子在楼梯铺满100张粘鼠板“硬核灭鼠”:半年前用过这招,一次黏住了28只

大象新闻
2026-05-02 23:14:08
悲催!江苏一工厂出货挂红牌致货款回笼受阻,工资缓发致员工焦虑

悲催!江苏一工厂出货挂红牌致货款回笼受阻,工资缓发致员工焦虑

火山詩话
2026-05-02 09:35:47
李悦州准绝杀!浙江加时逆转宁波2-0进八强将战深圳 兰道夫33分

李悦州准绝杀!浙江加时逆转宁波2-0进八强将战深圳 兰道夫33分

醉卧浮生
2026-05-02 22:05:49
2026-05-03 02:27:00
科技见闻Techknow
科技见闻Techknow
追踪全球科技资讯
117文章数 73关注度
往期回顾 全部

科技要闻

AI热潮耗尽库存,Mac Mini起售调高200美元

头条要闻

媒体:美国突然"翻脸" 对欧洲连打"三拳"一气呵成

头条要闻

媒体:美国突然"翻脸" 对欧洲连打"三拳"一气呵成

体育要闻

休赛期总冠军,轮到休斯顿火箭

娱乐要闻

高圆圆赵又廷游三亚 牵手逛街好甜蜜

财经要闻

雷军很努力 小米还是跌破了30港元大关

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

健康
亲子
时尚
旅游
本地

干细胞治烧烫伤面临这些“瓶颈”

亲子要闻

广东人吃饭有什么规矩?听听幼儿园小朋友怎么说…… #睡个好觉

连衣裙还得是“法式”,性感妩媚却不轻浮

旅游要闻

长图丨岁月遗珠!山西2800余座古戏台等你“看戏”

本地新闻

用青花瓷的方式,打开西溪湿地

无障碍浏览 进入关怀版