网易首页 > 网易号 > 正文 申请入驻

华为昇腾超节点支持DeepSeek V4模型,寒武纪也适配完成

0
分享至

来源:澎湃新闻

4月24日,DeepSeek V4-Pro和DeepSeek V4-Flash正式发布并开源,模型上下文处理长度由原有的128K显著扩展至1M,实现近10倍的容量提升。

随后,华为计算发布信息称,昇腾超节点产品全面支持DeepSeek V4。本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek V4系列模型。

其中,昇腾950通过融合kernel和多流并行技术降低Attention计算和访存开销,大幅提升推理性能,结合多种量化算法,实现了高吞吐、低时延的DeepSeek V4模型推理部署。昇腾A3超节点系列产品也全面适配,同时为便于用户快速微调,提供了基于昇腾A3超节点的训练参考实现。

华为表示,基于DeepSeek V4-Pro模型,在8K输入场景,昇腾950超节点可实现TPOT约20ms时单卡Decode吞吐4700TPS。DeepSeek V4-Flash模型,8K长序列输入场景下可实现TPOT约10ms时单卡Decode吞吐1600TPS。

华为表示,双方还联合定义昇腾超节点,进一步大幅提升延迟和吞吐,同时实现低成本,且兼顾万卡级别的Scale out集群规模。解决了长序列4K到1M序列长度范围内都有低延迟和高吞吐。此架构支持基于NAND SSU的超低成本、超大容量、高性能KV Cache有效支撑支持长序列应用。

此外,基于昇腾A3 64卡超节点结合大EP模式部署,DeepSeek V4-Flash模型,8K/1K输入输出场景,基于vLLM推理引擎可实现2000+TPS的单卡Decode吞吐,单卡吞吐持续提升。针对DeepSeek V4-Pro模型,昇腾A3同步支持推理部署,性能持续优化中。

华为称,昇腾A2、A3及950全系列产品适配DeepSeek V4-Flash、DeepSeek V4-Pro。华为并且强调,昇腾始终致力于为世界提供新选择,以极致的算力与开放的生态,加速AI产业的繁荣。

4月24日,华为云也宣布首发适配DeepSeek V4。当前,华为云MaaS模型即服务平台已为开发者提供免部署、一键调用DeepSeek-V4 -Flash API的Tokens服务。

华为云表示,在此次新模型适配过程中,华为云在系统层、算子层和集群层的关键能力上协同,分别从调度效率、计算效率和数据流转效率三个维度保障新模型快速适配与高性能落地。据悉,金山办公、360等企业已通过华为云接入DeepSeek新模型。

在DeepSeek V4发布后,寒武纪也在第一时间宣布,基于vLLM推理框架完成了对此次DeepSeek-V4-flash和DeepSeek-V4-Pro两个版本的Day 0适配,适配代码已开源到GitHub社区。

去年DeepSeek-V3.2的发布,寒武纪也是第一时间发布适配的国产芯片。寒武纪表示,此前寒武纪对DeepSeek系列模型开展深入的软硬件协同性能优化,并达到了业界领先的算力利用率水平。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女子购买私密护理产品,消字号用品被宣传有治疗功效,两省多部门介入调查仍无法退费

女子购买私密护理产品,消字号用品被宣传有治疗功效,两省多部门介入调查仍无法退费

大风新闻
2026-04-24 18:42:04
19岁女孩迷上韩剧,嫁给31岁残疾韩国男人!20年过去她怎么样了?

19岁女孩迷上韩剧,嫁给31岁残疾韩国男人!20年过去她怎么样了?

凡知
2026-04-21 15:34:56
赖清德被摁住不足24小时,29国公开挺台,大陆三句话直击要害

赖清德被摁住不足24小时,29国公开挺台,大陆三句话直击要害

新时代精神
2026-04-25 03:26:13
震惊!网传云南某明星演唱会,因舞台像某标志被叫停,真相来了…

震惊!网传云南某明星演唱会,因舞台像某标志被叫停,真相来了…

火山詩话
2026-04-24 10:39:54
伊朗最大“内鬼”露面,打破叛逃传言,搞中东统一战线,对付美国

伊朗最大“内鬼”露面,打破叛逃传言,搞中东统一战线,对付美国

倾世璃歌
2026-04-25 02:24:55
火箭0-2湖人,还能逆转吗?苏群8个字回应,杨毅:詹姆斯可能放水

火箭0-2湖人,还能逆转吗?苏群8个字回应,杨毅:詹姆斯可能放水

八斗小先生
2026-04-24 18:34:08
“真大方,还拍给外人看”,女儿蹭枕头,家长放网上,网友却毛了

“真大方,还拍给外人看”,女儿蹭枕头,家长放网上,网友却毛了

蝴蝶花雨话教育
2026-04-21 00:05:03
年内涨超83%的中天科技披露2025年报,归母净利润略低于券商预期 今年一季度海缆业务持续发力

年内涨超83%的中天科技披露2025年报,归母净利润略低于券商预期 今年一季度海缆业务持续发力

每日经济新闻
2026-04-24 21:12:06
iPhone 20周年纪念版曝光,回归四曲面屏设计

iPhone 20周年纪念版曝光,回归四曲面屏设计

刘奔跑
2026-04-24 19:53:58
李湘半年时间狂甩五十斤,比16岁王诗龄状态还好

李湘半年时间狂甩五十斤,比16岁王诗龄状态还好

庭小娱
2026-04-23 10:46:25
施明离世引发李氏家族内斗!九龙塘祖屋涵碧别墅市价曝光 这栋豪宅当年曾是杨思琦分手的导火索

施明离世引发李氏家族内斗!九龙塘祖屋涵碧别墅市价曝光 这栋豪宅当年曾是杨思琦分手的导火索

TVB资讯台
2026-04-25 00:00:46
27岁单亲妈妈开直播,播着播着睡着了,醒来一看后台直接傻眼了

27岁单亲妈妈开直播,播着播着睡着了,醒来一看后台直接傻眼了

小椰的奶奶
2026-04-01 17:04:55
落难的凤凰不如鸡,多位明星无戏可拍,沦落到给景区打工,太心酸

落难的凤凰不如鸡,多位明星无戏可拍,沦落到给景区打工,太心酸

秋姐居
2026-03-29 22:00:48
审判日本开场,中方行动升级,两大援手随后到场,高市或被迫让位

审判日本开场,中方行动升级,两大援手随后到场,高市或被迫让位

起喜电影
2026-04-25 04:06:20
关于狄龙·布鲁克斯赛前“瞪眼”仪式,你可能不知道的事

关于狄龙·布鲁克斯赛前“瞪眼”仪式,你可能不知道的事

好火子
2026-04-25 02:49:42
三重利好加持!光通信超级主线,龙头藏不住了

三重利好加持!光通信超级主线,龙头藏不住了

Thurman在昆明
2026-04-24 20:43:24
当年刘恺威杨幂两个确实是生理性喜欢

当年刘恺威杨幂两个确实是生理性喜欢

科学发掘
2026-04-24 06:45:03
以色列对土耳其动手:偷袭军事基地,特朗普沉默

以色列对土耳其动手:偷袭军事基地,特朗普沉默

军科零零
2026-04-24 05:46:34
色字头上一把刀!知名女星曝陈小春“猛料” ,好男人设彻底崩塌?

色字头上一把刀!知名女星曝陈小春“猛料” ,好男人设彻底崩塌?

老吴教育课堂
2026-04-24 17:46:17
知乎高赞帖!为什么女儿反应这么强烈?

知乎高赞帖!为什么女儿反应这么强烈?

丫头舫
2026-04-23 10:17:08
2026-04-25 06:35:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3006688文章数 6913关注度
往期回顾 全部

科技要闻

DeepSeek V4牵手华为,价格依然"屠夫级"

头条要闻

航班提前起飞10分钟 大学生把海航告了

头条要闻

航班提前起飞10分钟 大学生把海航告了

体育要闻

上海男篮23连胜+主场全胜 姚明之后最强一季

娱乐要闻

停工16个月!赵露思证实接拍新剧

财经要闻

LG财阀内斗:百亿美元商业帝国争夺战

汽车要闻

零跑Lafa5 Ultra北京车展上市:11.88-12.48万

态度原创

游戏
数码
教育
旅游
时尚

《光与影:33号远征队》发售一周年 销量破800万

数码要闻

苹果继续拓展赛道!换帅后将进军新品类?

教育要闻

高考地理|各种地形图知识点总结大全

旅游要闻

朔州崇福寺:金代遗构,塞北千年佛殿

今日热点:爱奇艺回应暂停页面广告争议;经纪公司否认THEBOYZ解约成功……

无障碍浏览 进入关怀版