网易首页 > 网易号 > 正文 申请入驻

DeepSeek 下一代模型 V4 将跑在华为芯片上

0
分享至

DeepSeek 下一代模型 V4 将跑在华为芯片上

据 The Information 今天报道,DeepSeek 专门推迟了 V4 的发布时间,花了几个月和华为、寒武纪合作,重写了模型底层代码的部分模块,确保 V4 能在华为最新的昇腾(Ascend)芯片上流畅运行。模型预计未来几周内发布。

华为这颗芯片是今年 3 月刚亮相的昇腾 950PR,搭载在 Atlas 350 加速卡上。单卡算力号称是英伟达 H20(目前对华出口合规版本)的 2.87 倍,配备 112GB 显存,内存带宽 1.4 TB/s。更关键的是,它是目前中国唯一支持 FP4 低精度推理的 AI 芯片,FP4 格式能大幅压缩模型对显存的需求,比如一个原本需要 140GB 显存才能跑的 700 亿参数模型,用 FP4 只需要 35GB,同样的硬件能部署更大的模型,或者同时处理更多请求。

不过代价也不小:功耗 600W,大约是 H20 的两倍。

按行业惯例,AI 公司在发布大模型前会提前把模型给英伟达、AMD 等芯片厂商做性能优化。DeepSeek 这次打破了这个惯例,没有给美国芯片厂商提供 V4 的早期访问权限,而是把机会独家给了华为和寒武纪。

The Information 的报道还透露,DeepSeek 目前还在开发两个 V4 变体版本,分别面向不同的能力侧重,同样基于国产芯片。

据英国《金融时报》此前报道,DeepSeek 曾尝试用华为昇腾芯片训练推理模型 R2,但遭遇了反复失败,包括稳定性问题、芯片间互联速度慢、软件工具链不成熟等,最终不得不退回英伟达硬件做训练,华为芯片只用于推理。

V4 能直接跑在华为芯片上,说明过去这段时间软硬件适配取得了实质进展。对中国 AI 行业来说,这是从"离不开英伟达"到"至少推理环节可以用国产替代"的一步。对开发者而言,如果 V4 的性能确实如传闻所说在长上下文编程任务上能和 Claude、ChatGPT 掰手腕,那未来通过国产算力就能用上前沿模型,不用再担心美国芯片出口管制的影响。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
手握直通门票却选择转身,樊振东在等什么?

手握直通门票却选择转身,樊振东在等什么?

凤眼论
2026-04-08 20:48:48
“走人福 休假1天”!四川一店铺张贴告示登上热搜,网友:懵圈了

“走人福 休假1天”!四川一店铺张贴告示登上热搜,网友:懵圈了

火山詩话
2026-04-09 09:22:00
陈丽华葬礼现场曝光,多位“大人物”到场,“牛鬼蛇神”也现了形

陈丽华葬礼现场曝光,多位“大人物”到场,“牛鬼蛇神”也现了形

吴蒂旅行ing
2026-04-09 11:23:25
《霹雳娇娃》女星曝3年 bikini 噩梦:制片人爱看我穿

《霹雳娇娃》女星曝3年 bikini 噩梦:制片人爱看我穿

娱圈观察员
2026-04-07 17:54:35
10年内入狱2次,爆火后“包一晚”40万,如今的她过得怎么样?

10年内入狱2次,爆火后“包一晚”40万,如今的她过得怎么样?

宝哥精彩赛事
2026-04-07 15:43:13
突然确定!中国3人全部离队!杨瀚森未能入选!

突然确定!中国3人全部离队!杨瀚森未能入选!

左右为篮
2026-04-08 12:34:18
3500亿!郑丽文获胜,卢秀燕宴席,彻底划清界限

3500亿!郑丽文获胜,卢秀燕宴席,彻底划清界限

可乐爱微笑
2026-03-07 00:47:11
有趣的医学案例:直肠射精!

有趣的医学案例:直肠射精!

黯泉
2026-04-07 21:58:25
菲律宾断电泰国停飞!131万吨救命气转售,中国:溢价85%,不讲价

菲律宾断电泰国停飞!131万吨救命气转售,中国:溢价85%,不讲价

青青子衿
2026-04-08 21:12:34
锁定西部第七!布克37+9太阳横扫独行侠 格林伤退弗拉格19中4

锁定西部第七!布克37+9太阳横扫独行侠 格林伤退弗拉格19中4

醉卧浮生
2026-04-09 12:17:04
“不能为美国流血,找中国去”

“不能为美国流血,找中国去”

观察者网
2026-04-09 10:05:03
内塔尼亚胡真慌了:多个犹太人社区遇袭,欧洲排犹浪潮卷土重来

内塔尼亚胡真慌了:多个犹太人社区遇袭,欧洲排犹浪潮卷土重来

贱议你读史
2026-04-07 08:00:03
伊朗官方确认:翼龙-2首次参战即被击落,海湾国家反应强烈

伊朗官方确认:翼龙-2首次参战即被击落,海湾国家反应强烈

最新声音
2026-04-06 08:32:33
断更三年!潘石屹突然发声:我命由我

断更三年!潘石屹突然发声:我命由我

新浪财经
2026-04-07 22:44:05
国民党由盛转衰五大关键推手,李登辉只能排第二,第一实至名归!

国民党由盛转衰五大关键推手,李登辉只能排第二,第一实至名归!

梦史
2026-03-25 04:13:02
苹果iPhone 18 Pro新配色曝光,我心动了!

苹果iPhone 18 Pro新配色曝光,我心动了!

科技堡垒
2026-04-06 12:38:57
初三女生被5名舍友欺负致右髌骨骨折, 警方行政立案,校园欺凌认定三个月无结果

初三女生被5名舍友欺负致右髌骨骨折, 警方行政立案,校园欺凌认定三个月无结果

大风新闻
2026-04-09 11:09:13
伊朗停火声明发布,全文令人泪目,伊朗第一个要感谢的居然是中国

伊朗停火声明发布,全文令人泪目,伊朗第一个要感谢的居然是中国

策前论
2026-04-08 18:42:20
阿斯:相比皇马6000万欧签马斯坦托诺,拜仁签奥利塞堪称捡漏

阿斯:相比皇马6000万欧签马斯坦托诺,拜仁签奥利塞堪称捡漏

懂球帝
2026-04-09 06:53:23
成龙72岁生日,带儿子房祖名惠州游玩,手搭儿子肩膀画面温馨

成龙72岁生日,带儿子房祖名惠州游玩,手搭儿子肩膀画面温馨

观察鉴娱
2026-04-09 09:51:18
2026-04-09 13:40:49
六子吃凉粉
六子吃凉粉
你们这不是欺负老实人吗?
14文章数 39869关注度
往期回顾 全部

科技要闻

Meta凌晨首发闭源大模型 扎克伯格又行了?

头条要闻

达赖深度卷入爱泼斯坦权色网 印媒再披露惊人新证据

头条要闻

达赖深度卷入爱泼斯坦权色网 印媒再披露惊人新证据

体育要闻

8万人面前心脏骤停 现在他还站在球场上

娱乐要闻

金莎官宣结婚 与老公孙丞潇相差18岁

财经要闻

谈判基础已被破坏!霍尔木兹海峡关闭

汽车要闻

8155芯片+L2智驾 瑞虎5运动版上市 置换补贴价6.79万元起

态度原创

数码
本地
旅游
公开课
军事航空

数码要闻

OPPO Enco Clip2耳夹耳机规格公布,苹果适配语音指令

本地新闻

建水Color Walk | 古城慢调,掉进春天的调色盘里

旅游要闻

“北京超级周末”空降!最全攻略来了,还有专属优惠→

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

黎真主党发射火箭弹 回应以违反停火协议

无障碍浏览 进入关怀版