AI+时代互联网思想观察 · 2026.04.24
黄仁勋预言成真!
DeepSeek V4彻底引爆
这可能是我们这代人最重要的机遇
APRIL 24, 2026 · AI24小时
4月24日,DeepSeek V4发布,同日OpenAI发布GPT-5.5。两大模型隔空对决——但这一次,中国的牌不一样了。
当天,华为昇腾直播解读技术细节并披露昇腾950性能;寒武纪、摩尔线程、天数智芯等8家国产AI芯片品牌与英伟达同日完成适配。
一个新的AI时代,在这一天正式拉开序幕。
01
黄仁勋说对了
4月15日,英伟达CEO黄仁勋在播客中突然拔高音量:
"如果DeepSeek先在华为平台上发布,那对我们国家来说将是灾难性的。" —— 英伟达CEO 黄仁勋,4月15日
9天后的4月24日,华为昇腾CANN官方开启直播:DeepSeek V4昇腾首发。
微博热搜瞬间引爆全网——#。
黄仁勋真正担忧的,不是中国做出好模型,而是顶级开源模型不再以英伟达CUDA生态为唯一优化起点。
DeepSeek在官方技术报告中,首次将华为昇腾NPU与英伟达GPU写进同一份硬件验证清单:
"我们在英伟达GPU和华为昇腾NPU两个平台上均验证了细粒度EP(专家并行)方案。" —— DeepSeek V4官方技术报告
![]()
▲昇腾 950 性能表现(图源:昇腾 CANN 直播截图)
这标志着万亿参数级别的模型首次在正式文档中完成了对国产AI芯片的"官方认定"。
55%
英伟达在中国
市场份额(跌)
41%
国产AI芯片
出货量占比
英伟达2025财年
全年营收(美元)
02
开源核弹:性能碾压、价格屠夫
4月24日,AI圈迎来真正的"神仙打架"。OpenAI发布GPT-5.5,代号"土豆"(Spud),API输入价5美元、输出价30美元/百万Token——价格直接翻倍。
同一天,DeepSeek发布V4预览版,同步开源,MIT协议。
对比项V4-ProV4-FlashGPT-5.5总参数
1.6万亿
未公开
激活参数
490亿
130亿
上下文长度100万Token100万Token
100万Token
输入价(元/百万)1元0.2元约36元输出价(元/百万)24元2元约216元开源✓ MIT✓ MIT
V4-Flash的输出价,是GPT-5.5的近百分之一
这不是差一点——这是降维打击
03
第三方榜单实测:开源第一
性能没有打折。DeepSeek V4发布后,多家权威第三方平台迅速跟进评测,结果令人震撼。
Vals.ai
Vibe Code Benchmark
以"压倒性优势"摘得开源权重模型第一,超越Kimi K2.6;Vals综合指数排名全球第二,与第一仅差0.07%;V4相较V3.2实现约10倍性能跃升。
开源 No.1 · 全球 No.2
Arena.ai
代码竞技场(思考模式)
V4 Pro在代码竞技场排名开源第3位、综合第14位,被评价为"相较V3.2的重大飞跃";在独立对战中击败GPT-5.4高强度模式。
代码 开源 No.3 · 综合 No.14
vals.ai
综合
综合能力榜单
DeepSeek V4位列开源第一、全球第九;Agent能力方面,内部评测优于Claude Sonnet 4.5,接近Opus 4.6非思考模式。
全球 No.9 · 开源 No.1
![]()
在核心基准测试中,DeepSeek V4-Pro表现如下:
MMLU通用知识
92.8
vs GPT-5: 92.5 ↑
MMLU-Pro推理
88.5
vs GPT-5: 87.5 ↑
HumanEval代码
93.8%
vs GPT-5: 93.4% ↑
MATH竞赛数学
85.2
vs GPT-5: 84.7 ↑
SWE-bench编程
81.5%
vs Claude Opus 4.7: 80.9% ↑
Codeforces编程竞赛
3206 Elo
人类第23名 · 开源最高
▲ 数据来源:DeepSeek官方技术报告 & 第三方社区汇总
04
国产算力的"iPhone时刻"
![]()
如果价格和性能只是"量变",那么DeepSeek V4与华为昇腾的深度适配,就是真正的"质变"。
4月24日下午,华为宣布:昇腾超节点全系列产品全面支持DeepSeek V4。
▲ 昇腾 950PR 实测数据 / vs 英伟达 H20
2.87×
单卡算力
领先 H20
+16%
HBM容量
112GB
+60%
多模态生成
速度提升
FP4
国内唯一支持
FP4低精度推理
H20是英伟达专门为中国市场定制的合规版本,算力约为H100的三成。而昇腾950PR的性能接近H20的3倍,成本仅为三分之一。
在8K输入场景下实测:昇腾950超节点运行V4-Pro,TPOT延迟仅20ms,单卡吞吐达4700TPS;运行V4-Flash,延迟仅10ms。
"预计下半年昇腾950超节点批量上市后,Pro版本价格会大幅下调。" —— DeepSeek官方备注
这意味着:下半年顶级大模型的价格可能还有数倍的下降空间。
05
CUDA之外:国产算力产业链集体起跑
除华为昇腾外,DeepSeek V4发布当天,国产芯片全线响应:
华为昇腾
寒武纪
摩尔线程
天数智芯
海光信息
百度昆仑芯
阿里平头哥
沐曦股份
英伟达
国产AI芯片2025年财报
寒武纪:首度全年盈利,营收65亿元,同比+453%
摩尔线程:营收15.06亿元,同比+243%
沐曦股份:营收16.44亿元,同比+121%
天数智芯:营收10.34亿元,同比+91.6%
智源研究院牵头的FlagOS,完成了DeepSeek V4-Flash在8款以上AI芯片上的全量适配。
山西证券研报预测:国产化替代率即将突破50%的关键转折点。
2025年8月,华为宣布CANN(昇腾计算架构)全面开源,对标英伟达CUDA。目前昇腾生态已吸引超3000家合作伙伴、400万开发者。
06
新架构:花小钱,办大事
DeepSeek V4之所以能在性能和成本上同时碾压,核心秘密在于三大架构创新:
⚙️
MoE混合专家架构——聪明调度
V4-Pro总参数1.6万亿,每次任务仅激活约490亿参数——只"唤醒"3%的专家解决问题。如同16000人的公司每次项目只调490名最对口的专家,效率与成本革命性突破。
CSA+HCA混合注意力——兼顾全局与细节
V4首创融合压缩稀疏注意力(CSA)与重度压缩注意力(HCA)。处理长篇内容时既能精准定位关键细节,又能快速掌握宏观大意,算力需求较前代大幅降低。
FP4+FP8混合精度——极致压缩
V4的MoE专家权重采用FP4精度,恰好是华为昇腾950PR芯片的原生支持精度。单token推理FLOPs降至前代的27%,KV缓存占用仅10%——在国产芯片上运行效率反而更高。
再加上Muon优化器替代AdamW实现更快收敛、mHC流形约束超连接增强传统残差连接……
"花小钱,办大事"
DeepSeek用中国智慧定义了AI效率的新标准
07
这一代人的机遇
"AI的终极目标,是将廉价的电子转化为高价值的Token。" —— 英伟达CEO 黄仁勋
2026年全球AI产业进入"商业兑现期",推理算力占比首次超过70%。英伟达预计AI推理规模很快将达到训练负载的十亿倍。
当推理成本降到V4-Flash的0.2元/百万Token时,每一个普通人都能拥有一个几乎免费的超级AI助手。
265%
腾讯元宝接入
DeepSeek后月活增长
1亿+
豆包应用
月活用户
2025年中国算力
市场规模(元)
上海、湖北、四川等多地智算中心明确要求国产芯片占比超50%。中国移动哈尔滨智算中心已实现100%国产化。
这不是技术竞赛的故事,而是一个万亿级产业从底层到应用全面重构的故事。
08
尾声:两条技术栈,两种未来
DeepSeek V4的发布,表面上看是一场模型更新,实质上是AI产业格局的一次深刻变化。
维度GPT-5.5DeepSeek V4价格策略
5美元输入 / 30美元输出
0.2元输入 / 2元输出开源✗ 闭源✓ MIT协议硬件绑定
英伟达生态
英伟达 + 昇腾双路线目标用户
企业级高端市场
全民可用·普惠技术路线
美国技术栈
中国技术栈
"DeepSeek和通义千问都是世界顶尖的开源大模型……中国在开源方面做得很出色,不仅助力形成中国的人工智能生态,还推动了全球其他地区人工智能生态的构建。" —— 英伟达CEO 黄仁勋,2025年7月 北京
AI海啸已经来了
不是看谁能造出最聪明的模型,而是看谁能把最聪明的模型送到最多人手里。
4月24日这天,DeepSeek V4和GPT-5.5同日上线,被称为AI圈的"双王炸"。两者的定价策略、生态路径、技术路线,已经勾勒出两条截然不同的未来图景。
这一次,中国的回答是:
开源 · 普惠 · 自主
为伟大思想而生!
AI+时代,互联网思想(wanging0123),
第一必读自媒体
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.