网易首页 > 网易号 > 正文 申请入驻

沉默的DeepSeek,和不被定义的中国大模型

0
分享至


不诱于誉,不恐于诽,率道而行,端然正己。


简单逻辑看复杂世界 YU YUAN TAN TIAN

带着十六个字,DeepSeek新版本,姗姗来迟。

距离上一次更新的V3.2版本,已经过去近5个月。

这期间,安索皮克(Anthropic)的克劳德神话(Claude Mythos)模型在网络攻击上展现出前所未有的能力,有机构称其将网络攻击的时代从“手工化”带到了“工业化”;GPT-Image-2也让网友惊呼“有图有真相”的时代已经过去……


在这个国外主流大模型平均91.4天就迭代一个版本的时代,DeepSeek的“静默”,在很多人眼里几乎等同于落后,甚至掉队

沉默的DeepSeek,让人很不习惯——2025年初的横空出世、用更少的算力实现更优的性能、打破美西方营造的“算力焦虑”。这些标签,让它的意义不止于一个公司的一款产品。

因此,几个月里,关于DeepSeek-V4的市场传闻就没断过。

当时,国外科技媒体称V4模型将在今年春节发布,具有强大的编码能力。

当一家公司最核心产品的动态被匿名信源、外媒报道和券商研报所定义——这本身已偏离了技术讨论的轨道

DeepSeek官方从未对外界的消息做过任何确认,这种沉默,又让讨论升级。


2月26日,事情迎来转折。

路透社称,据知情人士透露,DeepSeek发布V4之前,没有向美国芯片公司英伟达和超微半导体(AMD)提供模型早期访问权限,而是让中国企业华为提前数周开展软件适配优化工作。

路透社在报道中用了一个表述——

breaking from standard industry practice(打破行业惯例)。

这是此前无论中国公司还是外国公司的大模型,都没有采用过的方式。

显然,此时讨论的已经不只是一个公司能否发布新产品的问题了。

简单逻辑看复杂世界 YU YUAN TAN TIAN

此次DeepSeek与华为昇腾国产芯片体系深度适配,并不令人意外。

去年8月,DeepSeek发布DeepSeek-V3.1时就宣布采用UE8M0 FP8 Scale参数精度,特别表示这一数据格式是针对即将发布的下一代国产芯片设计。

软件主动适配硬件特性,本质上是在为国产芯片“量体裁衣”。

这背后的难度超乎想象,需要大量改写调用芯片的软件代码,使其与目标系统在各个环节都实现兼容。

依据新款芯片的特点,哪些代码还能沿用,哪些必须重写? 原本依赖的算子、通信方式和并行策略,放到国产芯片上还能否成立? 训练流程中最关键的环节,怎样调整才能既跑得通,又不损失太多性能?

因此,要想一款国产芯片嵌入既有的模型训练和推理体系,并达到可用、好用、能规模化使用的状态,往往需要长期摸索。

而当国产芯片开始在具体场景里能够接住原本由外国芯片承担的计算任务,企业就可以不再依赖特定进口型号。

国产芯片,能接得住吗?DeepSeek的姗姗来迟,似乎给了这个问题一个答案。但很少有人注意到这样一个细节。

2025年12月31日,国家发展改革委召开了2025年的最后一场新闻发布会。会上,有记者问了这样一个问题:

目前国产算力达到什么水平?

发言人回应:

目前,国产芯片产品在不同场景中加速适配,应用成效可以说非常好。特别是“超节点”等集群互联技术发展,为国产算力赶上国际领先水平提供了良好机遇,拓展了广阔发展空间。

不少人都知道,芯片、算力等的国产化,我们回应不多。

就拿发改委来说,2015年以来,发改委的新闻发布会上,提及国产算力寥寥无几,并且很少对具体发展情况作出说明。

从“回应不多”到“正面回应”,转变,在持续发生。

科技与战略风云学会副会长陈经表示,从去年开始,国产芯片的需求端被真正拉动起来了。

2025年,国产AI芯片的国内市场份额已达到41%左右。

有人用,是商业逻辑的重要一步。

上海财经大学胡延平教授就提到,从去年开始,国产AI芯片企业开始集中上市。

其意义不只在市值水平,企业能够把更多资源投向下一代AI训练、推理芯片的研发。

从技术产品,到市场应用,再回到资本支持,一个相对完整的正态循环正在形成。

简单逻辑看复杂世界 YU YUAN TAN TIAN

北京邮电大学人机交互与认知工程实验室主任刘伟有一个观点——模型加上芯片,是人工智能竞争更进一步的形态。

未来的AI发展,不仅在于算法的好坏,同样也要看整个生态是否具有韧性。

主流的英伟达生态,将硬件、软件和开发者深度绑定,形成了事实上的行业标准,在中国大模型训练芯片市场的占比一度高达95%。

可以说,几乎所有顶级大模型都必须基于CUDA框架运行。

于是,现在国产AI芯片面临两个选择:

一是兼容CUDA生态,降低迁移成本;二是自研软件栈,重构开发体系。

而中国大模型要想实现真正的自主,就必须形成软硬件一体化的协同能力。

DeepSeek-V4模型在适配昇腾芯片后,实现了高吞吐、低时延的推理部署。

这是技术上的新探索,也是我们在软硬件协同领域的一种进步信号。

今年初,智谱GLM-5也宣布完成与7家主流国产芯片平台的深度适配,可以在国产算力集群之上实现稳定运行。

在大模型训练中,也出现了“纯国产”的实践样本。

一些企业的大模型,训练过程基于国产算力体系完成。

陈经分析称,这意味着一套国产软硬件协同的AI研发生态正在逐渐完善

尽管当前中国的制程不占优、单卡性能有限,但我们也会通过系统设计、集群架构、软硬件协同、电力能耗等优势排布,在既有条件下,探索新的发展解法。

当我们讨论中国AI企业时,我们讨论的其实不只是企业本身,更是一个行业,以及背后代表的一种发展模式。

正如那十六个字的后半句所说:

率道而行,端然正己。

中国AI,更需要活在自己的节奏里。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
前东方甄选主播天权回应离职:公司管理层、直播间风格、办公氛围均在过去四个月发生改变,自己的价值与公司需求似乎不再匹配

前东方甄选主播天权回应离职:公司管理层、直播间风格、办公氛围均在过去四个月发生改变,自己的价值与公司需求似乎不再匹配

极目新闻
2026-04-26 18:06:40
61岁,从“二级教授”到“阶下囚”,给所有人敲响了警钟

61岁,从“二级教授”到“阶下囚”,给所有人敲响了警钟

教师吧
2026-04-26 16:56:24
领先10分,国米下轮赢球即可提前3轮夺得意甲冠军

领先10分,国米下轮赢球即可提前3轮夺得意甲冠军

懂球帝
2026-04-27 02:02:17
她长这么漂亮,演技那么好,为啥这么多年一直火不起来呢?

她长这么漂亮,演技那么好,为啥这么多年一直火不起来呢?

草莓解说体育
2026-04-26 14:16:31
一场3-0,让蓉城争冠对手诞生:狂轰19球+8轮不败,冲击亚冠资格

一场3-0,让蓉城争冠对手诞生:狂轰19球+8轮不败,冲击亚冠资格

夕落秋山
2026-04-27 01:05:29
浙江市值百亿食品上市公司急聘董秘,年薪40万起!一夜之间数千上市公司董秘岗位空缺,“钱不是问题,人要靠谱”

浙江市值百亿食品上市公司急聘董秘,年薪40万起!一夜之间数千上市公司董秘岗位空缺,“钱不是问题,人要靠谱”

大风新闻
2026-04-26 21:16:37
北京一大学副书记,拟获提拔!曾任清华大学副部长、校办主任…

北京一大学副书记,拟获提拔!曾任清华大学副部长、校办主任…

双一流高校
2026-04-27 00:09:28
铜梁龙1-1惜平西海岸,四场四球功臣被提前换下,该下场的不是他

铜梁龙1-1惜平西海岸,四场四球功臣被提前换下,该下场的不是他

硬腿子聊个球
2026-04-26 23:26:59
上海地铁抢座反转:两人都有座位,目击者曝料细节,果然不简单

上海地铁抢座反转:两人都有座位,目击者曝料细节,果然不简单

离离言几许
2026-04-26 21:10:25
3比0横扫河南豪取中超五连胜,申花队这场大胜可不像比分看起来的那样轻松

3比0横扫河南豪取中超五连胜,申花队这场大胜可不像比分看起来的那样轻松

文汇报
2026-04-27 04:05:09
“南方黑芝麻糊”暴雷!30年国民老字号被立案调查,要凉了?

“南方黑芝麻糊”暴雷!30年国民老字号被立案调查,要凉了?

小娱乐悠悠
2026-04-26 22:39:24
黎巴嫩女孩到沈阳留学,和广东小伙谈恋爱,直言自己是半个中国人

黎巴嫩女孩到沈阳留学,和广东小伙谈恋爱,直言自己是半个中国人

不写散文诗
2026-04-22 16:12:04
社保严查全面收紧!无数中小企业,正在为十年前的小聪明买单

社保严查全面收紧!无数中小企业,正在为十年前的小聪明买单

芳姐侃社会
2026-04-25 18:32:12
保利置业集团裁员51%

保利置业集团裁员51%

地产微资讯
2026-04-26 10:48:13
笑麻!在高架上看到这个真没有绷住,不是亲眼所见,真不敢相信

笑麻!在高架上看到这个真没有绷住,不是亲眼所见,真不敢相信

黄丽搞笑小能手
2026-04-26 05:57:14
成都蓉城八轮后仍领跑,申花若非扣分位列第二,下轮沪渝大战提前决定冠军?

成都蓉城八轮后仍领跑,申花若非扣分位列第二,下轮沪渝大战提前决定冠军?

上观新闻
2026-04-27 04:19:07
世锦赛战报:80五虎1胜3平1负!世界亚军9-13出局,墨菲盼望落空

世锦赛战报:80五虎1胜3平1负!世界亚军9-13出局,墨菲盼望落空

小火箭爱体育
2026-04-26 21:03:52
南京一派出所副所长为完成查处任务,“设计”让6名未成年人吸毒再查获,犯欺骗他人吸毒罪一审被判5年

南京一派出所副所长为完成查处任务,“设计”让6名未成年人吸毒再查获,犯欺骗他人吸毒罪一审被判5年

大风新闻
2026-04-25 22:34:13
手机这个“齿轮图标”,一定要关掉这2个开关,避免隐私泄露

手机这个“齿轮图标”,一定要关掉这2个开关,避免隐私泄露

Thurman在昆明
2026-04-26 19:46:12
朝鲜军惨败后,后方只剩女性,志愿军立下铁律:犯作风错误者枪毙

朝鲜军惨败后,后方只剩女性,志愿军立下铁律:犯作风错误者枪毙

史之铭
2026-04-27 02:08:55
2026-04-27 05:27:00
南海的波涛 incentive-icons
南海的波涛
南海问题研究者
3241文章数 352关注度
往期回顾 全部

科技要闻

涨价浪潮下,DeepSeek推动AI“价格战”

头条要闻

特朗普内阁又一女部长落马:强迫男下属为其提供性服务

头条要闻

特朗普内阁又一女部长落马:强迫男下属为其提供性服务

体育要闻

森林狼3比1掘金:逆境中杀出了多孙穆?!

娱乐要闻

仅次《指环王》的美剧,有第二季

财经要闻

事关新就业群体,中办、国办发文

汽车要闻

预售19.38万元起 哈弗猛龙PLUS七座版亮相

态度原创

游戏
本地
家居
时尚
艺术

LOL最吸金战队诞生!T1主场坐满15000人,LPL解说满脸羡慕

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

家居要闻

自然肌理 温润美学

比阔腿裤还时髦?今年夏天一定要有“这条裤子”,减龄又松弛

艺术要闻

72米舞台被拆!华晨宇这次玩文旅,翻车了!

无障碍浏览 进入关怀版