网易首页 > 网易号 > 正文 申请入驻

DeepSeek崛起,算力需求重构进行时 | ToB产业观察

0
分享至

DeepSeek爆火之后,一个普遍的误读是——大模型算力存在泡沫,有过剩的风险。

在DeepSeek-V3和R1模型之前,大模型行业信奉“算力即权力,规模即护城河”的逻辑,当DeepSeek用不到同行十分之一的价格训练出效果更优的大模型,自然引起了对大模型算力逻辑的怀疑。

于是一方面,英伟达等传统算力巨头的股价,一度因市场对“算力需求下降”的担忧而暴跌;另一方面,国产算力企业如海光信息、华为昇腾等因适配DeepSeek模型,或者股价飙升或者备受关注。

这种割裂表明,业界对大模型算力的认知已从“规模至上”转向“效率优先”,但算力需求的本质并未被消解,而是以更复杂的形式重构。

算力需求下降?是,也不是

DeepSeek此番热潮的最大贡献,不在于单纯的算法优化,而是大幅降低了大模型的门槛,相当于一次全方位的大模型能力下探和普及。

以往相同能力的大模型要么效果不佳,要么采取了闭源收费的策略,例如GPT-4o,OpenAI没有公布GPT-4o的技术细节,而是直接开展商业化,如今在DeepSeek的冲击下又不得不改变策略。同时,DeepSeek足够低的成本也让更多用户有了尝鲜大模型的动力。

中信建投表示,DeepSeek R1通过较少算力实现高性能模型表现,主要原因是DeepSeek R1实现算法、框架和硬件的优化协同。

DeepSeek R1在诸多维度上进行了大量优化,算法层面引入专家混合模型、多头隐式注意力、多token预测,框架层面实现FP8混合精度训练,硬件层面采用优化的流水线并行策略,同时高效配置专家分发与跨节点通信,实现最优效率配置。

当前阶段大模型行业正处于从传统的生成式模型向深度推理模型过渡阶段,算力的整体需求也从预训练阶段逐步过渡向后训练和推理侧,通过大量协同优化,DeepSeek R1在特定发展阶段通过较少算力实现高性能模型表现,算力行业的长期增长逻辑并未受到挑战。

行业一开始担心算力需求会下降,某种程度上是正确的,因为单一模型的训练和推理算力需求在下降,但是由此所带来的技术普及,是更大的算力需求。

由此带来的算力需求呈现分化状态,其一,基础大模型的竞争并没有停歇,钛媒体App了解到,虽然一小部分玩家退出了预训练,但是字节跳动、阿里巴巴等基础大模型头部玩家还在加码预训练,只有更先进的基础模型,才有更高性价比的推理模型,高端算力仍将保持增长。

其二,AI应用普及带来的推理算力需求,DeepSeek的全球日活用户从34.7万飙升至1.19亿仅用一个月,尽管单个模型推理成本降低,但用户规模和场景复杂度的大幅扩张,使得整体算力消耗不降反升。

大模型算力的“杰文斯悖论”

1865年,经济学家威廉·斯坦利·杰文斯提出了一个悖论:当技术进步提高了效率,资源消耗不仅没有减少,反而激增。

例如,瓦特改良的蒸汽机让煤炭燃烧更加高效,但结果却是煤炭需求飙升;汽车发动机的效率提高了,汽油的总消耗量反而增加了;放到如今,就是AI算力支撑大模型的效率更高了,但算力的需求也进入到了新一轮的上升周期。

有外媒将DeepSeek描述为斯普特尼克时刻,即苏联先于美国发射第一颗人造卫星,但其实这更像是谷歌提出云计算概念的那一刻,谷歌展示了分布式算法是如何把计算机网络连接在一起,并实现了价格和性能的最优解。

彼时其他所有的科技公司在做些什么?大概是不断购买“高端算力”,在当时就是SUN等公司提供的服务器,如今SUN已经消失在历史,历史总是惊人的相似,却不是简单的重复,产业的新故事继续上演。

AI产业需要类似这样的时刻,而且是越多越好,DeepSeek的开源战略推动其模型快速渗透至教育、医疗、金融等垂直领域,AI应用正在遍地开花。

例如,其视觉语言融合模型DeepSeek-VL2在工业质检中的部署,需要实时处理高分辨率图像数据;代码生成模型DeepSeek-Coder则需支撑全球开发者的高频调用。这些场景对低延迟、高并发的需求,迫使算力基础设施持续升级。

再以某电商平台为例,其客服系统引入DeepSeek后,日均处理咨询量从百万级跃升至千万级,对应的GPU集群规模需扩容3倍以上。

国产算力还没到庆祝的时候

无论愿意与否,DeepSeek都成为了中国AI产业的一张名片,行业自然会联想到国产AI算力的进展,毕竟DeepSeek对单一算力需求降低,低算力的国产芯片可以在推理端有所发挥。

从行业视角来看,DeepSeek对国产算力确实是极大的利好,国产AI算力厂商纷纷宣布适配,包括昇腾、海光、壁仞科技、海光信息、摩尔线程、沐曦、燧原科技、天数智芯等厂商。

但在国产芯片的融合方面,其实DeepSeek和其他国内大模型,甚至海外开源大模型并没有太多本质差别,DeepSeek的训练也是基于英伟达芯片,其推理很大程度上依然运行在英伟达GPU上。

一位国内AI芯片人士对钛媒体App表示,从算法的角度来说,国产AI芯片厂商核心是要走出一条不同的路,关键是底层的架构要符合市场,上层硬件使能的软件要整体适用。设计出来以后,才能把硬件发挥好性能,这是第一步。

第二步,软件要做到足够的标准化以及足够的开放,让大家把性能挖掘出来,现在国产大部分厂商也面临着一些现状,大量的硬件厂商使用现成的架构,但是没有底层优化的能力。

也有行业人士提到,国产AI的胜负手不在于单一技术优势,而在于生态开放性、需求创造性、产业链协同性的复合竞争力。

未来算力竞争将呈现三大趋势,效率竞赛转向场景战争,谁能更低成本激活边缘场景,谁将主导市场;硬件霸权让位于架构主权,模型定义硬件的能力比芯片制程更重要;国产替代升级为全球规则,中国通过DeepSeek验证的软硬协同路径,或成为全球AI算力新范式。

总体而言,DeepSeek给国产AI算力打了一针强心剂,以往硬件⽣态系统封闭且互不兼容,不同芯⽚有着不同的架构和相应⼯具链,能不能在DeepSeek甚至之后的先进模型影响之下,趋于统一和标准化。

DeepSeek让大家更清晰认识到,或许在智能时代,最关键的资源不是芯片,而是人的创造力。(本文首发于钛媒体APP,作者 | 张帅,编辑 | 盖虹达)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
法媒:“伊朗战争的首个受害者是真相”

法媒:“伊朗战争的首个受害者是真相”

参考消息
2026-03-26 13:30:07
这就是钱学森后人真实的样貌,女儿定居美国,儿子长孙精忠报国!

这就是钱学森后人真实的样貌,女儿定居美国,儿子长孙精忠报国!

旧史新谭
2026-03-25 13:15:22
停炸五天的真正含义:伊朗被迫进入二选一困局

停炸五天的真正含义:伊朗被迫进入二选一困局

斌闻天下
2026-03-26 07:45:03
正式确定!CBA名将加盟浙江广厦,重返老东家,全力卫冕总冠军

正式确定!CBA名将加盟浙江广厦,重返老东家,全力卫冕总冠军

体坛瞎白话
2026-03-25 16:52:09
经济下行后,正常人变得越来越稀缺了

经济下行后,正常人变得越来越稀缺了

经济学教授V
2026-03-24 08:04:04
张雪峰的家人发声明!丧事从简,28号办葬礼,公开了张雪峰的遗愿

张雪峰的家人发声明!丧事从简,28号办葬礼,公开了张雪峰的遗愿

苗苗情感说
2026-03-26 09:33:59
美军中央司令部:美军“亚伯拉罕·林肯”号航空母舰“在区域海域航行期间,继续针对伊朗境内的军事目标开展作战行动”

美军中央司令部:美军“亚伯拉罕·林肯”号航空母舰“在区域海域航行期间,继续针对伊朗境内的军事目标开展作战行动”

潇湘晨报
2026-03-26 10:55:27
教育彻底变天!2026届初中生注意,这是最后一届只拼分数的一届

教育彻底变天!2026届初中生注意,这是最后一届只拼分数的一届

老特有话说
2026-03-25 15:22:58
南京女教师停职风波反转!大批家长发声力挺,恳请恢复岗位与声誉

南京女教师停职风波反转!大批家长发声力挺,恳请恢复岗位与声誉

火山詩话
2026-03-26 06:37:23
中国移动正式发布通知:全国将统一执行:4月30日起

中国移动正式发布通知:全国将统一执行:4月30日起

云舟史策
2026-03-26 07:34:02
蒋介石孙子召开发布会,提出“两蒋”移灵大陆,2句话让世人唏嘘

蒋介石孙子召开发布会,提出“两蒋”移灵大陆,2句话让世人唏嘘

老谢谈史
2026-03-18 18:33:35
余承东正式宣布问界M6订单超6万台后,一个奇怪的现象就出现了

余承东正式宣布问界M6订单超6万台后,一个奇怪的现象就出现了

春雨说科技
2026-03-26 14:46:46
公职人员下班后这5种行为,将严肃处理,千万别踩红线!

公职人员下班后这5种行为,将严肃处理,千万别踩红线!

细说职场
2026-03-26 11:13:03
改口!姆巴佩为皇马队医发声:他们并未误诊 这事我也有一定责任

改口!姆巴佩为皇马队医发声:他们并未误诊 这事我也有一定责任

风过乡
2026-03-26 05:54:46
巴蒂:曾想成为大罗那样的前锋但我做不到;哈兰德让我很惊讶

巴蒂:曾想成为大罗那样的前锋但我做不到;哈兰德让我很惊讶

懂球帝
2026-03-26 11:02:09
歼-16D携载LD-8A,开启反辐射作战新篇!

歼-16D携载LD-8A,开启反辐射作战新篇!

杨风
2026-03-25 20:50:09
全国禁赛5年!凉山队一球员不满判罚赛后飞踹拳击裁判,此前已被四川省内禁赛5年

全国禁赛5年!凉山队一球员不满判罚赛后飞踹拳击裁判,此前已被四川省内禁赛5年

红星新闻
2026-03-25 23:19:21
如果美国疯狂印钞还完所有债会怎样 网友深度剖析 原来有人等着呢

如果美国疯狂印钞还完所有债会怎样 网友深度剖析 原来有人等着呢

侃神评故事
2026-03-23 17:20:03
骗贷6.6亿余元 潜逃境外涉金融领域犯罪嫌疑人张某被押解回国

骗贷6.6亿余元 潜逃境外涉金融领域犯罪嫌疑人张某被押解回国

新京报
2026-03-26 12:58:08
京华城案一审宣判不只柯文哲,应晓薇被判15年半,沈庆京10年

京华城案一审宣判不只柯文哲,应晓薇被判15年半,沈庆京10年

海峡导报社
2026-03-26 15:29:03
2026-03-26 18:56:49
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
131356文章数 862012关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

原正部级刘慧被开除党籍:结交政治骗子 匿名诬告他人

头条要闻

原正部级刘慧被开除党籍:结交政治骗子 匿名诬告他人

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

艺术
教育
数码
旅游
公开课

艺术要闻

哪一座桥不是风景?

教育要闻

2026高考捡漏指南:西安藏着4所“就业王炸”院校,考生闭眼冲

数码要闻

苹果MacBook Neo将重塑整个笔电行业!分析师纷纷强调:打不过

旅游要闻

世界那么大,来安美如画丨「与V四季行」倒计时1天,这份春日请柬请查收→

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版