网易首页 > 网易号 > 正文 申请入驻

中信证券:看好DeepSeek新一代模型带动云端推理需求爆发 加速AI应用端侧落地

0
分享至

智通财经APP获悉,中信证券发布研报称,DeepSeek通过工程化能力创新,实现了大模型训练和推理算力成本的极致优化,也为端侧部署高性能模型提供新的方向。通过分析DeepSeek V3和R1模型论文,理解其核心逻辑是“按需分配算力,最小化冗余计算”,使得千亿级模型在低成本硬件(甚至边缘设备)上高效运行成为可能,为大规模商业化落地提供了技术基础。看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地:建议核心关注晶圆代工、国产算力芯片、定制化存储、终端品牌、SoC五大方向。

中信证券主要观点如下:

DeepSeek如何实现的训练成本降低?

1)架构创新: DeepSeek-V3的基础架构中采用了DeepSeekMoE专家架构和MLA多头潜在注意力机制,DeepSeekMoE通过细粒度专家分配、共享专家及无辅助损失负载均衡策略优化传统MoE,提升计算资源效率;MLA通过低秩联合压缩减少注意力键值缓存占用,提升计算效率、减少内存消耗。

2)FP8混合精度训练:在全球主流大模型中率先采用FP8低精度数据进行大规模训练,大部分核心计算用FP8提升速度、降低内存用量,部分关键操作保留高精度确保动态稳定性。

3)训练工程优化:DeepSeek在主流大模型中率先采用硬盘充当输入端缓存,设计DualPipe算法实现高效流水线并行,融合前后向通信阶段,减少阻塞;采用定制化高效跨节点all-to-all通信内核降低通信开销;通过重计算、EMA、共享向量和输出头减少内存占用。

4)数据策略优化:应用多token预测机制MTP,增加训练信号密度,减少20%训练迭代次数,帮助模型捕捉长距离依赖关系。

DeepSeek如何实现的推理成本降低?

DeepSeek-V3对推理的预填充和解码两个阶段都优化了专家使用效率:预填充阶段MoE用EP32及冗余专家策略提升效率,解码阶段探索动态路由减少通信开销;还通过支持FP8、INT8量化和提供蒸馏版本,实现低精度量化与模型压缩,减少显存占用。DeepSeek的开源生态可以更好支持硬件厂商适配,例如可以对MLA算子优化提升推理效率,DeepSeek-R1发布后国内外芯片厂商快速响应支持DeepSeek。1月25日,AMD宣布已将新的DeepSeek-V3集成到Instinct MI300X GPU上并经过SGLang对推理过程进行了优化,英伟达、英特尔也随后在1月31日官宣支持。国内厂商都已经官宣完成对DeepSeek的适配,国产算力成为相对稳定可靠的选项,支撑国产大模型从研发走向商业化。

从DeepSeek算力需求看AI芯片设计方向?

DeepSeek 在论文的芯片设计意见指导中指出通信和计算同等重要,计算方面降低精度和内存需求是关键。在通信硬件优化上,DeepSeek建议开发独立通信协处理器,实现计算与通信物理分离,同时建议融合网络架构,统一IB和 NVLink的网络协议栈,统一通信接口以简化编程复杂度和降低通信延迟;在计算硬件优化上,建议提升 FP8 计算精度,并支持分块量化与在线量化,减少访存开销,提升推理效率。DeepSeek建议带来两点启示:

1)“推理速度”基本90%是由decoding阶段决定的,因此内存容量决定大模型推理速度,内存升级仍是算力芯片升级的重点方向,看好近存计算发展。

2)在模型开源的策略下,DeepSeek-R1蒸馏后的小模型性能有望持续快速提升,帮助端侧硬件加速接入,助力AI应用全面落地。看好品牌商和SoC芯片厂商的成长机遇。

投资策略:

看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地:

1)云端:DeepSeek有望开启全新的Scaling Law,模型重心逐步从预训练切换到强化学习、推理阶段,助力算力需求持续增长。

2)终端:看好DeepSeek带来模型轻量化的全面升级,端侧硬件接入有望加速爆发,助力AI应用全面落地,建议关注品牌厂商,SoC芯片厂商。

风险因素:

算力芯片供应链风险;芯片产能供给不足的风险;互联网大厂资本开支不及预期;相关产业政策出台力度不及预期;AI技术及应用发展不及预期;芯片技术迭代不及预期;国产先进制程量产进展不及预期;行业竞争加剧等。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国核动力航母迎来新突破?官宣:钍基熔盐堆核燃料转换成功实现

中国核动力航母迎来新突破?官宣:钍基熔盐堆核燃料转换成功实现

春序娱乐
2026-03-29 00:17:40
苏提达撇开泰王素颜外出,私下伴驾国王的另有他人,王后也不在乎

苏提达撇开泰王素颜外出,私下伴驾国王的另有他人,王后也不在乎

夜深爱杂谈
2026-03-29 18:08:00
75年,毛主席得知一中将在芜湖当地委副书记,怒言:必须重新分配

75年,毛主席得知一中将在芜湖当地委副书记,怒言:必须重新分配

北海史记
2026-03-29 16:31:24
张兰2亿画被扣押!刚抱上孙子又摊事,汪小菲一句话,信息量太大

张兰2亿画被扣押!刚抱上孙子又摊事,汪小菲一句话,信息量太大

章眽八卦
2026-03-29 12:01:51
脊背发凉!村田晃大的诡笑,和他身后的“军歌”……

脊背发凉!村田晃大的诡笑,和他身后的“军歌”……

补壹刀
2026-03-29 18:33:46
罗马尼亚队官方:主帅卢塞斯库在赛前准备会突感不适,目前情况稳定

罗马尼亚队官方:主帅卢塞斯库在赛前准备会突感不适,目前情况稳定

懂球帝
2026-03-29 17:53:09
以军开始追杀了 向以色列城市发射导弹的伊朗小组被打死

以军开始追杀了 向以色列城市发射导弹的伊朗小组被打死

桂系007
2026-03-25 02:50:41
对手:我希望梅西带阿根廷卫冕世界杯!然后再退役!

对手:我希望梅西带阿根廷卫冕世界杯!然后再退役!

历史第一人梅西
2026-03-29 15:24:58
中国移动正式发布通知:全国将统一执行:4月30日起

中国移动正式发布通知:全国将统一执行:4月30日起

触摸史迹
2026-03-27 15:11:23
万斯获美共和党保守派阵营过半支持

万斯获美共和党保守派阵营过半支持

界面新闻
2026-03-29 07:24:40
3月30日精选热点:光缆全球爆单,这3大核心龙头要再次起飞

3月30日精选热点:光缆全球爆单,这3大核心龙头要再次起飞

元芳说投资
2026-03-29 20:43:35
国足在澳大利亚州联赛俱乐部训练,前河北外援居吕姆是俱乐部主席

国足在澳大利亚州联赛俱乐部训练,前河北外援居吕姆是俱乐部主席

懂球帝
2026-03-29 13:40:09
抗美援朝罕见一幕,云山之战主力团3个营干部逃了,结果如何?

抗美援朝罕见一幕,云山之战主力团3个营干部逃了,结果如何?

微史纪
2026-03-28 12:58:19
女人的胸襟,不光是领口开得大,更是心里装得下事

女人的胸襟,不光是领口开得大,更是心里装得下事

飛娱日记
2026-03-20 08:03:20
李昌钰病逝,晚年身形骤瘦坐轮椅,二婚妻子朋友圈曝光惹人泪目

李昌钰病逝,晚年身形骤瘦坐轮椅,二婚妻子朋友圈曝光惹人泪目

音乐时光的娱乐
2026-03-29 05:55:00
中方拒绝出席G7峰会,法国威胁上了:中国面临欧洲市场关闭的风险

中方拒绝出席G7峰会,法国威胁上了:中国面临欧洲市场关闭的风险

兴史兴谈
2026-03-28 14:46:09
固态电池神话破灭?比亚迪三款千公里续航实车已杀到!

固态电池神话破灭?比亚迪三款千公里续航实车已杀到!

小李子体育
2026-03-27 08:24:49
iPhone 发布紧急弹窗,要求用户赶紧升级系统!

iPhone 发布紧急弹窗,要求用户赶紧升级系统!

XCiOS俱乐部
2026-03-28 17:20:53
弗拉格:克努佩尔是我一辈子的兄弟 我们从不谈最佳新秀的话题

弗拉格:克努佩尔是我一辈子的兄弟 我们从不谈最佳新秀的话题

北青网-北京青年报
2026-03-29 10:14:21
前贵州首富罗半城的千亿帝国,为何轰然就崩塌了,毫无预兆

前贵州首富罗半城的千亿帝国,为何轰然就崩塌了,毫无预兆

贱议你读史
2026-03-17 01:21:16
2026-03-29 21:23:00
智通财经 incentive-icons
智通财经
全球资本市场财经资讯提供者
1108248文章数 101264关注度
往期回顾 全部

科技要闻

马斯克承认xAI"建错了",11位创始人均离职

头条要闻

中国警告美国:勿将"冲突战乱"引入亚太地区

头条要闻

中国警告美国:勿将"冲突战乱"引入亚太地区

体育要闻

绝杀卫冕冠军后,他单手指天把胜利献给父亲

娱乐要闻

张凌赫事件持续升级!官方点名怒批

财经要闻

Kimi、Minimax 们的算力荒

汽车要闻

岚图泰山X8配置曝光 四激光雷达/华为新一代座舱

态度原创

旅游
亲子
教育
房产
公开课

旅游要闻

“寻一份信物,遇一生姊妹” 用剧本游的方式打开“姊妹节”

亲子要闻

宝蓝和爸爸叔叔挑战盲选三种颜色做彩泥,看看谁做的彩泥更漂亮!

教育要闻

1分钟学会不规则图形的面积计算方法!

房产要闻

首日430组来访,单日120组认筹!海口首个真四代,彻底爆了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版