网易首页 > 网易号 > 正文 申请入驻

一文看懂DeepSeek与清北最新论文:剧透V4底层架构,或改写大模型推理格局

0
分享至



出品|搜狐科技

作者郑松毅

编辑| 杨 锦

就在全世界都盯着V4发布时,DeepSeek先给了波剧透。

数小时前,DeepSeek携手北京大学、清华大学,共同发布了一篇足以改写大模型推理格局的技术论文,推出了面向大模型智能体的全新推理系统DualPath,瞬间引爆AI圈。


作为中国大模型产学研协同创新的标杆之作,这篇论文跳出“拼参数、堆算力”的老路子,直击当下大模型核心痛点,叙述着中国大模型从“拼能力”到“拼效率”转型的新方向。


双路径架构攻I/O瓶颈,解“巧妇难为无米之炊”

眼下,大模型已迈入智能体时代,它要像人一样思考、规划,但一个长期被忽视的难题,正在制约着它的发展——GPU算力始终没能充分发挥出来,核心问题就是I/O瓶颈在“拖后腿”。

换言之,今天大模型的痛点,已不是模型不够聪明,而是跑得不够快、成本下不来。DualPath的出现,就是为了解决这个症结。

很多人会问,什么是“I/O瓶颈”,又怎么拖后腿了?

这里可以简单比喻下:如果把大模型推理过程看作是厨子炒菜,GPU的角色就是手艺顶尖、手脚飞快的厨师;显存/内存/网络可以看成厨房的通道、传送带;模型每生成一句话,要用到的历史对话缓存(KV-Cache),就是大厨要用到的配菜、调料、半成品。而I/O,则是把食材从仓库运到灶台的全过程——搬运、传递、输送。

大厨再厉害,配菜送不上来,大厨就只能在灶台前干等。换言之,GPU再强,如果数据传不过来,它就只能空转、浪费等数据,这就是行业内最致命的“I/O瓶颈”。

过去几年,大模型越做越大,用户越来越多,对话数据越来越长,需要搬运的食材——历史对话缓存(KV-Cache)也就越多。结果就是传输通道越来越拥挤,GPU利用率越来越低,成本越来越高。

而DeepSeek这次和清北合作提出的 DualPath双路径架构,本质就是修了两条各具功能的专用传输通道,解决堵塞问题。

具体来看,DualPath改变了传统的存储至预填充引擎(Storage-to-Prefill)单路径加载模式,引入了存储至解码引擎(Storage-to-Decode)的第二条路径。


传统路径下,缓存直接读入预填充(PE)。而新路径下,缓存先读入解码(DE)的缓冲池,再通过RDMA传输给预填充(PE)。通过两条路径间的动态选择,DualPath重新分配了网络负载,缓解了预填充引擎侧的带宽压力。

我们可以把预填充引擎看作是主路径,把解码引擎看作是辅助路径。主路径负责准备当下大厨立刻要用的食材,保证伸手抓的时候就有,不耽误火候。而辅助路径负责趁不忙时,提前把食材运来备好,不耽误主通道工作,打好配合。


性能翻倍,与清北多次联手破题

值得一提的是,这套理论并不只是实验室故事,而是真的在GPU集群上验证过了:DualPath将离线推理吞吐量最高提升1.87倍,在线服务吞吐量平均提升1.96倍,请求承载能力最高提升2.25倍。


业内观点认为,这些亮眼数据的背后,是大模型服务成本的大幅降低,更是规模化落地能力的显著提升。对企业来说,同样的算力投入能获得两倍的服务产出,无疑会进一步降低AI应用门槛。对开发者来说,此前难以实现的长上下文、多轮交互等功能,如今能稳定落地,给智能体的创新应用打开了新空间。

事实上,这已不是三方的首次合作。

近半年来,DeepSeek已与北大、清华联手推出了多项重磅成果:比如ACL 2025最佳论文中提出的原生稀疏注意力(NSA)技术,把长文本处理速度提升了11倍;还有2026年1月发布的条件记忆(Engram)架构,通过把“记忆”与“计算”拆分开来,大幅降低了推理成本和内存占用。


V4箭在弦上

巧合的是,就在这篇论文发布的同时,业内对DeepSeek V4版本的发布猜测也达到了顶峰。

大家普遍认为,这篇DualPath论文绝不是简单的技术发布,而是DeepSeek V4的底层架构官宣。

从目前行业流传的消息来看,DeepSeek V4的发布窗口已经锁定在未来一周,代号为“Sealion-lite”的V4轻量版,已经在部分推理服务商处开展闭门测试,华为等国内芯片厂商也提前拿到了模型访问权限,完成了国产算力平台的适配优化。

种种信号表明,V4版本已经进入了发布前的最后倒计时。

关于DeepSeek V4的核心能力,业内的猜测高度一致,并充满期待。其中最受关注的是百万级上下文窗口——预计将从V3.2版本的128K tokens跃升至100万tokens,提升近8倍。相当于模型能一次性读完多部专业书籍、大型代码库,彻底解决了长文本处理的痛点。

其次是原生多模态能力,V4预计将支持文本、图像等多种格式,从流出的SVG生成示例来看,它在贴合提示词、形状准确性和细节丰富度上,都比前代V3.2版本强了不少。

除此之外,智能体能力也是V4的核心亮点,让模型能更高效地完成复杂任务。更值得一提的是,V4还打破行业惯例,把访问权限优先给了国内芯片厂商,助力国产化AI生态的构建。

前两日,美国AI巨头Anthropic还在指控包括DeepSeek在内的中国AI企业蒸馏抄袭,呼吁严控高端芯片出口。如今DeepSeek就向外展示了“靠人不如靠自己”的态度,连外媒都开始担忧,英伟达股价也应声下跌。

接下来,就期待着新模型登场了。



运营编辑 |曹倩审核|孟莎莎




特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一将无能,累死三军!广东队球迷:杜锋快点下课吧

一将无能,累死三军!广东队球迷:杜锋快点下课吧

体育哲人
2026-04-28 21:49:54
瓜岛战役日军为何会惨败?美国军医:他们人均排便量是美军1.5倍

瓜岛战役日军为何会惨败?美国军医:他们人均排便量是美军1.5倍

小莜读史
2026-04-28 07:14:32
穆里尼奥真要来了!曝弗洛伦蒂诺主导穆帅回归,皇马更衣室麻烦了

穆里尼奥真要来了!曝弗洛伦蒂诺主导穆帅回归,皇马更衣室麻烦了

夏侯看英超
2026-04-28 21:19:37
民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

李橑在北漂
2026-04-02 10:22:26
最高可判死刑!奥巴马结局已定?美国司法部介入,特朗普准备收网

最高可判死刑!奥巴马结局已定?美国司法部介入,特朗普准备收网

书纪文谭
2026-04-27 19:15:34
750万“电鸡”压城:深圳“史上最严”整治仍面临五大难题

750万“电鸡”压城:深圳“史上最严”整治仍面临五大难题

南方都市报
2026-04-28 07:00:37
《浪漫满屋》女星宣布怀孕「一次就中」:演艺圈最高龄产妇

《浪漫满屋》女星宣布怀孕「一次就中」:演艺圈最高龄产妇

ETtoday星光云
2026-04-28 13:24:15
台湾最新民调出炉,蒋万安、郑丽文支持率惊人,民众党大将已表态

台湾最新民调出炉,蒋万安、郑丽文支持率惊人,民众党大将已表态

老头的传奇色彩
2026-04-27 12:52:27
出门7不捡!路上看到这7样东西,别往家里的带,不吉利!

出门7不捡!路上看到这7样东西,别往家里的带,不吉利!

Home范
2026-04-16 13:17:29
你还别说,陈建斌还挺有力气的,腰部力量还是很强的

你还别说,陈建斌还挺有力气的,腰部力量还是很强的

解说阿洎
2026-04-28 18:17:23
中央政治局会议稳定军心!两天内A股大盘将向上变盘!谁能领涨?

中央政治局会议稳定军心!两天内A股大盘将向上变盘!谁能领涨?

丁丁鲤史纪
2026-04-28 18:24:04
广东丢G1!杜锋直指进攻命中率太低却未提防守,徐杰也在谈效率!

广东丢G1!杜锋直指进攻命中率太低却未提防守,徐杰也在谈效率!

篮球资讯达人
2026-04-28 22:33:25
“骨盆前倾成这样,还不去医院?”家长晒一年级女儿体态,被群嘲

“骨盆前倾成这样,还不去医院?”家长晒一年级女儿体态,被群嘲

妍妍教育日记
2026-04-24 11:15:25
卖一辆赚2400万,连航母都能造的中国,为何还要高价进口消防车?

卖一辆赚2400万,连航母都能造的中国,为何还要高价进口消防车?

小兰聊历史
2026-04-28 00:43:20
TA独家:穆里尼奥有望二度皇马执教 老佛爷亲自主导回归计划

TA独家:穆里尼奥有望二度皇马执教 老佛爷亲自主导回归计划

雪狼侃体育
2026-04-28 22:35:59
英媒:曼城如果夺冠且115项指控罪名成立,冠军可能判给枪手

英媒:曼城如果夺冠且115项指控罪名成立,冠军可能判给枪手

懂球帝
2026-04-28 19:46:05
宇航员从太空回望地球,为何会害怕?他们到底看到了什么?

宇航员从太空回望地球,为何会害怕?他们到底看到了什么?

观察宇宙
2026-04-28 18:36:48
紧急通知!税务要求:立即上报名下全部银行账户,一户都不能漏!

紧急通知!税务要求:立即上报名下全部银行账户,一户都不能漏!

侃故事的阿庆
2026-04-28 08:53:20
DeepSeek升级,气到了黄仁勋

DeepSeek升级,气到了黄仁勋

金错刀
2026-04-27 15:18:59
张雪峰前女友开撕现女友!怒斥对方插足心机重:刚离世就要分股份

张雪峰前女友开撕现女友!怒斥对方插足心机重:刚离世就要分股份

萌神木木
2026-04-28 11:12:07
2026-04-28 23:15:00
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方账号
4792文章数 9186关注度
往期回顾 全部

科技要闻

10亿周活目标落空!传OpenAI爆发内部分歧

头条要闻

媒体:台海军退役少校登乌鲁木齐舰 给出的结论很直接

头条要闻

媒体:台海军退役少校登乌鲁木齐舰 给出的结论很直接

体育要闻

魔术黑八活塞,一步之遥?!

娱乐要闻

蔡卓妍官宣结婚,老公比她小10岁

财经要闻

中央政治局会议定调,八大看点速览!

汽车要闻

拒绝疯狂套娃!现代艾尼氪金星长在未来审美点上

态度原创

手机
艺术
时尚
亲子
公开课

手机要闻

手机版DLSS来了?三星ENSS技术实测性能提升15%

艺术要闻

深圳极具未来感的“外星”建筑亮相

普通女性春天穿什么好看?这些穿搭值得借鉴,自然舒适

亲子要闻

拍了几年的急救视频,模特小朋友长大了!拍到异物卡喉气道梗阻的急救方法更新了,气道完全梗阻五次拍背+五...

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版