网易首页 > 网易号 > 正文 申请入驻

一文看懂DeepSeek与清北最新论文:剧透V4底层架构,或改写大模型推理格局

0
分享至



出品|搜狐科技

作者郑松毅

编辑| 杨 锦

就在全世界都盯着V4发布时,DeepSeek先给了波剧透。

数小时前,DeepSeek携手北京大学、清华大学,共同发布了一篇足以改写大模型推理格局的技术论文,推出了面向大模型智能体的全新推理系统DualPath,瞬间引爆AI圈。


作为中国大模型产学研协同创新的标杆之作,这篇论文跳出“拼参数、堆算力”的老路子,直击当下大模型核心痛点,叙述着中国大模型从“拼能力”到“拼效率”转型的新方向。


双路径架构攻I/O瓶颈,解“巧妇难为无米之炊”

眼下,大模型已迈入智能体时代,它要像人一样思考、规划,但一个长期被忽视的难题,正在制约着它的发展——GPU算力始终没能充分发挥出来,核心问题就是I/O瓶颈在“拖后腿”。

换言之,今天大模型的痛点,已不是模型不够聪明,而是跑得不够快、成本下不来。DualPath的出现,就是为了解决这个症结。

很多人会问,什么是“I/O瓶颈”,又怎么拖后腿了?

这里可以简单比喻下:如果把大模型推理过程看作是厨子炒菜,GPU的角色就是手艺顶尖、手脚飞快的厨师;显存/内存/网络可以看成厨房的通道、传送带;模型每生成一句话,要用到的历史对话缓存(KV-Cache),就是大厨要用到的配菜、调料、半成品。而I/O,则是把食材从仓库运到灶台的全过程——搬运、传递、输送。

大厨再厉害,配菜送不上来,大厨就只能在灶台前干等。换言之,GPU再强,如果数据传不过来,它就只能空转、浪费等数据,这就是行业内最致命的“I/O瓶颈”。

过去几年,大模型越做越大,用户越来越多,对话数据越来越长,需要搬运的食材——历史对话缓存(KV-Cache)也就越多。结果就是传输通道越来越拥挤,GPU利用率越来越低,成本越来越高。

而DeepSeek这次和清北合作提出的 DualPath双路径架构,本质就是修了两条各具功能的专用传输通道,解决堵塞问题。

具体来看,DualPath改变了传统的存储至预填充引擎(Storage-to-Prefill)单路径加载模式,引入了存储至解码引擎(Storage-to-Decode)的第二条路径。


传统路径下,缓存直接读入预填充(PE)。而新路径下,缓存先读入解码(DE)的缓冲池,再通过RDMA传输给预填充(PE)。通过两条路径间的动态选择,DualPath重新分配了网络负载,缓解了预填充引擎侧的带宽压力。

我们可以把预填充引擎看作是主路径,把解码引擎看作是辅助路径。主路径负责准备当下大厨立刻要用的食材,保证伸手抓的时候就有,不耽误火候。而辅助路径负责趁不忙时,提前把食材运来备好,不耽误主通道工作,打好配合。


性能翻倍,与清北多次联手破题

值得一提的是,这套理论并不只是实验室故事,而是真的在GPU集群上验证过了:DualPath将离线推理吞吐量最高提升1.87倍,在线服务吞吐量平均提升1.96倍,请求承载能力最高提升2.25倍。


业内观点认为,这些亮眼数据的背后,是大模型服务成本的大幅降低,更是规模化落地能力的显著提升。对企业来说,同样的算力投入能获得两倍的服务产出,无疑会进一步降低AI应用门槛。对开发者来说,此前难以实现的长上下文、多轮交互等功能,如今能稳定落地,给智能体的创新应用打开了新空间。

事实上,这已不是三方的首次合作。

近半年来,DeepSeek已与北大、清华联手推出了多项重磅成果:比如ACL 2025最佳论文中提出的原生稀疏注意力(NSA)技术,把长文本处理速度提升了11倍;还有2026年1月发布的条件记忆(Engram)架构,通过把“记忆”与“计算”拆分开来,大幅降低了推理成本和内存占用。


V4箭在弦上

巧合的是,就在这篇论文发布的同时,业内对DeepSeek V4版本的发布猜测也达到了顶峰。

大家普遍认为,这篇DualPath论文绝不是简单的技术发布,而是DeepSeek V4的底层架构官宣。

从目前行业流传的消息来看,DeepSeek V4的发布窗口已经锁定在未来一周,代号为“Sealion-lite”的V4轻量版,已经在部分推理服务商处开展闭门测试,华为等国内芯片厂商也提前拿到了模型访问权限,完成了国产算力平台的适配优化。

种种信号表明,V4版本已经进入了发布前的最后倒计时。

关于DeepSeek V4的核心能力,业内的猜测高度一致,并充满期待。其中最受关注的是百万级上下文窗口——预计将从V3.2版本的128K tokens跃升至100万tokens,提升近8倍。相当于模型能一次性读完多部专业书籍、大型代码库,彻底解决了长文本处理的痛点。

其次是原生多模态能力,V4预计将支持文本、图像等多种格式,从流出的SVG生成示例来看,它在贴合提示词、形状准确性和细节丰富度上,都比前代V3.2版本强了不少。

除此之外,智能体能力也是V4的核心亮点,让模型能更高效地完成复杂任务。更值得一提的是,V4还打破行业惯例,把访问权限优先给了国内芯片厂商,助力国产化AI生态的构建。

前两日,美国AI巨头Anthropic还在指控包括DeepSeek在内的中国AI企业蒸馏抄袭,呼吁严控高端芯片出口。如今DeepSeek就向外展示了“靠人不如靠自己”的态度,连外媒都开始担忧,英伟达股价也应声下跌。

接下来,就期待着新模型登场了。



运营编辑 |曹倩审核|孟莎莎




特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李小璐的新瓜,信息量有点大啊…

李小璐的新瓜,信息量有点大啊…

人间颂
2026-02-28 13:15:48
伊朗第四轮导弹射向以色列

伊朗第四轮导弹射向以色列

财联社
2026-02-28 17:39:15
男子走失25年后漂洋过海回国认亲:第一次用微信支付买了儿时吃过的冰糖葫芦,账号注册1小时粉丝已破7000

男子走失25年后漂洋过海回国认亲:第一次用微信支付买了儿时吃过的冰糖葫芦,账号注册1小时粉丝已破7000

极目新闻
2026-02-28 17:53:15
我年薪420万在上海安家,爸妈来上海后天天蹭吃蹭住不挪窝,3个月后我被调到广州,爸妈当场懵了

我年薪420万在上海安家,爸妈来上海后天天蹭吃蹭住不挪窝,3个月后我被调到广州,爸妈当场懵了

奶茶麦子
2026-02-28 15:18:07
湖南村民被群殴!钢管朝头猛砸,原因曝光网友一边倒:力挺肇事者

湖南村民被群殴!钢管朝头猛砸,原因曝光网友一边倒:力挺肇事者

社会日日鲜
2026-02-27 16:27:42
马斯克藏太深!美星链离不开7家中国公司,每一家都是全球顶尖!

马斯克藏太深!美星链离不开7家中国公司,每一家都是全球顶尖!

爱吃醋的猫咪
2026-02-27 17:56:07
苏联“人猿杂交”实验:5名女孩与11只猩猩参与,最终结局如何?

苏联“人猿杂交”实验:5名女孩与11只猩猩参与,最终结局如何?

谈史论天地
2026-02-28 13:35:18
新加坡大满贯:女单最强黑马诞生!王艺迪2-4止步8强不败金身告破

新加坡大满贯:女单最强黑马诞生!王艺迪2-4止步8强不败金身告破

钉钉陌上花开
2026-02-28 15:08:34
特朗普:美国正在“大规模”打击伊朗 消息人士:伊朗遇难者身份将令人震惊

特朗普:美国正在“大规模”打击伊朗 消息人士:伊朗遇难者身份将令人震惊

环球网资讯
2026-02-28 16:16:05
姜还是老的辣!港口被强收仅3天,李嘉诚一招破局,令人刮目相看

姜还是老的辣!港口被强收仅3天,李嘉诚一招破局,令人刮目相看

离离言几许
2026-02-27 21:17:18
以色列遭伊朗第三轮导弹袭击

以色列遭伊朗第三轮导弹袭击

财联社
2026-02-28 16:44:06
和讯投顾高璐明:"黑天鹅"突袭!下周会跳水吗?

和讯投顾高璐明:"黑天鹅"突袭!下周会跳水吗?

和讯网
2026-02-28 17:08:09
最高领袖办公室附近遭袭,伊朗权力体系如何“去中心化”强化韧性?

最高领袖办公室附近遭袭,伊朗权力体系如何“去中心化”强化韧性?

澎湃新闻
2026-02-28 15:10:31
外媒:初步报告称伊朗革命卫队损失惨重,多名革命卫队成员死伤

外媒:初步报告称伊朗革命卫队损失惨重,多名革命卫队成员死伤

中国网
2026-02-28 16:09:08
开始抢人!美国一周挖走4名中国顶尖人才,年薪1个亿美元令人咋舌

开始抢人!美国一周挖走4名中国顶尖人才,年薪1个亿美元令人咋舌

古史青云啊
2026-02-26 19:45:46
大熊猫“半半”“香果” 因病救治无效死亡

大熊猫“半半”“香果” 因病救治无效死亡

界面新闻
2026-02-28 18:10:45
持续4天空袭!从德黑兰到伊斯法罕:美以优先瘫痪伊朗指挥体系

持续4天空袭!从德黑兰到伊斯法罕:美以优先瘫痪伊朗指挥体系

装甲铲史官
2026-02-28 16:11:24
双体制内父母崩溃,赴英读博的独子,竟是英国史上最危险罪犯

双体制内父母崩溃,赴英读博的独子,竟是英国史上最危险罪犯

云舟史策
2026-02-28 09:56:15
特朗普突然发文昭告全球,包括中国俄罗斯在内,这次一个都跑不掉

特朗普突然发文昭告全球,包括中国俄罗斯在内,这次一个都跑不掉

带你领略快乐真谛
2026-02-28 16:55:50
台媒透露赵薇离婚内幕:前夫与女儿老师生下孩子,要她净身出户

台媒透露赵薇离婚内幕:前夫与女儿老师生下孩子,要她净身出户

小熊侃史
2026-02-28 15:49:15
2026-02-28 20:08:49
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方账号
4702文章数 9180关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

疑将燃料当白酒喝下两男子参加婚宴后中毒仍在ICU抢救

头条要闻

疑将燃料当白酒喝下两男子参加婚宴后中毒仍在ICU抢救

体育要闻

球队主力全报销?顶风摆烂演都不演了

娱乐要闻

疑似王一博被爆私密聊天记录

财经要闻

沈明高提共富建议 百姓持科技股国家兜底

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

房产
手机
健康
教育
时尚

房产要闻

滨江九小也来了!集齐海侨北+哈罗、寰岛...江东教育要炸了!

手机要闻

酷比魔方称魅族Flyme系统“在谈适配”,官微刚问“是否谈合作”

转头就晕的耳石症,能开车上班吗?

教育要闻

实操 | 寻找46个说话晚/说不清/语言发育迟缓的儿童,3-4月来这10城接受免费1v1言语实操

被章若楠、秦岚带火的鞋子竟然是它?春天这样穿又美又气质!

无障碍浏览 进入关怀版