网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

DeepSeek在AI推理领域读的重大突破，北大天才实习生贡献关键思路

2026-02-27 20:37:55　来源: 侃故事的阿庆

福建举报

0

分享至

AI模型越来越强，但有一个问题正在悄悄拖慢所有人的脚步，那就是推理速度跟不上模型能力的增长。

DeepSeek在2026年2月25日挂上arXiv的这篇论文，直接切入了这个最核心的痛点。论文第一作者吴永通，以及张鸣兴、靳鑫等团队成员，背后有北京大学研究人员的深度参与，而其中还有在DeepSeek实习的北大学生贡献了关键技术思路，这让这项研究在技术圈迅速引发关注。

这项名为DualPath的推理系统，瞄准的是一个听起来有点拗口、但对大模型实际运行至关重要的概念：KV缓存存储I/O瓶颈。

论文地址：https://arxiv.org/pdf/2602.21548

KV缓存是什么，为什么它成了拦路虎

要理解DualPath，先得搞清楚KV缓存是怎么回事。

大语言模型在处理对话时，需要把此前所有轮次的上下文信息以键值对的形式储存起来，方便每一步推理时调用，这就是KV缓存。

问题在于，当AI智能体的任务越来越复杂、对话轮次越来越多，KV缓存的体积会急剧膨胀，轻则几十GB，重则上百GB。NVIDIA在其官方技术博客中早已指出，KV缓存的内存管理已经成为制约大规模推理部署的核心障碍之一，这个判断在业内几乎没有争议。

现有的主流架构，通常将"预填充引擎"和"解码引擎"拆分部署，KV缓存只能从外部存储加载到预填充引擎，这导致预填充端的网络接口卡长期处于高负荷状态，而解码端的网络资源却大量闲置，整个系统严重失衡。

这就好比一条高速公路，一半车道永远堵成停车场，另一半车道永远空着，却没有人打通中间的隔离带。

DualPath的核心：把闲置的车道用起来

DualPath的思路，说起来其实并不复杂，但能想到并且真正实现它，需要对整个推理系统的架构有极深的理解。

传统方案只有一条路径：存储直接把KV缓存加载给预填充引擎。DualPath在此基础上新开了第二条路径，让KV缓存也可以先加载到解码引擎，再通过计算网络中的RDMA技术高效传输到预填充端。

RDMA是一种允许服务器之间直接访问内存的技术，延迟极低、带宽利用率极高，在高性能计算领域早有应用，但将它引入KV缓存的跨引擎传输，是DualPath的关键创新点之一。

更重要的是，DualPath还引入了一个全局调度器，动态决定某一时刻的KV缓存应该走哪条路径，根据预填充端和解码端的实时负载状态进行弹性分配，让整个系统的资源利用率大幅提升。

实测结果相当亮眼：在三个模型的真实智能体工作负载测试中，DualPath将离线推理吞吐量提升最高达1.87倍，在线服务吞吐量平均提升1.96倍，且没有违反任何服务质量约束。

近乎翻倍的吞吐量提升，意味着同样的硬件可以服务几乎两倍的用户请求，这在商业部署上的意义不言而喻。

这项技术对整个行业意味着什么

BuzzHPC的技术分析指出，2026年AI推理效率已经成为整个行业新的核心战场。随着上下文窗口越来越长、智能体任务越来越复杂，存储和内存层次结构的管理能力，将直接决定谁能在推理成本上保持竞争优势。

DualPath的价值，恰恰在于它是一个系统层面的架构创新，而不依赖于更多更贵的硬件。在英伟达芯片供应持续紧张的背景下，这种"用好现有资源"的思路，比单纯堆算力更具现实意义。

FundaAI的分析师评论认为，DeepSeek在推理系统层面的持续创新，正在形成一种独特的技术路径，用系统工程的精细化来弥补在芯片资源上的相对劣势，这既是被动应对限制的结果，也正在成为一种主动的技术积累。

值得一提的是，北大学生参与DeepSeek核心技术攻关这件事本身，也传递出一个信号：中国顶尖高校与头部AI公司之间的协同创新，正在产出真正具有国际竞争力的原创成果，而不只是追赶和复制。

当然，DualPath目前的测试依托DeepSeek自研的推理系统，能否无缝移植到更广泛的开源或商业推理框架，仍然是一个需要时间验证的开放问题。

但这一次，DeepSeek交出的答卷，再次证明了一件事：在资源约束下的极致工程创新，有时候比花钱堆硬件更值得尊敬。

作品声明：仅在头条发布，观点不代表平台立场

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

DeepSeek新论文来了！联手清华、北大，优化智能体大模型推理

机器之心Pro 2026-02-27 10:20:21
0 跟贴 0
阶跃星辰杀入季后赛，强势跻身AI“新六小虎”第一梯队

量子位 2026-02-27 14:32:24
0 跟贴 0

垂直Agent之间，在意图层如何竞争?

虎嗅APP 2026-02-27 06:05:15
2 跟贴 2

阿里的AI叙事，多个夸克，差了豆包

钛媒体APP 2025-10-16 09:12:09
17 跟贴 17
AlphaEvolve再进化！DeepMind用AI「养殖」算法，碾压所有人类设计

新智元 2026-02-27 17:10:23
0 跟贴 0

谷歌不相信眼泪，但相信运气

虎嗅APP 2026-02-27 21:16:28
0 跟贴 0

大模型的下半场，属于拥有云+AI全栈引擎的玩家

量子位 2026-01-30 03:29:45
0 跟贴 0
刘强东雷军同框C位！中德交流排面拉满，宇树王兴兴携机器人出圈

雷科技 2026-02-27 23:37:22
0 跟贴 0

高通万卫星谈终端大模型优势：个性化与数据推理

量子位 2025-12-11 03:38:41
0 跟贴 0
陶哲轩：AI看似在推理，其实是在背答案

量子位 2026-01-05 09:20:21
0 跟贴 0
男人到自家公司当实习生，见到领导就怼

野狼说影视 2026-02-23 09:29:59
2 跟贴 2
姐姐考清华弟弟上北大，单亲爸爸请客无一人来，妹妹的出现捧杀了

五羊笑场 2026-02-26 09:26:42
3 跟贴 3
《生化9》高端平台画质对决！A家N家谁是游戏之王？

游民星空 2026-02-27 13:06:24
1 跟贴 1
“手机将全面涨价”，冲上热搜

南方都市报 2026-02-27 14:31:12
0 跟贴 0
我北大毕业年薪50万，回老家过年，给公务员表哥敬酒他却头也不抬

老冯的暴躁生活 2026-02-25 09:46:58
1 跟贴 1
16G内存1599元！国产DDR5一年暴涨500%

雷科技 2026-02-27 12:12:46
10 跟贴 10
F-22战斗机启动引擎，一股青烟喷涌而出

装甲铲史官 2026-01-25 12:20:23
0 跟贴 0
DeepSeek剧透V4架构改写大模型推理格局？

量子位 2026-02-27 16:13:34
12 跟贴 12
这就是北大才女的实力吗！李雪琴押韵就像呼吸一样简单！

大王手工 2026-02-27 08:06:58
0 跟贴 0
手机行业涨价大潮扑来：内存猛涨80%还未到顶，千元机或将消失

钛媒体APP 2026-02-27 18:57:07
0 跟贴 0
男人生病去医院，被实习生当做精神病，女主任一招给他诊断出问题

豫新影视 2026-02-23 21:26:55
1 跟贴 1
实习生不经意举动，竟意外入甲方法眼，职场逆袭就此开启

了史剧堂 2026-02-26 11:55:23
1 跟贴 1
媒体：俄乌惨烈的仗或打到2030年双方旨在"耗尽敌方"

中国新闻周刊 2026-02-26 22:44:14
21743 跟贴 21743
绿茶实习生插足老板恋情，结果只是她的一厢情愿，只能灰溜溜下台

翡翠清泉 2026-02-24 22:12:32
3 跟贴 3
19岁绿茶实习生追爱表白遭拒，情感冲击令人感慨！

翡翠清泉 2026-02-25 00:57:03
3 跟贴 3
独特的蜥蜴养殖技术！

超话看世界 2026-02-27 11:14:25
2 跟贴 2
谷歌Nano Banana 2又刷屏了：又快又便宜，设计师当场破防

机器之心Pro 2026-02-27 14:12:27
1 跟贴 1
DeepSeek V4再爆猛料！国产芯片绕开英伟达！\

新智元 2026-02-27 14:17:31
1 跟贴 1
汉服在春节期间火爆出圈日常化轻量化成未来发展趋势

中国日报网 2026-02-27 18:13:09
0 跟贴 0
高速行驶中引擎突然开盖《飞驰人生3》剧情照进现实

绝对现场 2026-02-25 22:57:02
4 跟贴 4
五大变化，存储芯片，竞争核心变了

钛媒体APP 2026-02-27 18:57:10
0 跟贴 0
三星 S26 Ultra 发布防窥黑科技，硬件级防窥屏效果实测

爱范儿 2026-02-27 19:59:33
6 跟贴 6
精准推理排除炸，稳稳赢3炮！！！

抖球 2026-02-26 01:41:46
0 跟贴 0
实习生大胆挑衅领导，本以为要吃不了兜着走，不料结局超解爽

了史剧堂 2026-02-26 11:55:22
1 跟贴 1
全世界只能用一次的诡计！阿加莎的推理史诗《东方快车谋杀案》

开心奇异果 2026-02-23 09:48:53
2 跟贴 2
极氪公布春节十大猎装旅行路线，揭秘深度自驾游版图

鲁中晨报 2026-02-26 12:29:41
15583 跟贴 15583
开工第一天，居然就遇上这种事！

低声不下气 2026-02-27 05:33:22
0 跟贴 0
在美国养孩子那是真的理解和尊重啊！

工小屋 2026-02-25 06:28:31
0 跟贴 0
PSSR升级版未来几周上线《生化9》首个采用该技术

3DM游戏 2026-02-27 22:17:26
0 跟贴 0
实习生就是为贪官培养的礼物

海洋说剧 2026-02-23 14:00:16
1 跟贴 1

项立刚再次鼓吹战争之思：最可怕的是，邪恶灵魂裹上爱国外衣

项立刚再次鼓吹战争之思：最可怕的是，邪恶灵魂裹上爱国外衣

读鬼笔记

2026-01-06 19:42:20

86岁作家杨本芬承认抄袭，被同一博主指认“涉嫌抄袭”的贾平凹、李碧华一言不发……

86岁作家杨本芬承认抄袭，被同一博主指认“涉嫌抄袭”的贾平凹、李碧华一言不发……

新民周刊

2026-02-27 20:11:30

58岁那英改走颜值路线？过度医美变化大到认不出，这是要闹哪出？

58岁那英改走颜值路线？过度医美变化大到认不出，这是要闹哪出？

锋哥与八卦哥

2026-01-25 13:26:51

免去58岁市公安局副局长职务，同时任命一名新副局长（兼）

免去58岁市公安局副局长职务，同时任命一名新副局长（兼）

警界君

2026-02-27 17:58:10

这是洲际战斗机，美媒：苏-34最大航程达8000公里，歼-36还能更远

这是洲际战斗机，美媒：苏-34最大航程达8000公里，歼-36还能更远

啸鹰评

2026-02-26 23:48:16

两百年难遇美人，49岁仍未婚，曾靠美貌征服无数男人

两百年难遇美人，49岁仍未婚，曾靠美貌征服无数男人

可乐爱微笑

2026-02-27 22:42:22

iPhone信号差？关掉这个开关，立马满格！

iPhone信号差？关掉这个开关，立马满格！

小柱解说游戏

2026-02-23 13:52:49

因长得太漂亮，七次拒绝导演“要求”被封杀，43岁终凭实力拿影后

因长得太漂亮，七次拒绝导演“要求”被封杀，43岁终凭实力拿影后

近史博览

2026-01-23 11:33:12

司机：“不好意思，你差评有点多，不敢接”，乘客当场破防！

司机：“不好意思，你差评有点多，不敢接”，乘客当场破防！

宝哥精彩赛事

2026-02-27 01:37:35

美国记者问周总理：中国人为什么喜欢低头走路？总理如何机智回复

美国记者问周总理：中国人为什么喜欢低头走路？总理如何机智回复

棠棣分享

2026-02-26 16:21:44

“老人味”的祸首被揪出！医生提醒：55岁后要少碰，老了或也没味

“老人味”的祸首被揪出！医生提醒：55岁后要少碰，老了或也没味

健康之光

2026-02-09 14:28:50

应急管理部点名“江苏响水桥梁垮塌事故”：项目实际由“草台班子”施工，质量难以保证

应急管理部点名“江苏响水桥梁垮塌事故”：项目实际由“草台班子”施工，质量难以保证

极目新闻

2026-02-27 17:14:40

梅西获评7.8分：替补一剑封喉+遭球迷抱摔倒地，现场视角还原

梅西获评7.8分：替补一剑封喉+遭球迷抱摔倒地，现场视角还原

侧身凌空斩

2026-02-27 11:11:17

杨植麟暂时挺过风暴

虎嗅APP

2026-02-27 17:11:06

演员于某被抓

微法官

2026-02-26 14:29:04

72岁潘虹:我以晚年托起耄耋母亲的晚年

72岁潘虹:我以晚年托起耄耋母亲的晚年

细品名人

2026-02-27 05:51:54

连爆4场冷门！西部彻底乱了，火箭渔翁得利，杜兰特要迎甜蜜赛程

连爆4场冷门！西部彻底乱了，火箭渔翁得利，杜兰特要迎甜蜜赛程

巴叔GO聊体育

2026-02-27 12:52:08

特朗普国情咨文演讲后外媒有惊悚发现：总统有可能患有精神疾病！

特朗普国情咨文演讲后外媒有惊悚发现：总统有可能患有精神疾病！

明天后天大后天

2026-02-26 11:45:56

花了18年，他把孩子送上世界名校：1个月后，儿子去世了

花了18年，他把孩子送上世界名校：1个月后，儿子去世了

社会日日鲜

2026-02-16 09:09:56

当年举报毕福剑的那位告密者竟然变成这样了！谁能想到啊？

当年举报毕福剑的那位告密者竟然变成这样了！谁能想到啊？

霹雳炮

2026-02-06 13:48:54

侃故事的阿庆

几分钟看完一部影视剧，诙谐幽默的娓娓道来

539文章数 7753关注度

往期回顾全部

科技要闻

狂揽1100亿美元！OpenAI再创融资神话

头条要闻

东莞纯电公交大面积停运公司5.5亿索赔"砍"至6400万

头条要闻

东莞纯电公交大面积停运公司5.5亿索赔"砍"至6400万

体育要闻

一场必须要赢的比赛，男篮何止击败了裁判

娱乐要闻

郭晶晶霍启刚现身香港艺术节尽显恩爱

财经要闻

沈明高提共富建议百姓持科技股国家兜底

汽车要闻

岚图泰山黑武士版3月上市搭载华为四激光智驾方案

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

手机

游戏

艺术

公开课

本地新闻

津南好·四时总相宜

手机要闻

华为Pura 90系列：全系首发新麒麟8系列！Ultra版本：或被砍！

知名舅舅党爆料：索尼克游戏新作有望今年公布

艺术要闻

紫气东来，好运一整年！

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版