网易首页 > 网易号 > 正文 申请入驻

炸场!DeepSeek千张GPU起飞背后,竟是25岁北大实习生的神操作

0
分享至

当大模型行业还在为“算力不够就堆GPU”的老路争论时,DeepSeek扔出了一颗“技术炸弹”——25岁的北大实习生吴永彤带着DualPath推理系统来了。这个直指KV缓存I/O瓶颈的双路径方案,把离线推理吞吐量干到1.87倍,在线服务提速1.96倍,甚至在1152张GPU集群上实现了近线性扩展。更戳心的是:这不是什么“老炮儿”的经验结晶,而是一个刚进实验室的年轻人,在企业实战中啃下的硬骨头。这事儿哪是技术突破那么简单?它分明在撕开一个真相:大模型的下一个春天,藏在“年轻人敢想、企业敢给机会”的裂缝里。



一、被“卡住”的智能体:当KV缓存成了大模型的“肠梗阻”

智能体火了,但没人说透它的“隐痛”。当一个AI助手要和你聊上百轮天,或控制机器人完成几十步操作时,上下文会像滚雪球一样越滚越大。这时候,大模型不是卡在计算上,而是死在了“调取记忆”的路上——KV缓存。

你可以把KV缓存理解为大模型的“短期记忆”,每次推理都要从存储里把这些“记忆”调出来。智能体的多轮交互特性,让KV缓存命中率高达95%以上,加载效率反而成了性能的“天花板”。传统方案里,预填充引擎的存储网卡被挤得水泄不通,解码引擎的网卡却在“摸鱼”,就像一条高速路上,所有车都堵在一个收费站,旁边的通道空着也不让走。企业要么忍受卡顿,要么花大价钱给预填充端“加带宽”,纯属烧钱填坑。

DeepSeek的狠劲就在于:它没按套路出牌。吴永彤团队直接砸了“KV缓存必须从预填充引擎加载”的老规矩,硬生生开辟了第二条路——让KV缓存先钻进空闲的解码引擎,再通过RDMA高速传给预填充端。这就像在堵死的高速旁开了条应急通道,所有存储网卡的带宽都被盘活了。数据不会说谎:在660B大模型上,吞吐量直接冲到1.87倍,接近“零I/O开销”的理论上限。这哪是优化?这是把大模型的“肠梗阻”给通了。




二、25岁实习生的“破局密码”:不是天才光环,是“实战培养皿”

最让人破防的,是这个核心突破的第一作者吴永彤——北大在读博士,2025年8月才进DeepSeek实习,不到半年就交出了顶刊级成果。这事儿戳中了多少人的痛点:为什么我们总说“缺人才”,却让年轻人在实验室里“纸上谈兵”?

DeepSeek的“野路子”值得细品。它没把实习生当“打杂的”,而是直接扔进系统组,让吴永彤参与DeepSeek-V3.2的研究,接触真实场景的性能瓶颈。当传统方案卡在“预填充-解码分离”的框架里时,这个年轻人敢反问:“为什么KV缓存不能走另一条路?”这种“实战中发现问题、在问题里找突破”的培养模式,比任何论文都管用。

更关键的是,企业敢给资源。为了验证DualPath,团队直接上了1152张GPU的集群,从2K智能体扩展到48K智能体,硬是跑出了线性扩展的曲线。这种“让实习生主导核心项目”的魄力,才是真正的“技术孵化器”。现在回头看,吴永彤的成功不是偶然——当一个年轻人的好奇心遇上企业的容错率,就能炸出火花。



三、不止于技术:这是大模型行业的“范式革命”

DualPath的意义,远不止让推理速度变快。它撕开了大模型发展的一个新口子:当算力军备竞赛走到头,“系统优化”才是下一个角力场。

过去两年,行业总在比“谁的模型参数更大”“谁的GPU更多”,却忘了大模型就像一台精密的机器,哪怕一个小小的I/O瓶颈,就能让千张GPU变成“废铁”。DualPath证明:通过架构创新,同样的硬件能跑出翻倍的效率。在44P88D配置下,在线服务吞吐量直接提升22倍,这相当于用更少的GPU干更多的活——对企业来说,这是真金白银的成本下降;对行业来说,这是“降本增效”的关键一步。

更深远的是人才启示。当北大实习生都能主导核心突破,我们该反思:是不是太多企业把“经验”当门槛,把“资历”当枷锁?DeepSeek的案例告诉我们:大模型的未来,不在实验室的论文里,而在年轻人的脑子里,在企业敢放手的魄力里。



结语:技术会过时,但“敢用人”的勇气永远值钱

当DualPath的论文在arXiv上线时,有人说这是“实习生的逆袭”,有人赞这是“技术的胜利”。但我更愿意把它看作一个信号:大模型行业正在从“拼算力”转向“拼智慧”,从“论资排辈”转向“谁行谁上”。

吴永彤和DeepSeek的故事,像一剂清醒剂——真正的技术突破,从来不是“大佬”的专属,而是给那些敢在实战中折腾、企业敢给机会试错的人准备的。未来,当我们谈论大模型时,或许不会只记得参数有多大,而会记得:曾经有个25岁的实习生,用双路径技术,让千张GPU真正“活”了过来。

这,才是大模型最动人的温度。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
俄伊外长通话

俄伊外长通话

环球网资讯
2026-03-01 00:03:53
王菲春晚妆容被骂上热搜?化妆师的回复狂打网友的脸

王菲春晚妆容被骂上热搜?化妆师的回复狂打网友的脸

gogoboi
2026-02-27 23:22:52
【微特稿】伊朗军方称对四处美军基地发动“报复性袭击”

【微特稿】伊朗军方称对四处美军基地发动“报复性袭击”

新华社
2026-02-28 18:42:02
伊朗司法总监被定点清除,曾主导对抗议者死刑判决

伊朗司法总监被定点清除,曾主导对抗议者死刑判决

桂系007
2026-02-28 18:01:24
你占过最大的便宜是啥?网友:我也是,捡漏一个老公

你占过最大的便宜是啥?网友:我也是,捡漏一个老公

带你感受人间冷暖
2026-02-25 00:17:46
伊朗导弹袭击约旦美军基地

伊朗导弹袭击约旦美军基地

财联社
2026-02-28 18:06:05
温铁军:中国被美国扒了两层皮,还有人妄想做中国的助手?

温铁军:中国被美国扒了两层皮,还有人妄想做中国的助手?

混沌录
2026-02-10 22:36:07
美荷两国曾同时发声,对中国独立研发的光刻机技术给予了强烈批评

美荷两国曾同时发声,对中国独立研发的光刻机技术给予了强烈批评

来科点谱
2026-02-27 07:32:59
亚马尔新女友太美了!她是巴萨忠实球迷 与亚马尔前任曾是闺蜜

亚马尔新女友太美了!她是巴萨忠实球迷 与亚马尔前任曾是闺蜜

Emily说个球
2026-02-28 21:52:51
凯特王妃威尔士之行“失败”!雨中公务受谴责,苍老状态不被谅解

凯特王妃威尔士之行“失败”!雨中公务受谴责,苍老状态不被谅解

夜深爱杂谈
2026-02-28 20:27:18
巴基斯坦宣布展开“公开战争”,阿富汗发起大规模报复,中方呼吁尽快停火“避免生灵涂炭”

巴基斯坦宣布展开“公开战争”,阿富汗发起大规模报复,中方呼吁尽快停火“避免生灵涂炭”

环球网资讯
2026-02-28 06:57:18
菲前总统杜特尔特听证会结束 国际刑事法院将在60日内裁决

菲前总统杜特尔特听证会结束 国际刑事法院将在60日内裁决

财联社
2026-02-27 23:45:07
重庆女子坠崖后续:父亲再曝细节,遗体有缺失,6大疑点越扒越深

重庆女子坠崖后续:父亲再曝细节,遗体有缺失,6大疑点越扒越深

云舟史策
2026-02-28 20:11:01
美股:三大指数遭遇重挫 金融股集体大跌|开云见山

美股:三大指数遭遇重挫 金融股集体大跌|开云见山

北青网-北京青年报
2026-02-28 11:13:06
刚刚,伊朗公布战果!券商电话会议挤爆了,最新解读来了!

刚刚,伊朗公布战果!券商电话会议挤爆了,最新解读来了!

证券时报
2026-03-01 00:30:09
火箭内讧门落幕:杜兰特小号事件主角申京小贾转发KD40分海报

火箭内讧门落幕:杜兰特小号事件主角申京小贾转发KD40分海报

醉卧浮生
2026-02-28 09:14:29
“第二代赌王”周焯华,被判18年罚款248亿,睡过的女星有多少?

“第二代赌王”周焯华,被判18年罚款248亿,睡过的女星有多少?

小熊侃史
2025-12-26 11:25:18
十几万中国劳工被骗出国挖煤,谁知等他们的却是几十万法国女性

十几万中国劳工被骗出国挖煤,谁知等他们的却是几十万法国女性

小莜读史
2026-02-23 01:45:38
国外媒体称:一旦战火爆发,中国将会到达无人知晓的地步

国外媒体称:一旦战火爆发,中国将会到达无人知晓的地步

古事寻踪记
2025-12-10 07:11:27
恭喜!21岁徐彬身披10号球衣大爆发:英甲U21独送2次助攻 率队2-1

恭喜!21岁徐彬身披10号球衣大爆发:英甲U21独送2次助攻 率队2-1

风过乡
2026-02-28 08:58:12
2026-03-01 01:27:00
数码八叔 incentive-icons
数码八叔
做数码达人,分享最新数码资讯
6902文章数 3815关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

媒体:美以的真实目标已经摆上台面 不达目的不罢休

头条要闻

媒体:美以的真实目标已经摆上台面 不达目的不罢休

体育要闻

球队主力全报销?顶风摆烂演都不演了

娱乐要闻

周杰伦儿子正面照曝光,与父亲好像

财经要闻

冲突爆发 市场变天?

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

教育
本地
时尚
家居
公开课

教育要闻

“比预估高了20多分,激动得有点想哭!”今天有人欢呼,有人沉默,有人红了眼眶,这一年都经历了什么?

本地新闻

津南好·四时总相宜

这6款发色居然这么火?50张图可以直接给tony

家居要闻

素色肌理 品意式格调

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版