网易首页 > 网易号 > 正文 申请入驻

DeepSeek联手北大清华放大招,吞吐量暴涨1.87倍,1152个GPU集群已跑通验证

0
分享至

2月27日,DeepSeek团队联合北京大学、清华大学共同发表了一篇学术论文,聚焦大模型在智能体场景下的推理性能优化问题。该论文提出了一个名为DualPath的创新推理系统,通过重新设计底层数据加载架构,为日益复杂的AI智能体工作负载提供高效的系统级解决方案。

根据论文披露的数据,DualPath系统通过引入"双路径读取KV-Cache"机制,重新分配集群内存储网络负载,在离线推理场景中将吞吐量最高提升1.87倍,在线服务场景下每秒智能体运行数平均提升1.96倍。该系统已在包含1152个GPU的大规模生产集群上完成验证,支持DeepSeek-V3.2 660B等大参数量模型的部署。

论文指出,当前大模型正从单轮对话机器人和独立推理模型,快速演进为能够自主规划、调用工具并通过多轮交互解决实际任务的智能体系统。这种应用范式的转变,推动推理工作负载从传统的人类与大模型之间的交互,转向人类、大模型与环境三方之间的交互,交互轮次可达数十甚至数百轮。在这种多轮短追加的模式下,历史上下文的KV-Cache命中率通常超过95%,系统性能的决定性因素不再是GPU算力本身,而是从存储中加载缓存数据的效率。

现有主流的预填充与解码分离架构存在结构性瓶颈——预填充引擎的存储网卡带宽被大量KV-Cache读取占满,而解码引擎的存储带宽却大量闲置。DualPath的核心思路是在传统的存储到预填充路径之外,新增一条"存储到解码再到预填充"的加载通道,通过动态分配两条路径的数据流量,将集群内所有引擎的存储网卡聚合为全局资源池,从根本上打破单节点I/O的限制。

值得注意的是,这篇论文发布的时间节点恰逢业界对DeepSeek下一代旗舰模型V4的高度期待。与此同时,智能体正成为大模型行业竞争的核心方向。中信证券研报指出,AI应用场景从简单对话向AI智能体升级,单次任务token消耗呈指数级上升,token的爆发式增长本质上反映出AI推理需求的指数级扩容。在这一背景下,DeepSeek选择将研究方向投向推理系统的底层优化,为智能体大规模落地铺设基础设施层面的技术路径。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

本文源自:市场资讯

作者:观察君

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
17年血战史,比太平军更狠的捻军,为何史书几乎不记载?

17年血战史,比太平军更狠的捻军,为何史书几乎不记载?

长风文史
2026-02-28 10:32:44
【早报】证监会召开重磅会议,吴清发声;特朗警告伊朗“有时候不得不打”

【早报】证监会召开重磅会议,吴清发声;特朗警告伊朗“有时候不得不打”

财联社
2026-02-28 07:33:07
新加坡住了一年才敢说:被吹上天的居者有其屋,其实是一地鸡毛

新加坡住了一年才敢说:被吹上天的居者有其屋,其实是一地鸡毛

天下霸奇
2026-02-24 08:09:25
社保再次迎来新规:2026年起没交满15年的有福了!全都统一处理

社保再次迎来新规:2026年起没交满15年的有福了!全都统一处理

复转小能手
2026-02-28 01:50:03
美股全线下跌,道指重挫超500点,英伟达跌超4%,金银油大涨

美股全线下跌,道指重挫超500点,英伟达跌超4%,金银油大涨

每日经济新闻
2026-02-28 11:31:38
耗资12亿建世界最高佛,如今水喝不起拜不起

耗资12亿建世界最高佛,如今水喝不起拜不起

时光流转追梦人
2026-02-20 13:09:13
下调到0!人民币狂飙央妈急刹车,粉碎广场协议,不当第二个日本

下调到0!人民币狂飙央妈急刹车,粉碎广场协议,不当第二个日本

原来仙女不讲理
2026-02-28 11:05:27
夜间气温达零下30℃!泽连斯基:乌面临几十年来最难冬天,下轮会谈或在阿布扎比

夜间气温达零下30℃!泽连斯基:乌面临几十年来最难冬天,下轮会谈或在阿布扎比

红星新闻
2026-02-27 17:33:09
7.4到6.84,人民币升值"核爆"!国内通胀、资产价格要全面起飞?

7.4到6.84,人民币升值"核爆"!国内通胀、资产价格要全面起飞?

阿讯说天下
2026-02-27 13:51:52
谁抢走了订单?外企扎堆越南后才明白,“世界工厂”只是一场美梦

谁抢走了订单?外企扎堆越南后才明白,“世界工厂”只是一场美梦

百科密码
2026-02-25 15:17:32
玄武门之变,李世民为啥只霸占李元吉之妻,却没霸占李建成老婆?

玄武门之变,李世民为啥只霸占李元吉之妻,却没霸占李建成老婆?

老媹古装影视解说
2026-02-26 20:08:25
博士读着读着导师变后妈,毕业还延期了…还有更离谱的吗?

博士读着读着导师变后妈,毕业还延期了…还有更离谱的吗?

超级数学建模
2026-02-22 22:38:39
火箭内讧门落幕:杜兰特小号事件主角申京小贾转发KD40分海报

火箭内讧门落幕:杜兰特小号事件主角申京小贾转发KD40分海报

醉卧浮生
2026-02-28 09:14:29
中国台北男篮换人:前CBA榜眼重伤无缘战中国男篮 游艾喆顶替

中国台北男篮换人:前CBA榜眼重伤无缘战中国男篮 游艾喆顶替

醉卧浮生
2026-02-28 12:25:56
四部门宣布:放高利贷正式入罪

四部门宣布:放高利贷正式入罪

新浪财经
2026-02-27 17:10:34
知名品牌宣布:关闭中国所有门店!

知名品牌宣布:关闭中国所有门店!

江南晚报
2026-02-28 10:43:32
澳大利亚惊现封闭乱伦家族:4代人近亲繁衍38名成员全是乱伦产物

澳大利亚惊现封闭乱伦家族:4代人近亲繁衍38名成员全是乱伦产物

第7情感
2026-02-23 20:45:16
突发!2026年全国第一巨额抢劫案在江苏发生了,197万,疑犯已捕

突发!2026年全国第一巨额抢劫案在江苏发生了,197万,疑犯已捕

古事寻踪记
2026-02-28 07:08:05
神仙老板!00后员工年薪80万元开奔驰,老板月薪5000元开二手普桑……

神仙老板!00后员工年薪80万元开奔驰,老板月薪5000元开二手普桑……

上观新闻
2026-02-28 13:01:12
伊朗终于学聪明了,原本的必死局,硬是找到一条绝处逢生之路

伊朗终于学聪明了,原本的必死局,硬是找到一条绝处逢生之路

Ck的蜜糖
2026-02-27 20:24:03
2026-02-28 15:40:49
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
9194706文章数 545974关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

最高领袖办公室附近遭袭 媒体:伊朗领导体系仍具韧性

头条要闻

最高领袖办公室附近遭袭 媒体:伊朗领导体系仍具韧性

体育要闻

球队主力全报销?顶风摆烂演都不演了

娱乐要闻

疑似王一博被爆私密聊天记录

财经要闻

沈明高提共富建议 百姓持科技股国家兜底

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

艺术
家居
数码
旅游
公开课

艺术要闻

2025第十四届中国艺术节全国优秀美术作品展 | 入选油画选刊

家居要闻

素色肌理 品意式格调

数码要闻

海信RGB-Mini LED电视UX 2026款3月5日发布

旅游要闻

郑州公交两条文旅巴士同时上线 免费带你一站式寻梅赏樱

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版