网易首页 > 网易号 > 正文 申请入驻

DeepSeek又一论文上新

0
分享至

2026.02.27


本文字数:1213,阅读时长大约3分钟

作者 |第一财经 刘晓洁

在业界对新一代旗舰模型DeepSeek V4的翘首期盼中,DeepSeek团队却悄然放出了一篇新的学术论文。


这篇论文由DeepSeek联合北大、清华共同撰写,将研究方向投向了决定大模型实际应用落地的关键一环——推理速度,为日益复杂的AI智能体,提供一套高效的底层系统解决方案。

具体来说,新论文介绍了一个名为DualPath的创新推理系统,专门针对智能体工作负载下的大模型(LLM)推理性能进行优化。通过引入“双路径读取KV-Cache(类似记忆缓存)”机制,重新分配存储网络负载,将离线推理吞吐量最高提升 1.87 倍,在线服务的每秒智能体运行数平均提升 1.96 倍。

论文在引言部分提到,大模型正从单轮对话机器人和独立推理模型,快速演进为智能体系统 ——能够自主规划、调用工具,并通过多轮交互解决实际任务。这种应用范式的转变,推动大模型推理工作负载发生重大变革:从传统的人类-大模型交互,转向人类-大模型-环境交互,交互轮次可达数十甚至数百轮。

上下文会跨轮次累积,最终长度可能达到极值。此时模型不需要大量计算,反而需要频繁从硬盘读取历史上下文的 KV-Cache;现有系统中,只有负责预处理的引擎会读取KV-Cache,它的网卡带宽被占满,而负责生成内容的解码引擎,网卡带宽基本闲置,导致整个系统速度被卡脖子。

因此,论文提出的DualPath,针对智能体工作负载、重新设计现代推理架构中 KV-Cache加载逻辑,解决大模型做智能体任务时,速度被 “数据读取”拖慢的核心问题,重要的是把闲置的带宽资源利用起来,相当于给数据读取 “多开了一条高速路”,实现速度的大幅提升。

这一论文成果延续了DeepSeek一贯的风格,在工程化层面将性能优化推向极致。有从业者认为,DeepSeek做这类优化属于缺显卡的无奈之举,属于“脏活儿累活儿”,大家更期待团队在模型上做创新。

但也有人认为,即便有足够显卡,这类优化在降低成本、降低token费用方面也很有价值,因为只有足够便宜,AI才能走向大规模使用。

相比这篇“务实”的论文,外界显然更关注DeepSeek新一代旗舰模型的真面目。关于DeepSeek V4的发布时间,市场传闻已几经更迭。从最初传闻的2月春节前后,到外媒最新报道的“最快下周”,再到业内人士预测的3月前后,传闻链条愈发扑朔迷离。

就在近日,外网有网友爆料称,DeepSeek 正在测试 V4 Lite 模型,代号为“Sealion-lite”,上下文窗口为 100万tokens,并原生支持多模态推理。也有消息提及,DeepSeek已在近期将重大更新版本V4向华为等国内厂商提供提前访问权,以支持其优化处理器软件,确保模型在硬件上高效运行。然而,英伟达等厂商尚未获得类似权限。

面对传闻,DeepSeek依旧保持其一贯的沉默,目前并未进行任何回应。但市场已进入“严阵以待”状态,部分投资机构担忧,新一代模型的发布会如同去年的版本发布时那样,引发市场的剧烈震荡。

微信编辑| 小羊

第一财经持续追踪财经热点。若您掌握公司动态、行业趋势、金融事件等有价值的线索,欢迎提供。专用邮箱:bianjibu@yicai.com

(注:我们会对线索进行核实。您的隐私将严格保密。)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
港圈:你可以跟英皇唱反调,但千万给容祖儿难堪!45岁的她凭什么

港圈:你可以跟英皇唱反调,但千万给容祖儿难堪!45岁的她凭什么

她时尚丫
2026-05-11 22:27:40
霸气!吴前妻子炮轰浙江:一直很Respect!少上我理解完全不上就离谱

霸气!吴前妻子炮轰浙江:一直很Respect!少上我理解完全不上就离谱

818体育
2026-05-11 22:26:13
这部2025最佳科幻片杀进Netflix前十

这部2025最佳科幻片杀进Netflix前十

影视情报室
2026-05-10 21:15:52
懵了!文班被罚下后问队友:二级恶犯啥意思?我被驱逐了?

懵了!文班被罚下后问队友:二级恶犯啥意思?我被驱逐了?

懂球帝
2026-05-11 10:12:14
起风了!特朗普登上专机前,郑丽文划下红线:不许支持“台独”

起风了!特朗普登上专机前,郑丽文划下红线:不许支持“台独”

共工之锚
2026-05-11 22:28:29
张本美和获609分!颁奖典礼后大方展示银牌 17岁世排升第三创新高

张本美和获609分!颁奖典礼后大方展示银牌 17岁世排升第三创新高

颜小白的篮球梦
2026-05-11 14:21:13
我穿便装到妻子家过年,被厅长大舅哥使唤,警卫员送来文件他愣了

我穿便装到妻子家过年,被厅长大舅哥使唤,警卫员送来文件他愣了

千秋文化
2026-05-08 10:29:06
火箭队的库明加?季后赛表现稳定,均薪2600万值吗?

火箭队的库明加?季后赛表现稳定,均薪2600万值吗?

Haviven聊球
2026-05-11 22:58:15
133亿砸下!广州地铁28号线将全面开工

133亿砸下!广州地铁28号线将全面开工

楼市前线
2026-05-11 19:26:20
特朗普访华前夕,两大邻国突然出手!扬言要切断中国海上生命线?

特朗普访华前夕,两大邻国突然出手!扬言要切断中国海上生命线?

史行途
2026-05-11 15:16:48
赵朴初:比风水厉害100倍的宇宙定律

赵朴初:比风水厉害100倍的宇宙定律

中国艺术家
2026-04-29 05:23:03
台湾政坛出现变动!美国果然小看了郑丽文,中国大陆话已挑明!

台湾政坛出现变动!美国果然小看了郑丽文,中国大陆话已挑明!

混沌录
2026-05-11 22:45:18
广东休赛期大洗牌:张皓嘉2人稳了,奎因也不用走,拉科4人恐被裁

广东休赛期大洗牌:张皓嘉2人稳了,奎因也不用走,拉科4人恐被裁

二哥聊球
2026-05-11 12:21:04
马云再聊未来房价:180万的房子,到2030年还能值多少钱?

马云再聊未来房价:180万的房子,到2030年还能值多少钱?

猫叔东山再起
2026-05-11 08:35:13
人口大洗牌背后:广东79万增量领跑,浙沪靠外来人口“托底”

人口大洗牌背后:广东79万增量领跑,浙沪靠外来人口“托底”

21世纪经济报道
2026-05-11 11:47:28
詹皇定律?此前横扫詹姆斯的球队:马刺、勇士、掘金都夺冠了

詹皇定律?此前横扫詹姆斯的球队:马刺、勇士、掘金都夺冠了

懂球帝
2026-05-11 15:30:07
越南这场闹剧,终于还是没演下去,670亿美金的高铁梦彻底碎了!

越南这场闹剧,终于还是没演下去,670亿美金的高铁梦彻底碎了!

青青子衿
2025-12-27 02:06:04
一婚娶演员,二婚娶主持,如今在江苏租房住,和四个娃过田园生活

一婚娶演员,二婚娶主持,如今在江苏租房住,和四个娃过田园生活

素衣读史
2026-05-11 20:56:03
“重达11000克拉”!外媒:缅甸发现迄今为止第二重的“罕见巨型”红宝石

“重达11000克拉”!外媒:缅甸发现迄今为止第二重的“罕见巨型”红宝石

环球网资讯
2026-05-10 11:20:10
15.98万,真的疯了

15.98万,真的疯了

放毒
2026-05-09 18:53:10
2026-05-11 23:19:00
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
252846文章数 622273关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

重庆一57岁女医生驾奔驰酿车祸 操作不当致2死6伤

头条要闻

重庆一57岁女医生驾奔驰酿车祸 操作不当致2死6伤

体育要闻

梁靖崑:可能是最后一届了,想让大家记住这个我

娱乐要闻

“孕妇坠崖案”王暖暖称被霸凌协商解约

财经要闻

宗馥莉罢免销售负责人 部分业务将外包

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

本地
时尚
家居
公开课
军事航空

本地新闻

用苏绣的方式,打开江西婺源

2026年了,最好看的还是这件上衣

家居要闻

多元生活 此处无声

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:伊朗的回应“完全不可接受”

无障碍浏览 进入关怀版