网易首页 > 网易号 > 正文 申请入驻

DeepSeek又一论文上新

0
分享至

2026.02.27


本文字数:1213,阅读时长大约3分钟

作者 |第一财经 刘晓洁

在业界对新一代旗舰模型DeepSeek V4的翘首期盼中,DeepSeek团队却悄然放出了一篇新的学术论文。


这篇论文由DeepSeek联合北大、清华共同撰写,将研究方向投向了决定大模型实际应用落地的关键一环——推理速度,为日益复杂的AI智能体,提供一套高效的底层系统解决方案。

具体来说,新论文介绍了一个名为DualPath的创新推理系统,专门针对智能体工作负载下的大模型(LLM)推理性能进行优化。通过引入“双路径读取KV-Cache(类似记忆缓存)”机制,重新分配存储网络负载,将离线推理吞吐量最高提升 1.87 倍,在线服务的每秒智能体运行数平均提升 1.96 倍。

论文在引言部分提到,大模型正从单轮对话机器人和独立推理模型,快速演进为智能体系统 ——能够自主规划、调用工具,并通过多轮交互解决实际任务。这种应用范式的转变,推动大模型推理工作负载发生重大变革:从传统的人类-大模型交互,转向人类-大模型-环境交互,交互轮次可达数十甚至数百轮。

上下文会跨轮次累积,最终长度可能达到极值。此时模型不需要大量计算,反而需要频繁从硬盘读取历史上下文的 KV-Cache;现有系统中,只有负责预处理的引擎会读取KV-Cache,它的网卡带宽被占满,而负责生成内容的解码引擎,网卡带宽基本闲置,导致整个系统速度被卡脖子。

因此,论文提出的DualPath,针对智能体工作负载、重新设计现代推理架构中 KV-Cache加载逻辑,解决大模型做智能体任务时,速度被 “数据读取”拖慢的核心问题,重要的是把闲置的带宽资源利用起来,相当于给数据读取 “多开了一条高速路”,实现速度的大幅提升。

这一论文成果延续了DeepSeek一贯的风格,在工程化层面将性能优化推向极致。有从业者认为,DeepSeek做这类优化属于缺显卡的无奈之举,属于“脏活儿累活儿”,大家更期待团队在模型上做创新。

但也有人认为,即便有足够显卡,这类优化在降低成本、降低token费用方面也很有价值,因为只有足够便宜,AI才能走向大规模使用。

相比这篇“务实”的论文,外界显然更关注DeepSeek新一代旗舰模型的真面目。关于DeepSeek V4的发布时间,市场传闻已几经更迭。从最初传闻的2月春节前后,到外媒最新报道的“最快下周”,再到业内人士预测的3月前后,传闻链条愈发扑朔迷离。

就在近日,外网有网友爆料称,DeepSeek 正在测试 V4 Lite 模型,代号为“Sealion-lite”,上下文窗口为 100万tokens,并原生支持多模态推理。也有消息提及,DeepSeek已在近期将重大更新版本V4向华为等国内厂商提供提前访问权,以支持其优化处理器软件,确保模型在硬件上高效运行。然而,英伟达等厂商尚未获得类似权限。

面对传闻,DeepSeek依旧保持其一贯的沉默,目前并未进行任何回应。但市场已进入“严阵以待”状态,部分投资机构担忧,新一代模型的发布会如同去年的版本发布时那样,引发市场的剧烈震荡。

微信编辑| 小羊

第一财经持续追踪财经热点。若您掌握公司动态、行业趋势、金融事件等有价值的线索,欢迎提供。专用邮箱:bianjibu@yicai.com

(注:我们会对线索进行核实。您的隐私将严格保密。)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
236亿,是不是保利为越秀挖的坑

236亿,是不是保利为越秀挖的坑

科学发掘
2026-02-27 05:13:03
一夜暴富!20岁小哥意外中2亿彩票,瞒家人5年吃光了所有,最后你绝对想不到....

一夜暴富!20岁小哥意外中2亿彩票,瞒家人5年吃光了所有,最后你绝对想不到....

澳洲红领巾
2026-02-27 13:33:53
奥运会为什么发避孕套?难道运动员都带伴侣吗?看完你就明白了!

奥运会为什么发避孕套?难道运动员都带伴侣吗?看完你就明白了!

南权先生
2026-02-13 15:17:51
火箭最失败的运作!花5500万本想让他取代狄龙,结果打成边缘轮换

火箭最失败的运作!花5500万本想让他取代狄龙,结果打成边缘轮换

你的篮球频道
2026-02-27 15:49:05
伊朗媒体:伊朗拒绝向国外转移浓缩铀

伊朗媒体:伊朗拒绝向国外转移浓缩铀

财联社
2026-02-27 05:14:12
57岁周涛,“勇闯短剧圈”

57岁周涛,“勇闯短剧圈”

上观新闻
2026-02-27 10:19:52
造不出就买!260 亿吞下美国打印机巨头,珠海破解暴利垄断

造不出就买!260 亿吞下美国打印机巨头,珠海破解暴利垄断

知识TNT
2026-02-24 12:30:09
甲骨文创始人正式搬到佛罗里达州,与川普当邻居

甲骨文创始人正式搬到佛罗里达州,与川普当邻居

大洛杉矶LA
2026-02-27 07:56:46
网友建议“高速节假日免费”改“每车每年免费5000公里”,专家回应:技术成本高,短期内不具备全面落地的可行性

网友建议“高速节假日免费”改“每车每年免费5000公里”,专家回应:技术成本高,短期内不具备全面落地的可行性

极目新闻
2026-02-27 17:35:39
Nature重磅发现:超级老人的大脑在大量新生神经元,这让他们80岁以上时仍记忆超群、远离痴呆

Nature重磅发现:超级老人的大脑在大量新生神经元,这让他们80岁以上时仍记忆超群、远离痴呆

生物世界
2026-02-27 12:07:57
钱再多有啥用?56岁李富真走路东倒西歪、瘦成皮包骨,真不忍直视

钱再多有啥用?56岁李富真走路东倒西歪、瘦成皮包骨,真不忍直视

洲洲影视娱评
2026-02-27 15:07:49
开始抢人!美国一周挖走4名中国顶尖人才,年薪1个亿美元令人咋舌

开始抢人!美国一周挖走4名中国顶尖人才,年薪1个亿美元令人咋舌

古史青云啊
2026-02-26 19:45:46
中到大雪,局部暴雪!河南迎大范围雨雪天气,局部积雪深度可达12厘米,气温骤降近10℃,出行需防滑防冻

中到大雪,局部暴雪!河南迎大范围雨雪天气,局部积雪深度可达12厘米,气温骤降近10℃,出行需防滑防冻

大象新闻
2026-02-27 08:46:16
捡红包事件陷入僵局!车主不承认,金额难确认,失主做法惹争议!

捡红包事件陷入僵局!车主不承认,金额难确认,失主做法惹争议!

离离言几许
2026-02-27 14:24:43
5胞胎在武汉顺利出生,孩子爸爸称名字已取好,回家就给老婆买黄金;专家曾建议减胎,但孩子父母不忍心

5胞胎在武汉顺利出生,孩子爸爸称名字已取好,回家就给老婆买黄金;专家曾建议减胎,但孩子父母不忍心

极目新闻
2026-02-27 11:05:33
戴脚镣走完长征的战士,开国大典前毛主席见他:你不怕我把你忘喽

戴脚镣走完长征的战士,开国大典前毛主席见他:你不怕我把你忘喽

大运河时空
2026-02-27 12:25:03
外媒:巴基斯坦防长称“耐心已经耗尽”,巴方对阿富汗政府“公开宣战”

外媒:巴基斯坦防长称“耐心已经耗尽”,巴方对阿富汗政府“公开宣战”

环球网资讯
2026-02-27 09:29:11
打爆日本黑哨后!中国男篮上诉,郭士强或被追罚,赵睿伤情曝光!

打爆日本黑哨后!中国男篮上诉,郭士强或被追罚,赵睿伤情曝光!

绯雨儿
2026-02-27 15:35:49
为什么你永远存不到200万?因为体系不允许

为什么你永远存不到200万?因为体系不允许

流苏晚晴
2026-02-26 18:13:45
沉默整整9天,毛宁一锤定音,中美战机已交手,美方要见中国代表

沉默整整9天,毛宁一锤定音,中美战机已交手,美方要见中国代表

墨兰史书
2026-02-26 18:59:24
2026-02-27 18:47:00
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
245168文章数 621621关注度
往期回顾 全部

科技要闻

单张不到五毛!谷歌深夜发布Nano Banana 2

头条要闻

发布"中国男篮逆转日本队"的帖子中措辞不妥 FIBA致歉

头条要闻

发布"中国男篮逆转日本队"的帖子中措辞不妥 FIBA致歉

体育要闻

一场必须要赢的比赛,男篮何止击败了裁判

娱乐要闻

继网暴谷爱凌后 美国欲没收其全部收入

财经要闻

沈明高提共富建议 百姓持科技股国家兜底

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

房产
旅游
艺术
家居
公开课

房产要闻

重磅!海南“十五五”规划出炉!未来五年,方向定了!

旅游要闻

9天25万人次!春节期间泰国赢麻了

艺术要闻

紫气东来,好运一整年!

家居要闻

素色肌理 品意式格调

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版