网易首页 > 网易号 > 正文 申请入驻

DeepSeek又一论文上新!新模型V4更近了?

0
分享至

在业界对新一代旗舰模型DeepSeek V4的翘首期盼中,DeepSeek团队却悄然放出了一篇新的学术论文。


这篇论文由DeepSeek联合北大、清华共同撰写,将研究方向投向了决定大模型实际应用落地的关键一环——推理速度,为日益复杂的AI智能体,提供一套高效的底层系统解决方案。

具体来说,新论文介绍了一个名为DualPath的创新推理系统,专门针对智能体工作负载下的大模型(LLM)推理性能进行优化。通过引入“双路径读取KV-Cache(类似记忆缓存)”机制,重新分配存储网络负载,将离线推理吞吐量最高提升 1.87 倍,在线服务的每秒智能体运行数平均提升 1.96 倍。

论文在引言部分提到,大模型正从单轮对话机器人和独立推理模型,快速演进为智能体系统 ——能够自主规划、调用工具,并通过多轮交互解决实际任务。这种应用范式的转变,推动大模型推理工作负载发生重大变革:从传统的人类-大模型交互,转向人类-大模型-环境交互,交互轮次可达数十甚至数百轮。

上下文会跨轮次累积,最终长度可能达到极值。此时模型不需要大量计算,反而需要频繁从硬盘读取历史上下文的 KV-Cache;现有系统中,只有负责预处理的引擎会读取KV-Cache,它的网卡带宽被占满,而负责生成内容的解码引擎,网卡带宽基本闲置,导致整个系统速度被卡脖子。

因此,论文提出的DualPath,针对智能体工作负载、重新设计现代推理架构中 KV-Cache加载逻辑,解决大模型做智能体任务时,速度被 “数据读取”拖慢的核心问题,重要的是把闲置的带宽资源利用起来,相当于给数据读取 “多开了一条高速路”,实现速度的大幅提升。

这一论文成果延续了DeepSeek一贯的风格,在工程化层面将性能优化推向极致。有从业者认为,DeepSeek做这类优化属于缺显卡的无奈之举,属于“脏活儿累活儿”,大家更期待团队在模型上做创新。

但也有人认为,即便有足够显卡,这类优化在降低成本、降低token费用方面也很有价值,因为只有足够便宜,AI才能走向大规模使用。

相比这篇“务实”的论文,外界显然更关注DeepSeek新一代旗舰模型的真面目。关于DeepSeek V4的发布时间,市场传闻已几经更迭。从最初传闻的2月春节前后,到外媒最新报道的“最快下周”,再到业内人士预测的3月前后,传闻链条愈发扑朔迷离。

就在近日,外网有网友爆料称,DeepSeek 正在测试 V4 Lite 模型,代号为“Sealion-lite”,上下文窗口为 100万tokens,并原生支持多模态推理。也有消息提及,DeepSeek已在近期将重大更新版本V4向华为等国内厂商提供提前访问权,以支持其优化处理器软件,确保模型在硬件上高效运行。然而,英伟达等厂商尚未获得类似权限。

面对传闻,DeepSeek依旧保持其一贯的沉默,目前并未进行任何回应。但市场已进入“严阵以待”状态,部分投资机构担忧,新一代模型的发布会如同去年的版本发布时那样,引发市场的剧烈震荡。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
34岁内马尔建功:禁区1v2进死角!17场11球4助 冲刺世界杯

34岁内马尔建功:禁区1v2进死角!17场11球4助 冲刺世界杯

叶青足球世界
2026-05-11 09:01:47
彻底不装了!央视拒付天价转播费仅48小时,炸出一堆“牛鬼蛇神”

彻底不装了!央视拒付天价转播费仅48小时,炸出一堆“牛鬼蛇神”

好贤观史记
2026-05-08 16:10:06
新加坡最高法院上诉庭大法官莊泓翔:新加坡法院对于仲裁程序的支持和保障

新加坡最高法院上诉庭大法官莊泓翔:新加坡法院对于仲裁程序的支持和保障

中国审判
2026-05-11 09:10:16
重庆黔江2死6伤车祸的女司机是一个57岁的大姐,事发时穿高跟鞋

重庆黔江2死6伤车祸的女司机是一个57岁的大姐,事发时穿高跟鞋

魔都姐姐杂谈
2026-05-11 01:50:55
央视主持人朱迅:生命终点将结束,为何不勇敢面对生命的终点呢?

央视主持人朱迅:生命终点将结束,为何不勇敢面对生命的终点呢?

吃青菜长高
2026-05-10 06:28:57
每日运势【05月11日]

每日运势【05月11日]

匹夫来搞笑
2026-05-11 09:19:36
欠了快400亿,骂了整十年,华西村硬是靠一笔意外投资活过来了

欠了快400亿,骂了整十年,华西村硬是靠一笔意外投资活过来了

小莜读史
2026-05-07 19:10:59
第一集就全裸出镜,女神新剧破格出演了

第一集就全裸出镜,女神新剧破格出演了

来看美剧
2026-04-27 16:21:10
天价皮皮虾事件盖棺定论!43岁店主猝然病逝,为三亚文旅局点赞!

天价皮皮虾事件盖棺定论!43岁店主猝然病逝,为三亚文旅局点赞!

壹月情感
2026-05-10 20:56:11
乘客点了承担高速费却不给,车主原路返回乘客懵了,车主霸气回应

乘客点了承担高速费却不给,车主原路返回乘客懵了,车主霸气回应

阿莱美食汇
2026-05-10 10:19:29
高动态主摄+天玑9600+7000mAh电池,vivo X500系列三款新机已备案

高动态主摄+天玑9600+7000mAh电池,vivo X500系列三款新机已备案

机智万象
2026-05-08 22:46:33
长得太美被导演占为己有,25岁生下3个孩子,如今个个都给她争光

长得太美被导演占为己有,25岁生下3个孩子,如今个个都给她争光

揽星河的笔记
2026-05-07 20:18:36
无敌!七场净胜对手128分!

无敌!七场净胜对手128分!

柚子说球
2026-05-11 08:28:22
骑士翻盘进东决?四大要素证明,活塞是强弩之末,骑士双核在改变

骑士翻盘进东决?四大要素证明,活塞是强弩之末,骑士双核在改变

老梁体育漫谈
2026-05-11 00:03:27
李国旭:请求我们的球迷不要责怪我们的队员,他们确实尽力了

李国旭:请求我们的球迷不要责怪我们的队员,他们确实尽力了

懂球帝
2026-05-10 23:29:39
伪造合格证、电池以旧代新…《财经调查》曝光危险的“手搓汽车”

伪造合格证、电池以旧代新…《财经调查》曝光危险的“手搓汽车”

央视财经
2026-05-10 21:22:13
王楚钦打崩松岛辉空,王曼昱公开感谢孙颖莎,王艺迪回应缺席决赛

王楚钦打崩松岛辉空,王曼昱公开感谢孙颖莎,王艺迪回应缺席决赛

三十年莱斯特城球迷
2026-05-11 01:03:31
44岁陈震北京车展现状:从网红到无人问津不冤

44岁陈震北京车展现状:从网红到无人问津不冤

微风轻拂面
2026-04-27 20:59:00
要打奉陪到底,中方当面插旗,沉默72小时后,日本在境外发射导弹

要打奉陪到底,中方当面插旗,沉默72小时后,日本在境外发射导弹

闻识
2026-05-08 20:14:00
王楚钦夺冠仅1天,奥委会却这样评价他,16字言辞犀利,字字戳心

王楚钦夺冠仅1天,奥委会却这样评价他,16字言辞犀利,字字戳心

漫婷侃娱乐
2026-04-07 23:01:23
2026-05-11 10:35:00
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
252797文章数 622256关注度
往期回顾 全部

科技要闻

股价一年暴涨160%!谷歌凭什么?

头条要闻

美国经济学家:"台独"是中美共同的敌人 意味着战争

头条要闻

美国经济学家:"台独"是中美共同的敌人 意味着战争

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

"手搓汽车"曝光:伪造证件、电池以旧代新

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

本地
时尚
房产
家居
公开课

本地新闻

用苏绣的方式,打开江西婺源

轻松拿捏又甜又酷的造型,试试这些轻熟穿搭,温柔有女人味儿

房产要闻

低价甩卖!海口这个地标商业,无人接盘!

家居要闻

菁英人居 全能豪宅

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版