网易首页 > 网易号 > 正文 申请入驻

DeepSeek又一论文上新!新模型V4更近了?

0
分享至

在业界对新一代旗舰模型DeepSeek V4的翘首期盼中,DeepSeek团队却悄然放出了一篇新的学术论文。


这篇论文由DeepSeek联合北大、清华共同撰写,将研究方向投向了决定大模型实际应用落地的关键一环——推理速度,为日益复杂的AI智能体,提供一套高效的底层系统解决方案。

具体来说,新论文介绍了一个名为DualPath的创新推理系统,专门针对智能体工作负载下的大模型(LLM)推理性能进行优化。通过引入“双路径读取KV-Cache(类似记忆缓存)”机制,重新分配存储网络负载,将离线推理吞吐量最高提升 1.87 倍,在线服务的每秒智能体运行数平均提升 1.96 倍。

论文在引言部分提到,大模型正从单轮对话机器人和独立推理模型,快速演进为智能体系统 ——能够自主规划、调用工具,并通过多轮交互解决实际任务。这种应用范式的转变,推动大模型推理工作负载发生重大变革:从传统的人类-大模型交互,转向人类-大模型-环境交互,交互轮次可达数十甚至数百轮。

上下文会跨轮次累积,最终长度可能达到极值。此时模型不需要大量计算,反而需要频繁从硬盘读取历史上下文的 KV-Cache;现有系统中,只有负责预处理的引擎会读取KV-Cache,它的网卡带宽被占满,而负责生成内容的解码引擎,网卡带宽基本闲置,导致整个系统速度被卡脖子。

因此,论文提出的DualPath,针对智能体工作负载、重新设计现代推理架构中 KV-Cache加载逻辑,解决大模型做智能体任务时,速度被 “数据读取”拖慢的核心问题,重要的是把闲置的带宽资源利用起来,相当于给数据读取 “多开了一条高速路”,实现速度的大幅提升。

这一论文成果延续了DeepSeek一贯的风格,在工程化层面将性能优化推向极致。有从业者认为,DeepSeek做这类优化属于缺显卡的无奈之举,属于“脏活儿累活儿”,大家更期待团队在模型上做创新。

但也有人认为,即便有足够显卡,这类优化在降低成本、降低token费用方面也很有价值,因为只有足够便宜,AI才能走向大规模使用。

相比这篇“务实”的论文,外界显然更关注DeepSeek新一代旗舰模型的真面目。关于DeepSeek V4的发布时间,市场传闻已几经更迭。从最初传闻的2月春节前后,到外媒最新报道的“最快下周”,再到业内人士预测的3月前后,传闻链条愈发扑朔迷离。

就在近日,外网有网友爆料称,DeepSeek 正在测试 V4 Lite 模型,代号为“Sealion-lite”,上下文窗口为 100万tokens,并原生支持多模态推理。也有消息提及,DeepSeek已在近期将重大更新版本V4向华为等国内厂商提供提前访问权,以支持其优化处理器软件,确保模型在硬件上高效运行。然而,英伟达等厂商尚未获得类似权限。

面对传闻,DeepSeek依旧保持其一贯的沉默,目前并未进行任何回应。但市场已进入“严阵以待”状态,部分投资机构担忧,新一代模型的发布会如同去年的版本发布时那样,引发市场的剧烈震荡。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刷到马上去翻箱倒柜了!价格翻10倍,涨幅比黄金都狠!你家有吗?

刷到马上去翻箱倒柜了!价格翻10倍,涨幅比黄金都狠!你家有吗?

佛山电视台小强热线
2026-02-25 19:24:23
“排队枪毙” 战术看似笨拙,欧洲却凭此称霸全球?真的只因阵型密集、射击精准吗?

“排队枪毙” 战术看似笨拙,欧洲却凭此称霸全球?真的只因阵型密集、射击精准吗?

寄史言志
2026-02-08 23:05:04
女生主动起来有多黏人?网友:这些女的太开放了

女生主动起来有多黏人?网友:这些女的太开放了

带你感受人间冷暖
2026-01-27 00:20:06
牢A能这么火,是有原因的!

牢A能这么火,是有原因的!

走读新生
2026-01-23 14:09:59
出大事了,普京罕见喊话,对百万俄军下达最新指令,乌难逃一劫

出大事了,普京罕见喊话,对百万俄军下达最新指令,乌难逃一劫

王飬吃吃喝喝
2026-02-28 02:54:52
封神的大胡子!哈登加盟骑士即封神,历史第一人竟还是他自己

封神的大胡子!哈登加盟骑士即封神,历史第一人竟还是他自己

体育闲话说
2026-02-22 15:54:20
超200亿,跑了!

超200亿,跑了!

中国基金报
2026-02-27 14:11:33
断崖式下跌!中国人突然不爱喝酒了?真相太扎心!

断崖式下跌!中国人突然不爱喝酒了?真相太扎心!

达文西看世界
2026-01-18 20:56:11
消息称DeepSeek V4模型让华为等早期访问,不让英伟达AMD先用

消息称DeepSeek V4模型让华为等早期访问,不让英伟达AMD先用

IT之家
2026-02-27 09:25:38
终于知道生儿子的真实体验了!这是我见过最通俗易懂的答案

终于知道生儿子的真实体验了!这是我见过最通俗易懂的答案

另子维爱读史
2026-01-24 21:32:39
新娘临时要9万9下车费,新郎去取钱却没回来,新娘找到婆家后慌了

新娘临时要9万9下车费,新郎去取钱却没回来,新娘找到婆家后慌了

白云故事
2025-03-27 19:35:12
比美国更毒!日本怀恨稀土之仇,要把中国光刻机变废铁!

比美国更毒!日本怀恨稀土之仇,要把中国光刻机变废铁!

达文西看世界
2026-02-22 20:15:06
高人预测:如果不出意外,3月或将出现4个变化,提前准备好

高人预测:如果不出意外,3月或将出现4个变化,提前准备好

刘哥谈体育
2026-02-28 00:50:41
国际篮联重罚!中国男篮遇到2次误判细节披露,中国篮协应上诉

国际篮联重罚!中国男篮遇到2次误判细节披露,中国篮协应上诉

现代小青青慕慕
2026-02-27 06:53:55
你听过最劲爆的瓜是啥?网友:被大八岁的补习班老师表白了

你听过最劲爆的瓜是啥?网友:被大八岁的补习班老师表白了

带你感受人间冷暖
2025-11-26 00:10:06
欧协联1/8决赛对阵:水晶宫vs拉纳卡,佛罗伦萨vs琴斯托霍瓦

欧协联1/8决赛对阵:水晶宫vs拉纳卡,佛罗伦萨vs琴斯托霍瓦

懂球帝
2026-02-27 21:26:15
一婚嫁给富商,二婚嫁给导演,三婚再嫁给富商,58岁的她怎样了?

一婚嫁给富商,二婚嫁给导演,三婚再嫁给富商,58岁的她怎样了?

小熊侃史
2026-02-27 21:30:21
四年战争给俄罗斯带来的变化

四年战争给俄罗斯带来的变化

参考消息
2026-02-26 19:51:12
人一过60,永远不要在熟人面前,说以下几句话,谁说谁后悔,切记

人一过60,永远不要在熟人面前,说以下几句话,谁说谁后悔,切记

枫红染山径
2026-01-02 14:59:55
真正的“逆龄运动”,坚持一年大脑年轻2.3岁!不是跑步、走路……

真正的“逆龄运动”,坚持一年大脑年轻2.3岁!不是跑步、走路……

人民日报健康客户端
2026-02-25 07:34:27
2026-02-28 04:48:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
245203文章数 621625关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

特朗普警告伊朗:“有时候不得不打”

头条要闻

特朗普警告伊朗:“有时候不得不打”

体育要闻

一场必须要赢的比赛,男篮何止击败了裁判

娱乐要闻

郭晶晶霍启刚现身香港艺术节尽显恩爱

财经要闻

沈明高提共富建议 百姓持科技股国家兜底

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

本地
手机
时尚
公开课
军事航空

本地新闻

津南好·四时总相宜

手机要闻

荣耀600系列再次被确认:9000mAh+两亿像素,处理器有悬念!

舒淇最爱穿的裙子搭配,真的很适合春天!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国11架F-22隐形战机抵达以色列

无障碍浏览 进入关怀版