网易首页 > 网易号 > 正文 申请入驻

DeepSeek又一论文上新!新模型V4更近了?

0
分享至

来源:市场资讯

(来源:第一财经资讯)

在业界对新一代旗舰模型DeepSeek V4的翘首期盼中,DeepSeek团队却悄然放出了一篇新的学术论文。


这篇论文由DeepSeek联合北大、清华共同撰写,将研究方向投向了决定大模型实际应用落地的关键一环——推理速度,为日益复杂的AI智能体,提供一套高效的底层系统解决方案。

具体来说,新论文介绍了一个名为DualPath的创新推理系统,专门针对智能体工作负载下的大模型(LLM)推理性能进行优化。通过引入“双路径读取KV-Cache(类似记忆缓存)”机制,重新分配存储网络负载,将离线推理吞吐量最高提升 1.87 倍,在线服务的每秒智能体运行数平均提升 1.96 倍。

论文在引言部分提到,大模型正从单轮对话机器人和独立推理模型,快速演进为智能体系统 ——能够自主规划、调用工具,并通过多轮交互解决实际任务。这种应用范式的转变,推动大模型推理工作负载发生重大变革:从传统的人类-大模型交互,转向人类-大模型-环境交互,交互轮次可达数十甚至数百轮。

上下文会跨轮次累积,最终长度可能达到极值。此时模型不需要大量计算,反而需要频繁从硬盘读取历史上下文的 KV-Cache;现有系统中,只有负责预处理的引擎会读取KV-Cache,它的网卡带宽被占满,而负责生成内容的解码引擎,网卡带宽基本闲置,导致整个系统速度被卡脖子。

因此,论文提出的DualPath,针对智能体工作负载、重新设计现代推理架构中 KV-Cache加载逻辑,解决大模型做智能体任务时,速度被 “数据读取”拖慢的核心问题,重要的是把闲置的带宽资源利用起来,相当于给数据读取 “多开了一条高速路”,实现速度的大幅提升。

这一论文成果延续了DeepSeek一贯的风格,在工程化层面将性能优化推向极致。有从业者认为,DeepSeek做这类优化属于缺显卡的无奈之举,属于“脏活儿累活儿”,大家更期待团队在模型上做创新。

但也有人认为,即便有足够显卡,这类优化在降低成本、降低token费用方面也很有价值,因为只有足够便宜,AI才能走向大规模使用。

相比这篇“务实”的论文,外界显然更关注DeepSeek新一代旗舰模型的真面目。关于DeepSeek V4的发布时间,市场传闻已几经更迭。从最初传闻的2月春节前后,到外媒最新报道的“最快下周”,再到业内人士预测的3月前后,传闻链条愈发扑朔迷离。

就在近日,外网有网友爆料称,DeepSeek 正在测试 V4 Lite 模型,代号为“Sealion-lite”,上下文窗口为 100万tokens,并原生支持多模态推理。也有消息提及,DeepSeek已在近期将重大更新版本V4向华为等国内厂商提供提前访问权,以支持其优化处理器软件,确保模型在硬件上高效运行。然而,英伟达等厂商尚未获得类似权限。

面对传闻,DeepSeek依旧保持其一贯的沉默,目前并未进行任何回应。但市场已进入“严阵以待”状态,部分投资机构担忧,新一代模型的发布会如同去年的版本发布时那样,引发市场的剧烈震荡。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
236亿,是不是保利为越秀挖的坑

236亿,是不是保利为越秀挖的坑

科学发掘
2026-02-27 05:13:03
一夜暴富!20岁小哥意外中2亿彩票,瞒家人5年吃光了所有,最后你绝对想不到....

一夜暴富!20岁小哥意外中2亿彩票,瞒家人5年吃光了所有,最后你绝对想不到....

澳洲红领巾
2026-02-27 13:33:53
奥运会为什么发避孕套?难道运动员都带伴侣吗?看完你就明白了!

奥运会为什么发避孕套?难道运动员都带伴侣吗?看完你就明白了!

南权先生
2026-02-13 15:17:51
火箭最失败的运作!花5500万本想让他取代狄龙,结果打成边缘轮换

火箭最失败的运作!花5500万本想让他取代狄龙,结果打成边缘轮换

你的篮球频道
2026-02-27 15:49:05
伊朗媒体:伊朗拒绝向国外转移浓缩铀

伊朗媒体:伊朗拒绝向国外转移浓缩铀

财联社
2026-02-27 05:14:12
57岁周涛,“勇闯短剧圈”

57岁周涛,“勇闯短剧圈”

上观新闻
2026-02-27 10:19:52
造不出就买!260 亿吞下美国打印机巨头,珠海破解暴利垄断

造不出就买!260 亿吞下美国打印机巨头,珠海破解暴利垄断

知识TNT
2026-02-24 12:30:09
甲骨文创始人正式搬到佛罗里达州,与川普当邻居

甲骨文创始人正式搬到佛罗里达州,与川普当邻居

大洛杉矶LA
2026-02-27 07:56:46
网友建议“高速节假日免费”改“每车每年免费5000公里”,专家回应:技术成本高,短期内不具备全面落地的可行性

网友建议“高速节假日免费”改“每车每年免费5000公里”,专家回应:技术成本高,短期内不具备全面落地的可行性

极目新闻
2026-02-27 17:35:39
Nature重磅发现:超级老人的大脑在大量新生神经元,这让他们80岁以上时仍记忆超群、远离痴呆

Nature重磅发现:超级老人的大脑在大量新生神经元,这让他们80岁以上时仍记忆超群、远离痴呆

生物世界
2026-02-27 12:07:57
钱再多有啥用?56岁李富真走路东倒西歪、瘦成皮包骨,真不忍直视

钱再多有啥用?56岁李富真走路东倒西歪、瘦成皮包骨,真不忍直视

洲洲影视娱评
2026-02-27 15:07:49
开始抢人!美国一周挖走4名中国顶尖人才,年薪1个亿美元令人咋舌

开始抢人!美国一周挖走4名中国顶尖人才,年薪1个亿美元令人咋舌

古史青云啊
2026-02-26 19:45:46
中到大雪,局部暴雪!河南迎大范围雨雪天气,局部积雪深度可达12厘米,气温骤降近10℃,出行需防滑防冻

中到大雪,局部暴雪!河南迎大范围雨雪天气,局部积雪深度可达12厘米,气温骤降近10℃,出行需防滑防冻

大象新闻
2026-02-27 08:46:16
捡红包事件陷入僵局!车主不承认,金额难确认,失主做法惹争议!

捡红包事件陷入僵局!车主不承认,金额难确认,失主做法惹争议!

离离言几许
2026-02-27 14:24:43
5胞胎在武汉顺利出生,孩子爸爸称名字已取好,回家就给老婆买黄金;专家曾建议减胎,但孩子父母不忍心

5胞胎在武汉顺利出生,孩子爸爸称名字已取好,回家就给老婆买黄金;专家曾建议减胎,但孩子父母不忍心

极目新闻
2026-02-27 11:05:33
戴脚镣走完长征的战士,开国大典前毛主席见他:你不怕我把你忘喽

戴脚镣走完长征的战士,开国大典前毛主席见他:你不怕我把你忘喽

大运河时空
2026-02-27 12:25:03
外媒:巴基斯坦防长称“耐心已经耗尽”,巴方对阿富汗政府“公开宣战”

外媒:巴基斯坦防长称“耐心已经耗尽”,巴方对阿富汗政府“公开宣战”

环球网资讯
2026-02-27 09:29:11
打爆日本黑哨后!中国男篮上诉,郭士强或被追罚,赵睿伤情曝光!

打爆日本黑哨后!中国男篮上诉,郭士强或被追罚,赵睿伤情曝光!

绯雨儿
2026-02-27 15:35:49
为什么你永远存不到200万?因为体系不允许

为什么你永远存不到200万?因为体系不允许

流苏晚晴
2026-02-26 18:13:45
沉默整整9天,毛宁一锤定音,中美战机已交手,美方要见中国代表

沉默整整9天,毛宁一锤定音,中美战机已交手,美方要见中国代表

墨兰史书
2026-02-26 18:59:24
2026-02-27 18:47:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2294081文章数 5576关注度
往期回顾 全部

科技要闻

单张不到五毛!谷歌深夜发布Nano Banana 2

头条要闻

发布"中国男篮逆转日本队"的帖子中措辞不妥 FIBA致歉

头条要闻

发布"中国男篮逆转日本队"的帖子中措辞不妥 FIBA致歉

体育要闻

一场必须要赢的比赛,男篮何止击败了裁判

娱乐要闻

继网暴谷爱凌后 美国欲没收其全部收入

财经要闻

沈明高提共富建议 百姓持科技股国家兜底

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

艺术
时尚
本地
公开课
军事航空

艺术要闻

紫气东来,好运一整年!

今年春天最美搭配:西装+半裙,怎么穿都好看!

本地新闻

津南好·四时总相宜

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国11架F-22隐形战机抵达以色列

无障碍浏览 进入关怀版