网易首页 > 网易号 > 正文 申请入驻

DeepSeek又一论文上新!新模型V4更近了?

0
分享至

在业界对新一代旗舰模型DeepSeek V4的翘首期盼中,DeepSeek团队却悄然放出了一篇新的学术论文。


这篇论文由DeepSeek联合北大、清华共同撰写,将研究方向投向了决定大模型实际应用落地的关键一环——推理速度,为日益复杂的AI智能体,提供一套高效的底层系统解决方案。

具体来说,新论文介绍了一个名为DualPath的创新推理系统,专门针对智能体工作负载下的大模型(LLM)推理性能进行优化。通过引入“双路径读取KV-Cache(类似记忆缓存)”机制,重新分配存储网络负载,将离线推理吞吐量最高提升 1.87 倍,在线服务的每秒智能体运行数平均提升 1.96 倍。

论文在引言部分提到,大模型正从单轮对话机器人和独立推理模型,快速演进为智能体系统 ——能够自主规划、调用工具,并通过多轮交互解决实际任务。这种应用范式的转变,推动大模型推理工作负载发生重大变革:从传统的人类-大模型交互,转向人类-大模型-环境交互,交互轮次可达数十甚至数百轮。

上下文会跨轮次累积,最终长度可能达到极值。此时模型不需要大量计算,反而需要频繁从硬盘读取历史上下文的 KV-Cache;现有系统中,只有负责预处理的引擎会读取KV-Cache,它的网卡带宽被占满,而负责生成内容的解码引擎,网卡带宽基本闲置,导致整个系统速度被卡脖子。

因此,论文提出的DualPath,针对智能体工作负载、重新设计现代推理架构中 KV-Cache加载逻辑,解决大模型做智能体任务时,速度被 “数据读取”拖慢的核心问题,重要的是把闲置的带宽资源利用起来,相当于给数据读取 “多开了一条高速路”,实现速度的大幅提升。

这一论文成果延续了DeepSeek一贯的风格,在工程化层面将性能优化推向极致。有从业者认为,DeepSeek做这类优化属于缺显卡的无奈之举,属于“脏活儿累活儿”,大家更期待团队在模型上做创新。

但也有人认为,即便有足够显卡,这类优化在降低成本、降低token费用方面也很有价值,因为只有足够便宜,AI才能走向大规模使用。

相比这篇“务实”的论文,外界显然更关注DeepSeek新一代旗舰模型的真面目。关于DeepSeek V4的发布时间,市场传闻已几经更迭。从最初传闻的2月春节前后,到外媒最新报道的“最快下周”,再到业内人士预测的3月前后,传闻链条愈发扑朔迷离。

就在近日,外网有网友爆料称,DeepSeek 正在测试 V4 Lite 模型,代号为“Sealion-lite”,上下文窗口为 100万tokens,并原生支持多模态推理。也有消息提及,DeepSeek已在近期将重大更新版本V4向华为等国内厂商提供提前访问权,以支持其优化处理器软件,确保模型在硬件上高效运行。然而,英伟达等厂商尚未获得类似权限。

面对传闻,DeepSeek依旧保持其一贯的沉默,目前并未进行任何回应。但市场已进入“严阵以待”状态,部分投资机构担忧,新一代模型的发布会如同去年的版本发布时那样,引发市场的剧烈震荡。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
排面拉满!杨紫白玉兰封神夜身着祖海全新高定,气质直接惊艳全场

排面拉满!杨紫白玉兰封神夜身着祖海全新高定,气质直接惊艳全场

观鱼听雨
2026-06-26 23:32:41
四川男子被骗园区后续!姐姐赴泰挖出猛料,多方勾结,根本防不住

四川男子被骗园区后续!姐姐赴泰挖出猛料,多方勾结,根本防不住

辉哥说动漫
2026-06-27 15:39:30
美媒爆:伊朗袭击对美军基地造成重创,五角大楼计划转移军力以规避打击

美媒爆:伊朗袭击对美军基地造成重创,五角大楼计划转移军力以规避打击

环球网资讯
2026-06-26 17:20:13
2009款奔驰GL450无底价拍卖:V8四驱豪华大型SUV

2009款奔驰GL450无底价拍卖:V8四驱豪华大型SUV

绿茵狂热者
2026-06-26 10:14:31
最新中国癌症数据出炉!Nature综述:中国癌症负担持续攀升,占全球1/4,肺癌新发、死亡双双登顶

最新中国癌症数据出炉!Nature综述:中国癌症负担持续攀升,占全球1/4,肺癌新发、死亡双双登顶

医诺维
2026-06-26 17:32:17
美高官打破常规,宣布对台军售不商量,中美交底?赖清德要高兴了

美高官打破常规,宣布对台军售不商量,中美交底?赖清德要高兴了

地球记
2026-06-27 15:16:09
因内存短缺,iPhone 18 将首次使用 9GB 运行内存!

因内存短缺,iPhone 18 将首次使用 9GB 运行内存!

XCiOS俱乐部
2026-06-27 09:30:20
二选一,詹姆斯下家基本确定,去这两队都比留湖人强

二选一,詹姆斯下家基本确定,去这两队都比留湖人强

海阔山遥YAO
2026-06-27 11:20:27
于和伟缺席白玉兰晚宴仅1天,“荒唐”的一幕发生,肖战太无辜

于和伟缺席白玉兰晚宴仅1天,“荒唐”的一幕发生,肖战太无辜

阿纂看事
2026-06-26 17:53:09
比亚迪新车官宣:6月29日,正式上市!

比亚迪新车官宣:6月29日,正式上市!

科技堡垒
2026-06-27 11:29:21
俄军的噩梦不止莫斯科:乌克兰克里米亚阳谋,不是夺地,而是放血

俄军的噩梦不止莫斯科:乌克兰克里米亚阳谋,不是夺地,而是放血

寰球经纬所
2026-06-25 20:47:36
35亿铂金级肉签公布中签结果,阳光普照奖,股民中签太开心!

35亿铂金级肉签公布中签结果,阳光普照奖,股民中签太开心!

数据挖掘分析
2026-06-27 08:29:59
A股:股民请做好下车准备,主力已经不演了!下周将开始新的切换

A股:股民请做好下车准备,主力已经不演了!下周将开始新的切换

虎哥闲聊
2026-06-27 00:00:04
宋祖儿本名叫孙凡清,我忍了,李一桐本名叫李雪,我也忍了,但是

宋祖儿本名叫孙凡清,我忍了,李一桐本名叫李雪,我也忍了,但是

草莓解说体育
2026-06-27 16:22:43
博士生点外卖备注“吃了你们家7年,拍毕业照能邀请你们来吗”,老板收到以后整个人都蒙了!最新回应:一定会去,准备了鲜花和红包祝福他

博士生点外卖备注“吃了你们家7年,拍毕业照能邀请你们来吗”,老板收到以后整个人都蒙了!最新回应:一定会去,准备了鲜花和红包祝福他

台州交通广播
2026-06-27 00:27:54
世界杯太残酷了:随着西班牙1-0,首支出局的南美球队诞生

世界杯太残酷了:随着西班牙1-0,首支出局的南美球队诞生

侧身凌空斩
2026-06-27 10:03:18
不是李春江!也不是郭士强!广东新主帅人选曝光,保底总决赛了!

不是李春江!也不是郭士强!广东新主帅人选曝光,保底总决赛了!

绯雨儿
2026-06-27 10:58:19
清华学霸父亲坦言:我从不逼孩子学习,但有一件事,我死磕到底

清华学霸父亲坦言:我从不逼孩子学习,但有一件事,我死磕到底

户外阿毽
2026-06-26 08:59:17
印度变压器拿下全球一成份额:当年手把手教技术,现在成了对手

印度变压器拿下全球一成份额:当年手把手教技术,现在成了对手

王新喜
2026-06-27 11:43:45
伊朗天堂到地狱,全世界在等韩国出局,西班牙却给韩国“死缓”

伊朗天堂到地狱,全世界在等韩国出局,西班牙却给韩国“死缓”

铁甲西奇
2026-06-27 14:18:30
2026-06-27 18:04:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
257381文章数 622806关注度
往期回顾 全部

科技要闻

GPT-5.6发布,你暂时用不了!Mythos也放行

头条要闻

美媒对比亮了:世界各国都在争抢石油 中国仍接近满仓

头条要闻

美媒对比亮了:世界各国都在争抢石油 中国仍接近满仓

体育要闻

世界杯最火门将,站到了阿根廷和梅西面前

娱乐要闻

四提白玉兰终封后,杨紫:仍觉不真实

财经要闻

OpenAI推迟IPO重创软银!

汽车要闻

首搭华为乾崑智驾ADS5 启境GT7上市售价20.99万-32.99万元

态度原创

数码
房产
手机
教育
公开课

数码要闻

十色外壳 大疆DJI Mic Mini 2S麦克风7月2日发布

房产要闻

全国高考大放水,300分就能上本科!论上岸率,海南没输过!

手机要闻

业内无敌手!荣耀直板机要上12000mAh巨量电池

教育要闻

25万位次考生能上河南师范大学?心动吗?中外合作办学第一年招生,电气专业及自动化 物理学 计算机 专业多多任你选

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版