网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

百万上下文之后，拼什么？

2026-05-05 21:29:16　来源: 像素与芯片

北京举报

0

分享至

「模型本身，只是高效工程系统自然结出的一个副产品。」——这句话藏在DeepSeek V4-Pro技术报告的第3页，却道破了整个行业的转向。

过去一周，所有人都在聊DeepSeek的估值传闻、国产芯片适配通稿，还有那个「百万上下文」的标签。但如果你只盯着SimpleQA-Verified测试里20个百分点的领先优势，或者Codeforces上追平GPT-5.4的评分，就彻底看偏了。

这场发布真正的野心，藏在参数表背后：大模型的战争，已经从模型层退场，全面接管系统层。

Pro与Flash：一对反直觉的对照组

行业里看到「Pro」和「Flash」，本能反应是精准刀法——Pro打标杆，Flash做下沉市场，收割中小企业。这种商业包装逻辑，放在V4身上，看偏了。

V4-Pro的配置确实拉满：1.6T总参数，49B激活参数。但真正的大招，是那个只有284B总参数、13B激活参数的V4-Flash。

技术报告里有个数据直接戳破窗户纸：在大量极具挑战性的测试中，13B激活参数的Flash-Base，直接超越了上一代37B激活参数的V3.2-Base。

13B对37B，这不是能力缩水，是一次底层的效率重构。

Flash的意义从来不是证明「我能多省钱」，而是证明「算力霸权是可以被架构重构打破的」。当百万上下文变成所有官方服务的出厂默认值，开源代码已经说明白：这绝对不是靠算力硬堆出来的。

调度能力，正在取代参数规模，成为新的主战场。

这让百万上下文不再是高阶英伟达集群的专属玩具。国产芯片能顺畅接管战局，核心原因就在这里——未来开源模型的分水岭，不再是看谁的底座大，而是看谁能用十分之一的力气干同样的活。

后训练换道：从「和稀泥」到「各管一段」

硬件效率是一面，另一面是软件效率。V4在「后训练」阶段也换了一条路。

行业惯用的混合强化学习（Mixed RL），说的直白点就是和稀泥。想让模型既懂微积分，又会写C++，还能做日常规划？传统做法是把所有参数强行往中间捏。结果是「向均值回归」——特化能力全磨平，最终均值化成平庸的通才。

V4的解法不是改良，是彻底换道。

技术报告交代了新流程：先独立培养专家。数学专家只管算数，代码专家只管编程，把单一维度的能力拉到满。关键在于最后怎么合并——V4不用业内泛滥的参数平均法，而是用了同策略蒸馏（OPD）。

传统的权重合并是一种静态妥协，OPD则是一场动态接管。

统一模型在自己生成轨迹时，遇到数学题，系统精准引入数学专家的梯度来指路；遇到写代码，无缝切给代码专家。大家各司其职，不在参数层面打架。

顺着这条线往下看，V4应用端那个很火的「三种推理模式」（无思考、高强度思考、极限思考），根本不是加了个UI按钮那么简单。它是OPD机制在产品端的直接变现。

极限思考模式下，底层提示词会强制模型分解问题、穷尽边缘情况。这种极其固执的死磕行为，恰恰是在OPD阶段，被「数学专家」和「编程专家」高强度捶打后固化下来的本能。

长上下文的真问题：不是「记得多」，是「算得起」

换完训练方法，换应用场景。长上下文到底能干嘛？

如果只是为了在十万字研报里找一句话，那不叫长上下文，那叫高级检索。真实的商业场景里，Agent要替你重构代码、跨系统验证数据、甚至跑一整晚的流程。

这个过程里最致命的问题是「失忆」。

V3.2有个让工程师头疼的痛点：新消息一进来，模型之前的思考痕迹直接清空。普通聊天这么干没问题，省资源。但如果是跑了三个小时的Agent任务，半路插进去一句话，模型脑子一白，整个状态全部丢失，得从头算。

V4的方案叫「交织思考」。逻辑很冷酷：分场景算账。

只要是带工具调用的长程场景，跨越消息边界，推理链条完整保留。如果是闲聊，继续清空，绝不多浪费一丁点算力。模型开始真正懂得「在什么场合，该记住什么」。

更绝的是快速指令（Quick Instruction）。

以前行业做意图识别，习惯在外面挂个小模型。这意味着每次有新请求进来，不管长短，系统都得把用户的提示词重新嚼一遍——本质上是在白白浪费预填充计算。

V4没这么干。从开源代码可见：直接在输入序列末尾插几个隐式指令。主模型之前算好的海量特征（KV Cache），直接复用。

这其实就是粗暴地砍掉了一次冗余的预填充计算。行业默认一个功能配一个小模型，V4用行动证明：不用。KV Cache复用吃透了，长程Agent才能跑起来。

调度策略的诚实：没有完美方案，只有极限算账

技术报告第17页有个细节：自动生成的kernel，跟手写CUDA逐位比对。不是差不多，是每一位都一样。

这种工程洁癖，业务里少见。有这底线，才敢算部署账。

高并发的百万上下文，拼的根本不是大模型懂不懂人类，拼的是你懂不懂硬件的物理极限在哪。

文档里三种调度策略都列出来了，没有藏着掖着，全是取舍。

想追求计算零冗余？上「完全缓存」。代价是，固态硬盘的I/O通道可能在几秒钟内被高频写入直接挤爆。

想保护硬盘？上「定期检查点」。隔一段距离存一次。硬盘保住了，但GPU得时不时腾出算力，给丢失的尾部数据擦屁股。

干脆不上物理硬盘缓存？选「零缓存」。省下全部存储带宽，全靠长程特征做锚点，碰到问题GPU现场硬算。

这三条路，哪条都不是完美的。这本质上就是一场关于硬件寿命、并发峰值和用户延迟容忍度之间的极限算账。

它把冷冰冰的现实摆在所有人面前：AI早已不是单纯的算法竞赛，而是一场系统工程的总力战。

当1M上下文变成出厂默认值，当13B激活参数能跑赢37B，当KV Cache复用砍掉冗余小模型——这些动作指向同一个结论：大模型的竞争规则，已经从「谁的脑容量大」变成「谁的调度效率高」。

接下来值得观察的是：当效率重构成为新门槛，那些还在堆参数、刷榜单的玩家，会不会突然发现，自己手里的筹码已经贬值了？

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

女子深夜下班回家，竟被自家房门反锁在外

南阳日报 2026-05-06 19:18:04
678 跟贴 678
俄外交部呼吁各国及时从基辅撤离人员

环球网资讯 2026-05-07 08:47:57
9536 跟贴 9536

福建母子武汉旅游期间捡到价值十余万元的劳力士？虾店老板发视频称已归还失主，网友态度不一

极目新闻 2026-05-07 10:23:48
3441 跟贴 3441

“广东四小虎”中的掉队生，杀回来了

每日经济新闻 2026-05-06 23:05:06
73 跟贴 73
这就是上海男篮的底气！

新民晚报 2026-05-07 09:32:29
52 跟贴 52

景区装电梯无痛爬山被质疑过度开发

极目新闻 2026-05-02 17:18:12
4162 跟贴 4162

深圳239亿“地王”易主，华润置地70亿接手，将建成700米超高层地标

界面新闻 2026-05-06 19:53:37
296 跟贴 296
“排队3小时，打卡1分钟”，多景区迎“泼天流量”

澎湃新闻 2026-05-06 00:04:10
3887 跟贴 3887

新政下的广州五一楼市：有壕客一日连扫两套豪宅

南方都市报 2026-05-07 13:19:26
37 跟贴 37
综合消息丨汉坦病毒涉疫邮轮病例数已升至8例

新华社 2026-05-06 22:31:33
1216 跟贴 1216
中国航天员中心招募志愿者：最高拿7万元，但不能玩手机

第一财经资讯 2026-05-06 15:42:11
310 跟贴 310
新华时评｜安全红线不容侥幸逾越

新华社 2026-05-06 22:45:05
25 跟贴 25
体验式消费、IP联名活动，“五一”假期消费市场持续上新

齐鲁壹点 2026-05-06 09:26:40
159 跟贴 159
星空卫视宣布暂停，大量网友涌向评论区

南方都市报 2026-05-07 12:27:53
13 跟贴 13
WTI原油期货跌幅扩大至13%，报88.921美元/桶

每日经济新闻 2026-05-06 19:11:09
625 跟贴 625
日经225指数涨幅扩大至5%

每日经济新闻 2026-05-07 09:32:06
3 跟贴 3
公安部提醒警惕网络水军：好评如潮可能都是刷的！

中国能源网 2026-05-07 10:39:04
2 跟贴 2
“四川绵阳北川发生重大交通事故致3人死亡”系谣言（2026·05·06）

今日辟谣 2026-05-06 16:22:54
171 跟贴 171
61岁男子五一加班在车间身亡长期每日工作十余小时涉事公司：假期自愿正积极处理

快科技 2026-05-07 15:18:46
0 跟贴 0
宁夏29岁男子酒局后失联，3天后遗体在5公里外水渠中被发现，水位仅及成年男子膝盖？警方正调查

大风新闻 2026-05-07 15:17:13
0 跟贴 0
女子机场租用充电宝1小时扣费149元，退费需回现场自证，网上显示小电科技被投诉量超5万件

极目新闻 2026-05-07 13:36:00
0 跟贴 0
11岁男孩遭7名同学脚踢围殴致身体多处淤青，精神轻度抑郁，校方回应

极目新闻 2026-05-07 15:20:06
0 跟贴 0
沪苏浙皖共同出资，长三角基础研究联合基金将正式推出

上观新闻 2026-05-06 21:14:04
0 跟贴 0

开国上将路过药铺，泪目见昔日红军副军长流落街头！

开国上将路过药铺，泪目见昔日红军副军长流落街头！

鉴史录

2026-05-05 09:55:50

孩子脱臼复位只收100元，家长举报乱收费！卫健委：应收110元，你还少给了！家长拒缴费后离开！

孩子脱臼复位只收100元，家长举报乱收费！卫健委：应收110元，你还少给了！家长拒缴费后离开！

医脉圈

2026-04-25 20:04:06

一嫁日本，二嫁美国，三嫁法国，绝不嫁中国人的李勤勤，咋样了？

一嫁日本，二嫁美国，三嫁法国，绝不嫁中国人的李勤勤，咋样了？

傲傲讲历史

2026-03-09 10:19:52

拟重大资产重组，300807，“20cm”涨停

拟重大资产重组，300807，“20cm”涨停

数据宝

2026-05-07 11:36:45

俄乌战争以来曝俄军首次大规模败退！乌克兰炸毁俄后勤大桥

俄乌战争以来曝俄军首次大规模败退！乌克兰炸毁俄后勤大桥

项鹏飞

2026-05-05 19:02:50

天呢！一个德国人非议中国教育是对人性的摧残…

天呢！一个德国人非议中国教育是对人性的摧残…

慧翔百科

2026-01-26 11:45:53

有没有人敢爆自己的瓜？网友：确定玩这么大吗？

有没有人敢爆自己的瓜？网友：确定玩这么大吗？

夜深爱杂谈

2026-02-18 20:55:58

中方连出重拳，巴拿马终于低头，派7任议员访华，对美国大使摊牌

中方连出重拳，巴拿马终于低头，派7任议员访华，对美国大使摊牌

三石记

2026-05-07 13:11:32

欧冠决赛前，K77向阿森纳放话：这会很难打

欧冠决赛前，K77向阿森纳放话：这会很难打

赛场名场面

2026-05-07 15:17:07

英媒：中国最令人佩服的，就是美欧联手绞杀中国光伏，竟还能翻身

英媒：中国最令人佩服的，就是美欧联手绞杀中国光伏，竟还能翻身

杰丝聊古今

2026-04-19 01:18:49

5月8日24时，国内成品油价格将迎调整

5月8日24时，国内成品油价格将迎调整

南昌青云谱发布

2026-05-07 10:42:25

他带着200根金条逃到香港，却把价值800亿的家当留在了大陆！

他带着200根金条逃到香港，却把价值800亿的家当留在了大陆！

阿器谈史

2026-04-02 17:05:17

52岁王小骞做梦也没想到，患上矮小症的女儿，如今竟然迎来了逆袭

52岁王小骞做梦也没想到，患上矮小症的女儿，如今竟然迎来了逆袭

一盅情怀

2026-05-06 10:52:19

张学良谈戴笠之死：他不风流，独好有丈夫的胡蝶，也死在了她手上

张学良谈戴笠之死：他不风流，独好有丈夫的胡蝶，也死在了她手上

微史纪

2026-04-08 01:45:28

释永信被一女子爆料：她们姐妹住少林寺3天，争着往释永信房间跑

释永信被一女子爆料：她们姐妹住少林寺3天，争着往释永信房间跑

江山挥笔

2026-03-23 15:40:31

费利佩红牌为何取消？听听李欣怎么说？球迷：离谱妈妈给离谱开门

费利佩红牌为何取消？听听李欣怎么说？球迷：离谱妈妈给离谱开门

我就是一个说球的

2026-05-06 22:15:42

130万皇马球迷请愿离队！姆巴佩心碎发声：等我走了你们才会后悔

130万皇马球迷请愿离队！姆巴佩心碎发声：等我走了你们才会后悔

体育闲话说

2026-05-07 08:05:06

她是吴宜泽姐姐，血脉压制从小揪弟弟耳朵，长得漂亮是机车爱好者

她是吴宜泽姐姐，血脉压制从小揪弟弟耳朵，长得漂亮是机车爱好者

以茶带书

2026-05-05 16:57:12

中央定调，2026年养老金或再涨，工龄20年，补发7个月能涨500吗？

中央定调，2026年养老金或再涨，工龄20年，补发7个月能涨500吗？

混沌录

2026-05-07 14:46:07

就在今天！下午5点，郑钦文冲2连胜；罕见发怒！萨巴伦卡炮轰法网

就在今天！下午5点，郑钦文冲2连胜；罕见发怒！萨巴伦卡炮轰法网

大秦壁虎白话体育

2026-05-07 08:53:10

像素与芯片

有态度网友ytd

3332文章数 21关注度

往期回顾全部

科技要闻

月之暗面完成20亿美元融资，估值突破200亿

头条要闻

记者询问"是否敦促美方从霍尔木兹撤出军舰" 中方回应

头条要闻

记者询问"是否敦促美方从霍尔木兹撤出军舰" 中方回应

体育要闻

巴黎再进欧冠决赛，最尴尬的情况还是发生了

娱乐要闻

小S阿雅重返大S母校，翻看大S毕业照

财经要闻

特朗普：美伊“很有可能”达成协议

汽车要闻

理想为什么不做轿车，有了解释……

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

艺术

本地

时尚

数码

公开课

艺术要闻

这位老教授笔下的青年，活力满满

本地新闻

用青花瓷的方式，打开西溪湿地

“白色阔腿裤”今年夏天又火了！这样穿时髦又高级

数码要闻

历经三年终于出货！高端Linux笔记本正式开售起售价1.28万元

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版