网易首页 > 网易号 > 正文 申请入驻

DeepSeek V3.1上线:架构调整与能力优化并存

0
分享至

DeepSeek于8月19日晚间上线了全新的V3.1版本,官方强调上下文长度拓展至128k,但此次更新的核心在于模型底层架构的演进。V3.1采用混合推理架构,使用一个模型同时支持思考模式与非思考模式,用户通过API调用时,模型明确标识为V3,而非过去的R1。这种架构调整简化了部署和运维,提高了算力利用效率,但也可能影响非推理任务的能力。

在能力优化方面,DeepSeek V3.1的编程能力大幅提升。根据Aider编程基准测试数据,V3.1取得了71.6%的高分,超越了此前的R1版本和闭源模型Claude 4 Opus。在SVGBench测试中,V3.1仅次于GPT-4.1-mini,远超前代R1;在多任务语言理解的MMLU测试中,V3.1得分达到88.5%,表现不逊于GPT-5。不过,在研究生级别问答(GPQA)和软件工程(SWE-Bench)等领域,V3.1与GPT-5相比仍存在差距。

DeepSeek V3.1的成本效益也显著提升。完成一次完整的编程任务,V3.1的成本仅需约1.01美元,远低于Claude 4 Opus(便宜68倍)。官方宣布的最新价格表显示,输入价格为0.5元/百万tokens(缓存命中),4元/百万tokens(缓存未命中),输出价格为12元/百万tokens,该价格于2025年9月6日00:00起生效。成本下降主要得益于思维链压缩训练,减少了无意义的思维链输出。

V3.1的智能体能力也显著增强,通过后训练优化,新模型在工具使用与智能体任务中表现突出。在SWE-bench Verified基准测试中,V3.1得分66.0分,远超前代;在Terminal-Bench测试中,V3.1得分31.3分,是前代的五倍以上。在网页浏览和工具调用能力上,V3.1也获得了全面增强。

然而,V3.1的“模型融合”策略引发了社区的激烈争论。部分用户反馈,V3.1版本重新出现了幻觉严重和中英夹杂的问题,且在面对复杂问题时表现出“能省则省”的倾向。此外,DeepSeek激进的更新策略也引发了商业API用户的不满,新模型直接覆盖旧模型,且不提供旧版本的API,导致线上生产业务的API可能在毫无预警的情况下被更改,严重影响了商业应用的稳定性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
茶叶是血糖的“加速器”?医生忠告:不想血糖升高,少喝4种茶

茶叶是血糖的“加速器”?医生忠告:不想血糖升高,少喝4种茶

橘子约定
2026-05-12 20:44:04
沉默45年,中国第二轮"严打"终于来了!目标改变总体战正式打响

沉默45年,中国第二轮"严打"终于来了!目标改变总体战正式打响

荐史
2026-05-03 13:48:04
谭德塞:没有任何迹象显示汉坦病毒正出现大规模暴发

谭德塞:没有任何迹象显示汉坦病毒正出现大规模暴发

界面新闻
2026-05-12 16:42:35
特朗普访华前一天突然改口:我把中国“看错了”

特朗普访华前一天突然改口:我把中国“看错了”

奇思妙想生活家
2026-05-13 01:12:38
张艺谋找秦海璐拍《主角》,秦海璐不看剧本不谈钱,直接说时间

张艺谋找秦海璐拍《主角》,秦海璐不看剧本不谈钱,直接说时间

童叔不飙车
2026-05-12 12:23:25
河南一地党委主要领导调整!近日,多名市长任市委书记

河南一地党委主要领导调整!近日,多名市长任市委书记

上观新闻
2026-05-12 20:08:04
94岁周贤珍:一人过母亲节,住养老院精神矍铄,演员女儿在日本

94岁周贤珍:一人过母亲节,住养老院精神矍铄,演员女儿在日本

白面书誏
2026-05-11 18:24:20
“你儿子比农村土狗还好养!”中学男孩全碳水饮食,吃出可怜面相

“你儿子比农村土狗还好养!”中学男孩全碳水饮食,吃出可怜面相

妍妍教育日记
2026-05-12 17:35:01
赵文卓浑圆的体型,膀大腰圆,这是真正练武的体型,泰森也是这样

赵文卓浑圆的体型,膀大腰圆,这是真正练武的体型,泰森也是这样

老吴教育课堂
2026-05-13 06:28:18
小勒布伦谈对王楚钦8连败:他不只克我一个!他是世界第1很难被打败

小勒布伦谈对王楚钦8连败:他不只克我一个!他是世界第1很难被打败

818体育
2026-05-12 23:35:17
曼联夏窗首签锁定!新赖斯同意 10 万周薪,阿森纳马竞全落后

曼联夏窗首签锁定!新赖斯同意 10 万周薪,阿森纳马竞全落后

一隅非生
2026-05-13 06:19:05
女子潜水遇成千上万海狼群,网友:被袭击10秒不到就剩骨架!

女子潜水遇成千上万海狼群,网友:被袭击10秒不到就剩骨架!

狸猫之一的动物圈
2026-05-10 10:17:09
蛇鼠一窝!小S庆功宴具俊晔给S妈按摩,两人状态超级差,小S哭到脸肿

蛇鼠一窝!小S庆功宴具俊晔给S妈按摩,两人状态超级差,小S哭到脸肿

八卦王者
2026-05-12 15:24:17
美总统出访为何连排泄物都要打包带回?

美总统出访为何连排泄物都要打包带回?

观星赏月
2026-05-12 02:38:46
果然中华文明没有断代过!网友:其实很多方言和土语都是有典故的

果然中华文明没有断代过!网友:其实很多方言和土语都是有典故的

夜深爱杂谈
2026-05-08 10:49:58
导航怎么知道“红绿灯变化的”?你以为是黑科技,其实原理很简单

导航怎么知道“红绿灯变化的”?你以为是黑科技,其实原理很简单

Thurman在昆明
2026-05-11 14:19:39
吃兰州拉面的人为什么越来越少了?网友:进店小心翼翼的怕说错话

吃兰州拉面的人为什么越来越少了?网友:进店小心翼翼的怕说错话

另子维爱读史
2026-02-27 20:31:34
马光远:AI泡沫一定会破灭,而且一定会以非常惨烈的方式破灭!

马光远:AI泡沫一定会破灭,而且一定会以非常惨烈的方式破灭!

混沌录
2026-05-10 19:32:20
反转了!这锅,上海不背

反转了!这锅,上海不背

西莫的艺术宫殿
2026-05-13 00:33:02
夫妻俩把家产给儿子,赴上海投奔刚升副总的女儿,结果一下车蒙了

夫妻俩把家产给儿子,赴上海投奔刚升副总的女儿,结果一下车蒙了

三农老历
2026-05-13 00:05:38
2026-05-13 08:44:49
三言科技 incentive-icons
三言科技
聚焦新未来新科技,严肃又活泼。
100881文章数 66825关注度
往期回顾 全部

科技要闻

谷歌剧透安卓重大升级 Gemini深度集成底层

头条要闻

牛弹琴:印度的大麻烦来了 CNN的报道更是触目惊心

头条要闻

牛弹琴:印度的大麻烦来了 CNN的报道更是触目惊心

体育要闻

骑士终于玩明白了?

娱乐要闻

白鹿风波升级!掉粉20万评论区沦陷

财经要闻

深圳夫妻囤芯片,身家飙涨320亿

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

教育
家居
手机
艺术
公开课

教育要闻

600分以下想要本科就业,如何报志愿

家居要闻

极简主义下的居住场域与空间

手机要闻

美国智能手机市场整体萎缩 iPhone 17热销带动苹果市占逆势扩张

艺术要闻

这位女摄影师的航拍风景照片,简直太美了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版