网易首页 > 网易号 > 正文 申请入驻

DeepSeek V3.1上线:架构调整与能力优化并存

0
分享至

DeepSeek于8月19日晚间上线了全新的V3.1版本,官方强调上下文长度拓展至128k,但此次更新的核心在于模型底层架构的演进。V3.1采用混合推理架构,使用一个模型同时支持思考模式与非思考模式,用户通过API调用时,模型明确标识为V3,而非过去的R1。这种架构调整简化了部署和运维,提高了算力利用效率,但也可能影响非推理任务的能力。

在能力优化方面,DeepSeek V3.1的编程能力大幅提升。根据Aider编程基准测试数据,V3.1取得了71.6%的高分,超越了此前的R1版本和闭源模型Claude 4 Opus。在SVGBench测试中,V3.1仅次于GPT-4.1-mini,远超前代R1;在多任务语言理解的MMLU测试中,V3.1得分达到88.5%,表现不逊于GPT-5。不过,在研究生级别问答(GPQA)和软件工程(SWE-Bench)等领域,V3.1与GPT-5相比仍存在差距。

DeepSeek V3.1的成本效益也显著提升。完成一次完整的编程任务,V3.1的成本仅需约1.01美元,远低于Claude 4 Opus(便宜68倍)。官方宣布的最新价格表显示,输入价格为0.5元/百万tokens(缓存命中),4元/百万tokens(缓存未命中),输出价格为12元/百万tokens,该价格于2025年9月6日00:00起生效。成本下降主要得益于思维链压缩训练,减少了无意义的思维链输出。

V3.1的智能体能力也显著增强,通过后训练优化,新模型在工具使用与智能体任务中表现突出。在SWE-bench Verified基准测试中,V3.1得分66.0分,远超前代;在Terminal-Bench测试中,V3.1得分31.3分,是前代的五倍以上。在网页浏览和工具调用能力上,V3.1也获得了全面增强。

然而,V3.1的“模型融合”策略引发了社区的激烈争论。部分用户反馈,V3.1版本重新出现了幻觉严重和中英夹杂的问题,且在面对复杂问题时表现出“能省则省”的倾向。此外,DeepSeek激进的更新策略也引发了商业API用户的不满,新模型直接覆盖旧模型,且不提供旧版本的API,导致线上生产业务的API可能在毫无预警的情况下被更改,严重影响了商业应用的稳定性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一场追悼会,戳穿梁小龙在香港的真实地位,原来成龙没说谎!

一场追悼会,戳穿梁小龙在香港的真实地位,原来成龙没说谎!

叨唠
2026-01-27 03:28:08
全红婵灰色西装亮相,又甜又飒,颜值气质双开挂

全红婵灰色西装亮相,又甜又飒,颜值气质双开挂

仙味少女心
2026-01-27 16:03:07
湖南一女子因长得太漂亮,55岁没上过一天班,颜值曝光后网友感慨

湖南一女子因长得太漂亮,55岁没上过一天班,颜值曝光后网友感慨

寒士之言本尊
2026-01-27 17:11:37
花498万买进“百强县”榜单,官方回应

花498万买进“百强县”榜单,官方回应

中国新闻周刊
2026-01-27 18:10:38
小雪+局地中雪!河北将迎新一轮降雪,具体时段→

小雪+局地中雪!河北将迎新一轮降雪,具体时段→

鲁中晨报
2026-01-27 20:15:03
贺天举:杨鸣想要的外援俱乐部全买不起,想要威尔哲却给韦伯

贺天举:杨鸣想要的外援俱乐部全买不起,想要威尔哲却给韦伯

懂球帝
2026-01-27 18:42:15
突发! 杨兰兰澳洲与警察正面冲突! 全身香奈儿、座驾劳斯莱斯! 警察要求摘口罩!

突发! 杨兰兰澳洲与警察正面冲突! 全身香奈儿、座驾劳斯莱斯! 警察要求摘口罩!

澳洲红领巾
2026-01-27 13:12:36
参演20余届,演员孙涛将告别春晚:没有春晚,就没有我的今天

参演20余届,演员孙涛将告别春晚:没有春晚,就没有我的今天

新民周刊
2026-01-26 19:41:27
打虎!副部级包惠被查

打虎!副部级包惠被查

新京报政事儿
2026-01-27 18:27:03
三毛扮演者孟智超回应拍短剧:自己外形不好没钱,只有短剧有机会

三毛扮演者孟智超回应拍短剧:自己外形不好没钱,只有短剧有机会

韩小娱
2026-01-27 16:41:35
曝章泽天父母2011年已离婚,父亲已重组家庭有小女儿,妈妈在卖药

曝章泽天父母2011年已离婚,父亲已重组家庭有小女儿,妈妈在卖药

古希腊掌管月桂的神
2026-01-25 15:42:46
信守承诺!球迷直播吃推文:曾放话快船若打出15胜3负他就这么干

信守承诺!球迷直播吃推文:曾放话快船若打出15胜3负他就这么干

罗说NBA
2026-01-27 18:40:41
发明“斩杀线”的牢A,把胡锡进干沉默了

发明“斩杀线”的牢A,把胡锡进干沉默了

木蹊说
2026-01-27 01:22:30
王树斌代理高州市市长,曾任佛山市政府副秘书长

王树斌代理高州市市长,曾任佛山市政府副秘书长

南方都市报
2026-01-27 16:53:35
五场一盘未失,阿尔卡拉斯3-0德米纳尔生涯首进澳网男单四强

五场一盘未失,阿尔卡拉斯3-0德米纳尔生涯首进澳网男单四强

懂球帝
2026-01-27 20:05:06
央视暗访曝光!致命毒红薯已流遍20多省!种植户自己一口都不吃!

央视暗访曝光!致命毒红薯已流遍20多省!种植户自己一口都不吃!

今朝牛马
2026-01-26 22:00:31
中国常驻联合国副代表:日本是“国际秩序破坏者”

中国常驻联合国副代表:日本是“国际秩序破坏者”

潇湘晨报
2026-01-27 16:13:22
停止进口,菲律宾香蕉协会负责人怒了:中国断了30万蕉农的生计!

停止进口,菲律宾香蕉协会负责人怒了:中国断了30万蕉农的生计!

北纬的咖啡豆
2026-01-27 16:25:08
湖南00后美术生全国“刮腻子”,每天只睡四五个小时,团队年入百万!已接到外国订单

湖南00后美术生全国“刮腻子”,每天只睡四五个小时,团队年入百万!已接到外国订单

潇湘晨报
2026-01-27 18:01:05
上海机场这两天绷紧了弦?5例尼帕病毒、7天闭环隔离全在动真格

上海机场这两天绷紧了弦?5例尼帕病毒、7天闭环隔离全在动真格

李博世财经
2026-01-27 16:59:22
2026-01-27 21:04:49
三言科技 incentive-icons
三言科技
聚焦新未来新科技,严肃又活泼。
97702文章数 66752关注度
往期回顾 全部

科技要闻

马化腾3年年会讲话透露了哪些关键信息

头条要闻

回击特朗普 印度与欧盟达成"史上最大规模协议"

头条要闻

回击特朗普 印度与欧盟达成"史上最大规模协议"

体育要闻

冒充职业球员,比赛规则还和对手现学?

娱乐要闻

张雨绮被曝代孕,春晚被拒,代言跑路

财经要闻

多地对垄断行业"近亲繁殖"出手了

汽车要闻

标配华为乾崑ADS 4/鸿蒙座舱5 华境S体验车下线

态度原创

时尚
游戏
手机
公开课
军事航空

跟着这些古早变美综艺,真的能学到东西啊

LPL春季赛:野辅是真的菜,滔搏野辅狂送,WBG三局战胜TES

手机要闻

消息:某厂母系大屏机或为小米17 Max,预计二季度亮相

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美海军"林肯"号航母打击群抵达中东地区

无障碍浏览 进入关怀版