网易首页 > 网易号 > 正文 申请入驻

DeepSeek V3.1上线:架构调整与能力优化并存

0
分享至

DeepSeek于8月19日晚间上线了全新的V3.1版本,官方强调上下文长度拓展至128k,但此次更新的核心在于模型底层架构的演进。V3.1采用混合推理架构,使用一个模型同时支持思考模式与非思考模式,用户通过API调用时,模型明确标识为V3,而非过去的R1。这种架构调整简化了部署和运维,提高了算力利用效率,但也可能影响非推理任务的能力。

在能力优化方面,DeepSeek V3.1的编程能力大幅提升。根据Aider编程基准测试数据,V3.1取得了71.6%的高分,超越了此前的R1版本和闭源模型Claude 4 Opus。在SVGBench测试中,V3.1仅次于GPT-4.1-mini,远超前代R1;在多任务语言理解的MMLU测试中,V3.1得分达到88.5%,表现不逊于GPT-5。不过,在研究生级别问答(GPQA)和软件工程(SWE-Bench)等领域,V3.1与GPT-5相比仍存在差距。

DeepSeek V3.1的成本效益也显著提升。完成一次完整的编程任务,V3.1的成本仅需约1.01美元,远低于Claude 4 Opus(便宜68倍)。官方宣布的最新价格表显示,输入价格为0.5元/百万tokens(缓存命中),4元/百万tokens(缓存未命中),输出价格为12元/百万tokens,该价格于2025年9月6日00:00起生效。成本下降主要得益于思维链压缩训练,减少了无意义的思维链输出。

V3.1的智能体能力也显著增强,通过后训练优化,新模型在工具使用与智能体任务中表现突出。在SWE-bench Verified基准测试中,V3.1得分66.0分,远超前代;在Terminal-Bench测试中,V3.1得分31.3分,是前代的五倍以上。在网页浏览和工具调用能力上,V3.1也获得了全面增强。

然而,V3.1的“模型融合”策略引发了社区的激烈争论。部分用户反馈,V3.1版本重新出现了幻觉严重和中英夹杂的问题,且在面对复杂问题时表现出“能省则省”的倾向。此外,DeepSeek激进的更新策略也引发了商业API用户的不满,新模型直接覆盖旧模型,且不提供旧版本的API,导致线上生产业务的API可能在毫无预警的情况下被更改,严重影响了商业应用的稳定性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
媒体曝“车王”舒马赫不再长期卧床,目前能借助轮椅活动,但认知状态存疑

媒体曝“车王”舒马赫不再长期卧床,目前能借助轮椅活动,但认知状态存疑

上观新闻
2026-01-27 16:39:18
特朗普称还有一支舰队正驶向伊朗

特朗普称还有一支舰队正驶向伊朗

新华社
2026-01-28 09:31:26
58岁那英改走颜值路线?过度医美变化大到认不出,这是要闹哪出?

58岁那英改走颜值路线?过度医美变化大到认不出,这是要闹哪出?

锋哥与八卦哥
2026-01-25 13:26:51
乌军能否守住红军城?不能!

乌军能否守住红军城?不能!

史政先锋
2025-11-17 16:09:20
我刚调任局长去食堂吃饭,一老干部拍着桌子吼:你知道我是谁吗!

我刚调任局长去食堂吃饭,一老干部拍着桌子吼:你知道我是谁吗!

星宇共鸣
2026-01-28 09:05:49
餐馆招牌写“免费加面”,男子二次续面时被要求付3元,还遭言语歧视?多方回应

餐馆招牌写“免费加面”,男子二次续面时被要求付3元,还遭言语歧视?多方回应

潇湘晨报
2026-01-27 22:22:52
中国常驻联合国副代表:日本是“国际秩序破坏者”

中国常驻联合国副代表:日本是“国际秩序破坏者”

潇湘晨报
2026-01-27 16:13:22
女子半夜睡着遭侵犯,她以为是丈夫,10天后男子再睡别人妻子落网

女子半夜睡着遭侵犯,她以为是丈夫,10天后男子再睡别人妻子落网

汉史趣闻
2024-06-09 13:48:02
有一种爱,未及朝夕相伴,却念了一生

有一种爱,未及朝夕相伴,却念了一生

青苹果sht
2026-01-23 05:46:51
美媒:民主党众议员在明尼阿波利斯演讲要求废除移民海关执法局时遭袭击

美媒:民主党众议员在明尼阿波利斯演讲要求废除移民海关执法局时遭袭击

环球网资讯
2026-01-28 11:48:05
上海炒股大赛冠军的箴言:如果手里只有10万,不妨死磕"七大口诀"

上海炒股大赛冠军的箴言:如果手里只有10万,不妨死磕"七大口诀"

一方聊市
2026-01-19 13:13:48
凯恩将续约拜仁,创队史顶薪纪录

凯恩将续约拜仁,创队史顶薪纪录

星耀国际足坛
2026-01-27 21:18:40
央视曝光“毒衣服”!致癌物超标,会改变DNA,这4种衣服谨慎购买

央视曝光“毒衣服”!致癌物超标,会改变DNA,这4种衣服谨慎购买

丁丁鲤史纪
2026-01-28 11:28:54
贝克汉姆亲家的继承之战!10个子女17亿家产,妮可拉分不到多少钱

贝克汉姆亲家的继承之战!10个子女17亿家产,妮可拉分不到多少钱

有范又有料
2026-01-21 17:53:26
李小璐发文:不考虑2小时后的事,评论区:原来有2小时之久!

李小璐发文:不考虑2小时后的事,评论区:原来有2小时之久!

默默有话说
2026-01-26 11:48:27
ihone Air降价胖东来不愿退差:购买时就告知顾客不提供价保

ihone Air降价胖东来不愿退差:购买时就告知顾客不提供价保

映射生活的身影
2026-01-28 12:09:33
一个拿腔作势一个双目无神,两人连累48集大剧,老戏骨再强也没用

一个拿腔作势一个双目无神,两人连累48集大剧,老戏骨再强也没用

查尔菲的笔记
2026-01-24 20:12:13
日本NEC向华为认输,宣布退出5G电信市场,韩媒感慨全线溃败!

日本NEC向华为认输,宣布退出5G电信市场,韩媒感慨全线溃败!

我心纵横天地间
2026-01-27 12:49:16
172:199!日本选举变天,新首相二选一,对华态度定乾坤!

172:199!日本选举变天,新首相二选一,对华态度定乾坤!

达文西看世界
2026-01-27 15:40:34
巴菲特曾在1997年买入了1.297亿盎司白银,相当于全球年度供应量25%和年度需求量的16%...

巴菲特曾在1997年买入了1.297亿盎司白银,相当于全球年度供应量25%和年度需求量的16%...

地平线全球策略
2026-01-27 19:32:40
2026-01-28 14:35:00
三言科技 incentive-icons
三言科技
聚焦新未来新科技,严肃又活泼。
97723文章数 66753关注度
往期回顾 全部

科技要闻

它是神也是毒!Clawdbot改名卷入千万诈骗

头条要闻

高市早苗拉票时哭了:这三个月我咬紧牙关、全力以赴

头条要闻

高市早苗拉票时哭了:这三个月我咬紧牙关、全力以赴

体育要闻

冒充职业球员,比赛规则还和对手现学?

娱乐要闻

王祖贤入驻某音:一条7秒视频吸粉55万

财经要闻

40倍杠杆断裂!水贝一黄金平台兑付困难

汽车要闻

中国豪华车老大之争:奥迪凭啥干掉奔驰宝马?

态度原创

本地
艺术
房产
健康
公开课

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

艺术要闻

震撼!19世纪油画巨匠的作品美得不可思议!

房产要闻

实景兑现在即!绿城,在海棠湾重新定义终极旅居想象!

耳石症分类型,症状大不同

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版