网易首页 > 网易号 > 正文 申请入驻

DeepSeek V3.1上线:架构调整与能力优化并存

0
分享至

DeepSeek于8月19日晚间上线了全新的V3.1版本,官方强调上下文长度拓展至128k,但此次更新的核心在于模型底层架构的演进。V3.1采用混合推理架构,使用一个模型同时支持思考模式与非思考模式,用户通过API调用时,模型明确标识为V3,而非过去的R1。这种架构调整简化了部署和运维,提高了算力利用效率,但也可能影响非推理任务的能力。

在能力优化方面,DeepSeek V3.1的编程能力大幅提升。根据Aider编程基准测试数据,V3.1取得了71.6%的高分,超越了此前的R1版本和闭源模型Claude 4 Opus。在SVGBench测试中,V3.1仅次于GPT-4.1-mini,远超前代R1;在多任务语言理解的MMLU测试中,V3.1得分达到88.5%,表现不逊于GPT-5。不过,在研究生级别问答(GPQA)和软件工程(SWE-Bench)等领域,V3.1与GPT-5相比仍存在差距。

DeepSeek V3.1的成本效益也显著提升。完成一次完整的编程任务,V3.1的成本仅需约1.01美元,远低于Claude 4 Opus(便宜68倍)。官方宣布的最新价格表显示,输入价格为0.5元/百万tokens(缓存命中),4元/百万tokens(缓存未命中),输出价格为12元/百万tokens,该价格于2025年9月6日00:00起生效。成本下降主要得益于思维链压缩训练,减少了无意义的思维链输出。

V3.1的智能体能力也显著增强,通过后训练优化,新模型在工具使用与智能体任务中表现突出。在SWE-bench Verified基准测试中,V3.1得分66.0分,远超前代;在Terminal-Bench测试中,V3.1得分31.3分,是前代的五倍以上。在网页浏览和工具调用能力上,V3.1也获得了全面增强。

然而,V3.1的“模型融合”策略引发了社区的激烈争论。部分用户反馈,V3.1版本重新出现了幻觉严重和中英夹杂的问题,且在面对复杂问题时表现出“能省则省”的倾向。此外,DeepSeek激进的更新策略也引发了商业API用户的不满,新模型直接覆盖旧模型,且不提供旧版本的API,导致线上生产业务的API可能在毫无预警的情况下被更改,严重影响了商业应用的稳定性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
ATP的灾难:无趣的辛纳和事业心不足的阿尔卡拉斯

ATP的灾难:无趣的辛纳和事业心不足的阿尔卡拉斯

网球之家
2026-03-26 13:25:06
雷军彻底疯狂,小米拿下4000亿

雷军彻底疯狂,小米拿下4000亿

新浪财经
2026-03-25 23:42:55
梁兴初被隔离审查8年,自由后叶帅给出两个选择,梁:一个也不要

梁兴初被隔离审查8年,自由后叶帅给出两个选择,梁:一个也不要

兴趣知识
2026-03-25 12:32:27
比亚迪推出革命性可变磁通电机,彻底解决电动车高速掉电难题

比亚迪推出革命性可变磁通电机,彻底解决电动车高速掉电难题

娱乐圈的笔娱君
2026-03-26 17:21:17
余承东宣布华为手机全面回归!大方公布CPU型号 支持5A网络 麒麟处理器全国产突破美国制裁

余承东宣布华为手机全面回归!大方公布CPU型号 支持5A网络 麒麟处理器全国产突破美国制裁

快科技
2026-03-24 15:22:21
澳门国民党中将吕文贞突然说,我是李克农的人,该向组织报到了

澳门国民党中将吕文贞突然说,我是李克农的人,该向组织报到了

鹤羽说个事
2026-03-25 21:56:09
张雪峰心源性猝死多严重,那个最快护士就有多“牛逼”(张雪峰的惯用词)

张雪峰心源性猝死多严重,那个最快护士就有多“牛逼”(张雪峰的惯用词)

天山箴言录
2026-03-26 16:45:50
马斯克最新回复来了

马斯克最新回复来了

新浪财经
2026-03-26 19:29:33
江苏省盐城市政协原副主席潘道津接受审查调查

江苏省盐城市政协原副主席潘道津接受审查调查

界面新闻
2026-03-26 19:12:28
国产顶级神剧,只可惜,央视播完就禁了

国产顶级神剧,只可惜,央视播完就禁了

独立鱼
2026-03-23 21:22:17
俄罗斯警告日本!俄输油重港接连遭攻击,“现场浓烟滚滚”;俄乌战场惊现持枪机器人:身高180cm,可AI评估战场并侦察射击

俄罗斯警告日本!俄输油重港接连遭攻击,“现场浓烟滚滚”;俄乌战场惊现持枪机器人:身高180cm,可AI评估战场并侦察射击

每日经济新闻
2026-03-26 15:53:05
特朗普:台湾属于中国,武统是中方的自由,但一动手美国会不高兴

特朗普:台湾属于中国,武统是中方的自由,但一动手美国会不高兴

共工之锚
2026-03-22 00:48:09
A股:大盘精准跌到3889.08点,不出意外的话,接下来行情这么走!

A股:大盘精准跌到3889.08点,不出意外的话,接下来行情这么走!

夜深爱杂谈
2026-03-26 20:11:02
巨石强森壮汉穿假体演半神,这半遮半掩的曲线,谁能顶得住?

巨石强森壮汉穿假体演半神,这半遮半掩的曲线,谁能顶得住?

娱乐领航家
2026-03-26 20:00:03
信张维迎还是信张维为?这是一个时代之问

信张维迎还是信张维为?这是一个时代之问

壹家言
2026-03-24 22:54:33
30多辆大巴车一天只卖几张票!甘肃一地客运中心即将停运

30多辆大巴车一天只卖几张票!甘肃一地客运中心即将停运

快科技
2026-03-26 17:01:50
白人女性与黑人女性的体味差异,网友真实分享引发热议

白人女性与黑人女性的体味差异,网友真实分享引发热议

特约前排观众
2025-12-22 00:20:06
准绝杀!可惜了,陈国豪!

准绝杀!可惜了,陈国豪!

左右为篮
2026-03-26 21:57:01
广东:力争到2026年底 建成50个以上特色鲜明、功能突出的生产性服务业集聚区

广东:力争到2026年底 建成50个以上特色鲜明、功能突出的生产性服务业集聚区

财联社
2026-03-26 10:15:09
A股:两个信息落地,明天,周五或会这样走了!

A股:两个信息落地,明天,周五或会这样走了!

明心
2026-03-26 16:35:30
2026-03-26 22:44:49
三言科技 incentive-icons
三言科技
聚焦新未来新科技,严肃又活泼。
99246文章数 66811关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

健康
本地
家居
公开课
军事航空

转头就晕的耳石症,能开车上班吗?

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

家居要闻

傍海而居 静观蝴蝶海

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版