网易首页 > 网易号 > 正文 申请入驻

DeepSeek-V3.1正式发布,上下文均扩展为128K

0
分享至

作者:刘晓洁 责编:彭海斌

8月21日,业界千呼万唤的R2模型没来,但DeepSeek官方正式发布了新模型V3.1。从命名来看这或许不是一次大的版本更新,更像是前一代DeepSeek-V3模型的小版本迭代。

在X上,DeepSeek将V3.1称为“我们迈向智能体时代的第一步”(our first step toward the agent era)。本次升级主要有三大亮点,其中包括更强的Agent能力、混合思考模式和更高的思考效率。

官方表示,通过后训练优化,新模型在工具使用与智能体任务中的表现有较大提升。在编程智能体、搜索智能体测评中, V3.1相比之前的DeepSeek系列模型都有明显提高。

DeepSeek-V3.1是混合推理架构,一个模型同时支持思考模式和非思考模式。目前用户可在官方App与网页端体验新模型,通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。DeepSeek API也已同步升级,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,且上下文均已扩展为128K。

“混合推理非常棒。拥有一个能够在深度思考和快速响应之间切换的模型,感觉就像是实用人工智能的未来。”X上有网友表示,“在深度推理和快速反应之间切换真是天才之举。”根据查询调整深度,可以避免在简单任务上过度耗时,同时在需要时进行全面分析。

与之前的版本相比,V3.1也有更高的思考效率。官方表示,DeepSeek-V3.1-Think在保持与 DeepSeek-R1-0528相当的答案质量的同时,响应速度更快。

官方测试结果显示,经过思维链压缩训练后,V3.1-Think 在输出 token 数减少20%-50% 的情况下,各项任务的平均表现与 R1-0528持平。

在各项评测指标得分基本持平的情况下,R1-0528与 V3.1-Think 的 token 消耗量对比图

同时,V3.1在非思考模式下的输出长度也得到了有效控制,相比于 DeepSeek-V3-0324 ,能够在输出长度明显减少的情况下保持相同的模型性能。

同步地,DeepSeek进行了价格调整,模型的API接口调用价格有所上涨。自9月6日凌晨起,取消夜间时段优惠,输入价格上,缓存命中时为0.5元/百万tokens,缓存未命中的价格则为4元/百万tokens(此前V3为2元/百万tokens);输出价格为12元/百万tokens(此前V3为8元/百万tokens)。

官方提到,V3.1的基础模型在V3的基础上重新做了外扩训练,一共增加训练了840B tokens。基础模型与后训练模型均已在Huggingface与魔搭开源。

值得一提的是,DeepSeek此次还宣布增加了对海外模型Anthropic API格式的支持,官方提到这是“为了满足大家对 Anthoripic API 生态的使用需求”,用户可以将 DeepSeek-V3.1的能力接入Claude Code框架。

责任编辑:王凤枝_NT2541

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
宝能姚振华实名举报,相关部门回应:举报不实,拍卖正常推进

宝能姚振华实名举报,相关部门回应:举报不实,拍卖正常推进

南方都市报
2026-01-15 11:04:11
大师赛中国1胜2负!6-5绝杀,50岁老将晋级4强,赵心童获37万奖金

大师赛中国1胜2负!6-5绝杀,50岁老将晋级4强,赵心童获37万奖金

小火箭爱体育
2026-01-16 01:44:44
门口突然刷新只海豹!大批幼崽到英国流浪,救助中心快成海豹幼儿园啦...

门口突然刷新只海豹!大批幼崽到英国流浪,救助中心快成海豹幼儿园啦...

英国那些事儿
2026-01-14 23:25:45
大冷!里勒40分北控输9连败江苏 廖三宁22+7庞峥麟12助攻创新高

大冷!里勒40分北控输9连败江苏 廖三宁22+7庞峥麟12助攻创新高

醉卧浮生
2026-01-15 21:27:55
乌军单日摧毁84门重炮,俄罗斯3000万桶石油滞留海上无人问津

乌军单日摧毁84门重炮,俄罗斯3000万桶石油滞留海上无人问津

史政先锋
2026-01-15 21:00:54
美军航母又上演“声东击西”?三面特朗普:发狠话,放软话,还在等关键临界点到来

美军航母又上演“声东击西”?三面特朗普:发狠话,放软话,还在等关键临界点到来

红星新闻
2026-01-15 14:30:15
广州幼儿园 “关停潮” 蔓延!又有40多所扛不下去了

广州幼儿园 “关停潮” 蔓延!又有40多所扛不下去了

风向观察
2026-01-15 21:39:09
十年,我不存钱只定投银行股票:股息现金流,比养老金更让我心安

十年,我不存钱只定投银行股票:股息现金流,比养老金更让我心安

真实人物采访
2026-01-15 01:10:03
特朗普称泽连斯基阻碍和平协议

特朗普称泽连斯基阻碍和平协议

界面新闻
2026-01-15 09:33:30
不等中方出手,7国主动从中国减少进口稀土,特朗普宣告对华取胜

不等中方出手,7国主动从中国减少进口稀土,特朗普宣告对华取胜

军机Talk
2026-01-15 11:02:02
马斯克警告中国在AI计算和电力上大幅领先美国:中国电力产能2026年达到美国的3倍

马斯克警告中国在AI计算和电力上大幅领先美国:中国电力产能2026年达到美国的3倍

知识圈
2026-01-15 16:49:27
四川泸州“花坛白骨案”告破:女老板遭谋杀藏尸,嫌疑人“换脸”逃亡28年

四川泸州“花坛白骨案”告破:女老板遭谋杀藏尸,嫌疑人“换脸”逃亡28年

封面新闻
2026-01-15 19:13:05
补时丢2球!亚洲冠军从头名到出局 球员哭成泪人 中国队冲4强利好

补时丢2球!亚洲冠军从头名到出局 球员哭成泪人 中国队冲4强利好

侃球熊弟
2026-01-15 23:33:25
特朗普下令:180天打破中国垄断,不然…

特朗普下令:180天打破中国垄断,不然…

观察者网
2026-01-15 15:23:11
贺娇龙运送回家画面曝光!强撑见家人最后一面,“五杯酒”引热议

贺娇龙运送回家画面曝光!强撑见家人最后一面,“五杯酒”引热议

李健政观察
2026-01-15 17:24:19
投诉杨贵妃雕塑的,正眼看他一下,你都输了

投诉杨贵妃雕塑的,正眼看他一下,你都输了

不主流讲话
2026-01-14 18:09:01
加拿大打破核聚变世界纪录,为什么令整个能源行业震惊?

加拿大打破核聚变世界纪录,为什么令整个能源行业震惊?

百科密码
2026-01-15 16:05:03
无缘退役安置?原因曝光,全红婵工作3选1,或效仿张家齐

无缘退役安置?原因曝光,全红婵工作3选1,或效仿张家齐

卿子书
2026-01-15 14:31:50
马克龙:首批法国士兵已抵达格陵兰岛

马克龙:首批法国士兵已抵达格陵兰岛

界面新闻
2026-01-15 20:32:24
2026年棋牌室严查来袭!9条红线碰就罚,娱乐与违法就差这一步!

2026年棋牌室严查来袭!9条红线碰就罚,娱乐与违法就差这一步!

老特有话说
2026-01-15 19:15:47
2026-01-16 03:23:00
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
241567文章数 621210关注度
往期回顾 全部

科技要闻

阿里最狠的一次“自我革命”

头条要闻

美突袭委内瑞拉动用神秘武器:委士兵跪倒在地吐血

头条要闻

美突袭委内瑞拉动用神秘武器:委士兵跪倒在地吐血

体育要闻

聂卫平:黑白棋盘上的凡人棋圣

娱乐要闻

92岁陶玉玲去世,冯远征曹可凡悼念

财经要闻

央行再次结构性降息0.25个百分点

汽车要闻

吉利帝豪/缤越推冠军一口价 起售价4.88万

态度原创

本地
健康
旅游
家居
公开课

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

血常规3项异常,是身体警报!

旅游要闻

南京街头巷尾都是《寻秦记》

家居要闻

自在自宅 个性自由

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版