网易首页 > 网易号 > 正文 申请入驻

DeepSeek-V3.1正式发布,上下文均扩展为128K

0
分享至

作者:刘晓洁 责编:彭海斌

8月21日,业界千呼万唤的R2模型没来,但DeepSeek官方正式发布了新模型V3.1。从命名来看这或许不是一次大的版本更新,更像是前一代DeepSeek-V3模型的小版本迭代。

在X上,DeepSeek将V3.1称为“我们迈向智能体时代的第一步”(our first step toward the agent era)。本次升级主要有三大亮点,其中包括更强的Agent能力、混合思考模式和更高的思考效率。

官方表示,通过后训练优化,新模型在工具使用与智能体任务中的表现有较大提升。在编程智能体、搜索智能体测评中, V3.1相比之前的DeepSeek系列模型都有明显提高。

DeepSeek-V3.1是混合推理架构,一个模型同时支持思考模式和非思考模式。目前用户可在官方App与网页端体验新模型,通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。DeepSeek API也已同步升级,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,且上下文均已扩展为128K。

“混合推理非常棒。拥有一个能够在深度思考和快速响应之间切换的模型,感觉就像是实用人工智能的未来。”X上有网友表示,“在深度推理和快速反应之间切换真是天才之举。”根据查询调整深度,可以避免在简单任务上过度耗时,同时在需要时进行全面分析。

与之前的版本相比,V3.1也有更高的思考效率。官方表示,DeepSeek-V3.1-Think在保持与 DeepSeek-R1-0528相当的答案质量的同时,响应速度更快。

官方测试结果显示,经过思维链压缩训练后,V3.1-Think 在输出 token 数减少20%-50% 的情况下,各项任务的平均表现与 R1-0528持平。

在各项评测指标得分基本持平的情况下,R1-0528与 V3.1-Think 的 token 消耗量对比图

同时,V3.1在非思考模式下的输出长度也得到了有效控制,相比于 DeepSeek-V3-0324 ,能够在输出长度明显减少的情况下保持相同的模型性能。

同步地,DeepSeek进行了价格调整,模型的API接口调用价格有所上涨。自9月6日凌晨起,取消夜间时段优惠,输入价格上,缓存命中时为0.5元/百万tokens,缓存未命中的价格则为4元/百万tokens(此前V3为2元/百万tokens);输出价格为12元/百万tokens(此前V3为8元/百万tokens)。

官方提到,V3.1的基础模型在V3的基础上重新做了外扩训练,一共增加训练了840B tokens。基础模型与后训练模型均已在Huggingface与魔搭开源。

值得一提的是,DeepSeek此次还宣布增加了对海外模型Anthropic API格式的支持,官方提到这是“为了满足大家对 Anthoripic API 生态的使用需求”,用户可以将 DeepSeek-V3.1的能力接入Claude Code框架。

责任编辑:王凤枝_NT2541

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
宜家最“偷懒”的广告,却高级得离谱

宜家最“偷懒”的广告,却高级得离谱

设计癖
2026-01-27 11:46:53
不可错过!2月21日下午16:00比赛!中央5套CCTV5、CCTV5+直播表

不可错过!2月21日下午16:00比赛!中央5套CCTV5、CCTV5+直播表

皮皮观天下
2026-02-21 15:16:31
重点打击克宫钱袋子!被袭的俄罗斯电厂并不无辜,摧毁俄导弹仓库

重点打击克宫钱袋子!被袭的俄罗斯电厂并不无辜,摧毁俄导弹仓库

鹰眼Defence
2026-02-20 17:52:20
一天涌入20.4万人!无锡到处都在排队!

一天涌入20.4万人!无锡到处都在排队!

江南晚报
2026-02-20 18:33:51
摔倒被扶反索赔22万后续:交警认定女孩3个错,评论区意外一边倒

摔倒被扶反索赔22万后续:交警认定女孩3个错,评论区意外一边倒

离离言几许
2026-02-20 17:56:22
太意外!38岁中国教练率意大利击败中国队夺金牌,曾婉拒回国执教

太意外!38岁中国教练率意大利击败中国队夺金牌,曾婉拒回国执教

云景侃记
2026-02-12 19:49:07
1951年,志愿军官兵撞见50名熟睡的美军士兵,刚要动手射击,就被排长喝止:“不准开枪!”

1951年,志愿军官兵撞见50名熟睡的美军士兵,刚要动手射击,就被排长喝止:“不准开枪!”

史海残云
2025-12-29 19:46:22
痛心!树龄1200年古樟持续燃烧7小时,只因俩小孩随手扔爆竹……

痛心!树龄1200年古樟持续燃烧7小时,只因俩小孩随手扔爆竹……

环球网资讯
2026-02-21 10:22:16
【新春看市场】健康年货旺销成潮流

【新春看市场】健康年货旺销成潮流

中国经济网
2026-02-21 07:25:05
爱泼斯坦在新加坡一场宴会,可以看出,他才是真正的大佬。

爱泼斯坦在新加坡一场宴会,可以看出,他才是真正的大佬。

火山杂谈
2026-02-21 14:48:55
东北大妈偷菜谎称山东人后续:弟弟单位同事证明,脸都丢尽了

东北大妈偷菜谎称山东人后续:弟弟单位同事证明,脸都丢尽了

离离言几许
2026-02-20 15:57:01
齐广璞赛后落泪:他们可以取代我,我也可以放心地离开了

齐广璞赛后落泪:他们可以取代我,我也可以放心地离开了

懂球帝
2026-02-20 22:50:10
特朗普至今不敢打伊朗,是害怕中国渔翁得利?事实证明,恰恰相反

特朗普至今不敢打伊朗,是害怕中国渔翁得利?事实证明,恰恰相反

青橘罐头
2026-02-21 07:17:45
特朗普下令公开UFO档案!科学家警告:真相可能比想象更可怕

特朗普下令公开UFO档案!科学家警告:真相可能比想象更可怕

琉璃聊科学
2026-02-21 16:00:19
东北人,为啥都爱打扮和穿名牌?

东北人,为啥都爱打扮和穿名牌?

冰咖
2026-02-19 15:17:03
乌克兰的“坏消息”:破坏团结,扎卢日内公开指控泽连斯基

乌克兰的“坏消息”:破坏团结,扎卢日内公开指控泽连斯基

鹰眼Defence
2026-02-20 17:49:36
美媒感慨:若不是中国还在反抗特朗普,几乎全世界都向他投降了

美媒感慨:若不是中国还在反抗特朗普,几乎全世界都向他投降了

时尚的弄潮
2026-02-21 05:34:26
豆包推荐:人生回报率最高的8件事,尽早“焊死”在孩子身上

豆包推荐:人生回报率最高的8件事,尽早“焊死”在孩子身上

十点读书
2026-02-20 18:37:13
曼联小妖官宣加盟死敌!拉爵开启省钱大清洗,下赛季工资少6500万

曼联小妖官宣加盟死敌!拉爵开启省钱大清洗,下赛季工资少6500万

罗米的曼联博客
2026-02-21 08:34:54
一针见血,赵心童6-3墨菲晋级四强,赛后丁俊晖说出了比赛看法

一针见血,赵心童6-3墨菲晋级四强,赛后丁俊晖说出了比赛看法

二爷台球解说
2026-02-21 09:44:37
2026-02-21 16:56:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
244646文章数 621549关注度
往期回顾 全部

科技要闻

智谱上市1月涨5倍,市值超越京东、快手

头条要闻

在贝加尔湖遇难的3名中国游客身份已确认:系一家人

头条要闻

在贝加尔湖遇难的3名中国游客身份已确认:系一家人

体育要闻

冬奥第一"海王"?一人和13国选手都有关系

娱乐要闻

镖人反超惊蛰无声拿下单日票房第二!

财经要闻

一觉醒来,世界大变,特朗普改新打法了

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

房产
艺术
亲子
数码
公开课

房产要闻

窗前即地标!独占三亚湾C位 自贸港总裁行宫亮相

艺术要闻

史洪生油画作品

亲子要闻

放寒假别老催着孩子写作业了,跳绳机会来了!

数码要闻

NVIDIA新卡皇RTX 5090 Ti再曝光:功耗直飙超700W!性能提升10%

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版