网易首页 > 网易号 > 正文 申请入驻

DeepSeek-V3.1正式发布,上下文均扩展为128K

0
分享至

作者:刘晓洁 责编:彭海斌

8月21日,业界千呼万唤的R2模型没来,但DeepSeek官方正式发布了新模型V3.1。从命名来看这或许不是一次大的版本更新,更像是前一代DeepSeek-V3模型的小版本迭代。

在X上,DeepSeek将V3.1称为“我们迈向智能体时代的第一步”(our first step toward the agent era)。本次升级主要有三大亮点,其中包括更强的Agent能力、混合思考模式和更高的思考效率。

官方表示,通过后训练优化,新模型在工具使用与智能体任务中的表现有较大提升。在编程智能体、搜索智能体测评中, V3.1相比之前的DeepSeek系列模型都有明显提高。

DeepSeek-V3.1是混合推理架构,一个模型同时支持思考模式和非思考模式。目前用户可在官方App与网页端体验新模型,通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。DeepSeek API也已同步升级,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,且上下文均已扩展为128K。

“混合推理非常棒。拥有一个能够在深度思考和快速响应之间切换的模型,感觉就像是实用人工智能的未来。”X上有网友表示,“在深度推理和快速反应之间切换真是天才之举。”根据查询调整深度,可以避免在简单任务上过度耗时,同时在需要时进行全面分析。

与之前的版本相比,V3.1也有更高的思考效率。官方表示,DeepSeek-V3.1-Think在保持与 DeepSeek-R1-0528相当的答案质量的同时,响应速度更快。

官方测试结果显示,经过思维链压缩训练后,V3.1-Think 在输出 token 数减少20%-50% 的情况下,各项任务的平均表现与 R1-0528持平。

在各项评测指标得分基本持平的情况下,R1-0528与 V3.1-Think 的 token 消耗量对比图

同时,V3.1在非思考模式下的输出长度也得到了有效控制,相比于 DeepSeek-V3-0324 ,能够在输出长度明显减少的情况下保持相同的模型性能。

同步地,DeepSeek进行了价格调整,模型的API接口调用价格有所上涨。自9月6日凌晨起,取消夜间时段优惠,输入价格上,缓存命中时为0.5元/百万tokens,缓存未命中的价格则为4元/百万tokens(此前V3为2元/百万tokens);输出价格为12元/百万tokens(此前V3为8元/百万tokens)。

官方提到,V3.1的基础模型在V3的基础上重新做了外扩训练,一共增加训练了840B tokens。基础模型与后训练模型均已在Huggingface与魔搭开源。

值得一提的是,DeepSeek此次还宣布增加了对海外模型Anthropic API格式的支持,官方提到这是“为了满足大家对 Anthoripic API 生态的使用需求”,用户可以将 DeepSeek-V3.1的能力接入Claude Code框架。

责任编辑:王凤枝_NT2541

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张本美和3-4王艺迪,大勒布伦4-2,四强赛程:中日各1席韩欧各3席

张本美和3-4王艺迪,大勒布伦4-2,四强赛程:中日各1席韩欧各3席

杨仔述
2025-11-02 06:29:21
女子被通知面试,到场以“无经验”被刷,走后越想越气跑回去据理力争:“为什么不看简历?车费不要钱吗”

女子被通知面试,到场以“无经验”被刷,走后越想越气跑回去据理力争:“为什么不看简历?车费不要钱吗”

观威海
2025-11-01 10:54:07
蒋介石死后,无子女的宋美龄,靠啥在美国过了28年奢华生活?

蒋介石死后,无子女的宋美龄,靠啥在美国过了28年奢华生活?

牛马搞笑
2025-11-01 09:52:48
为娶英国公主,莫齐抛弃华裔未婚妻,如今岳父丢爵位,家里一团糟

为娶英国公主,莫齐抛弃华裔未婚妻,如今岳父丢爵位,家里一团糟

冷紫葉
2025-10-28 20:31:09
段永平向江西水利电力大学捐赠贵州茅台股票!市值达1500万元

段永平向江西水利电力大学捐赠贵州茅台股票!市值达1500万元

红星资本局
2025-11-01 17:58:43
打胎小生被大佬玩到脱G!墨镜导演让女明星陪大佬!

打胎小生被大佬玩到脱G!墨镜导演让女明星陪大佬!

八卦疯叔
2025-11-01 14:20:03
伊朗官员自曝:6年花数千万美元在日本传播伊斯兰教,只皈依了1人

伊朗官员自曝:6年花数千万美元在日本传播伊斯兰教,只皈依了1人

霜风如刀
2025-11-01 16:52:50
吉克隽逸去国外后真是放得开,新穿的衣服太惹眼了

吉克隽逸去国外后真是放得开,新穿的衣服太惹眼了

东方不败然多多
2025-10-25 13:53:59
千亿梦破碎!从62亿营收到日亏百万,为什么降价认怂也救不了西贝

千亿梦破碎!从62亿营收到日亏百万,为什么降价认怂也救不了西贝

坠入二次元的海洋
2025-10-28 09:11:16
钱志敏当庭认罪!潜逃英国8年,在高档社区租住别墅,涉案6.1万枚比特币市价已近500亿元

钱志敏当庭认罪!潜逃英国8年,在高档社区租住别墅,涉案6.1万枚比特币市价已近500亿元

封面新闻
2025-10-31 21:47:10
好消息!菲律宾宣布:11月1日起,恢复中国公民电子签证服务!

好消息!菲律宾宣布:11月1日起,恢复中国公民电子签证服务!

王爷说图表
2025-11-01 22:38:46
杜震宇:现在不想回亚泰看尔虞我诈,我是搞业务的不玩计谋

杜震宇:现在不想回亚泰看尔虞我诈,我是搞业务的不玩计谋

雷速体育
2025-11-01 20:08:25
中美言和荷兰惨遭遗弃,国王亲自率企业团访华,请中国手下留情

中美言和荷兰惨遭遗弃,国王亲自率企业团访华,请中国手下留情

梁讯
2025-11-01 14:32:15
“继承权”不用争了!2026年新规下:父母的房子全部将这样处理

“继承权”不用争了!2026年新规下:父母的房子全部将这样处理

白马惊天剑
2025-10-30 18:09:01
韩国人又破防了!废除中国汉字多年后,韩语咋成了“中国拼音”了

韩国人又破防了!废除中国汉字多年后,韩语咋成了“中国拼音”了

青途历史
2025-10-03 13:19:06
乌军派12名突击队员,营救红军城被围部队,总司令上前线“添乱”

乌军派12名突击队员,营救红军城被围部队,总司令上前线“添乱”

阿龙聊军事
2025-11-02 04:54:28
3-0,62岁穆帅发威:率队豪取3连胜,一夜追到仅差榜首1分

3-0,62岁穆帅发威:率队豪取3连胜,一夜追到仅差榜首1分

侧身凌空斩
2025-11-02 06:27:55
亚冠成都蓉城VS首尔:双铁腰坐镇,韦世豪强势复出,费利佩冲锋

亚冠成都蓉城VS首尔:双铁腰坐镇,韦世豪强势复出,费利佩冲锋

零度眼看球
2025-11-02 07:19:25
东北女孩嫁北京富二代,公婆嫌弃,丈夫看不起,网友:是你自找的

东北女孩嫁北京富二代,公婆嫌弃,丈夫看不起,网友:是你自找的

小小包工头阿汾
2025-10-05 08:30:22
美国人要造反?政府新一轮投票揭晓:54赞成46反对,25州集体逼宫

美国人要造反?政府新一轮投票揭晓:54赞成46反对,25州集体逼宫

乐天闲聊
2025-11-01 13:22:14
2025-11-02 10:07:00
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
234652文章数 620492关注度
往期回顾 全部

科技要闻

10月零跑突破7万辆,小鹏、蔚来超4万辆

头条要闻

牛弹琴:高市早苗上台后 中国作出第一次强烈抗议

头条要闻

牛弹琴:高市早苗上台后 中国作出第一次强烈抗议

体育要闻

NBA球员,必须吃夜宵

娱乐要闻

王家卫这波录音,撕烂了遮羞布

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

神龙汽车推出“发动机终身质保”政策

态度原创

房产
本地
教育
健康
公开课

房产要闻

实力破圈!这个豪宅交付,正在定义海口品质样本!

本地新闻

全网围观,到底多少人被这个野人大学生笑疯了

教育要闻

让教育回归生活本质:西安浐灞三小跨学科课程的七年实践与蜕变

核磁VS肌骨超声,谁更胜一筹?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版