网易首页 > 网易号 > 正文 申请入驻

DeepSeek-V3.1发布:更高思考效率、更强智能体能力

0
分享至

21世纪经济报道记者 陈归辞

在DeepSeek-V3推出5个月后,DeepSeek-V3低调发布升级版模型DeepSeek-V3.1。

8月21日下午,DeepSeek 正式发布 DeepSeek-V3.1(简称“V3.1”),称其为“迈向 Agent 时代的第一步”。8月19日晚间,DeepSeek 小助手于官方群内宣布线上模型版本已升级至V3.1,引发广泛关注,目前 V3.1 在HuggingFace趋势榜排名已冲上第二。

据DeepSeek方面介绍,V3.1的升级主要包含三大变化:混合思考模式、更高的思考效率和更强的Agent(智能体)能力。

V3.1采用混合推理架构,一个模型同时支持思考模式与非思考模式。与之前的版本相比,引人注目的是,V3.1 将上下文由原有的64k扩展至128k。这意味着其能够一次性处理的上下文长度显著提升。

V3.1也具有更高的思考效率。DeepSeek 测试结果显示,经过思维链压缩训练后,V3.1-Think 在输出 token 数减少 20%-50% 的情况下,各项任务的平均表现与 R1-0528 持平。同时,V3.1 在非思考模式下的输出长度也得到了有效控制,相比于 DeepSeek-V3-0324 ,能够在输出长度明显减少的情况下保持相同的模型性能。

另外值得注意的是,通过后训练优化,V3.1 在工具使用与智能体任务中的表现有较大提升。

编程任务方面,DeepSeek测试结果显示,在代码修复测评 SWE 与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明显提高。

从业内实测反馈来看,V3.1在AiderPolyglot多语言编程测试中,拿下了71.6%的高分,超越了Claude 4 Opus和DeepSeek R1等模型。并且,其完成每次完整编程任务的成本仅1.01美元,为专有系统的六十分之一。

搜索任务方面,DeepSeek测试结果显示,V3.1在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1 性能已大幅领先 R1-0528。

V3.1 在多语言支持能力上也有显著优化,目前能处理超过100种语言,尤其优化了亚洲语言和资源较少语种的运用。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
花200万购到奔驰山寨车遭三省法院“踢皮球”:我们没有管辖权!

花200万购到奔驰山寨车遭三省法院“踢皮球”:我们没有管辖权!

兵叔评说
2026-04-06 12:38:28
上海一公园内女子爬树拍照,20年树龄樱花树被连根压倒!经多部门联合查找约谈,当事人承认错误并愿赔偿

上海一公园内女子爬树拍照,20年树龄樱花树被连根压倒!经多部门联合查找约谈,当事人承认错误并愿赔偿

扬子晚报
2026-04-07 21:05:56
王励勤终于决定,逐渐放弃这4位老将,培养新生代力量已成重点

王励勤终于决定,逐渐放弃这4位老将,培养新生代力量已成重点

观察者海风
2026-04-07 23:46:07
伊朗的“眼睛”被挖掉了:雷扎伊之死背后的情报灾难

伊朗的“眼睛”被挖掉了:雷扎伊之死背后的情报灾难

民间胡扯老哥
2026-04-05 07:45:23
重庆憋屈的大学校园,绿树成荫却不闻读书声,满目商业似乎要改造

重庆憋屈的大学校园,绿树成荫却不闻读书声,满目商业似乎要改造

旅游探秘行者
2026-04-07 21:51:13
控制体重最佳的时间是晚上,晚上坚持“5个不”,隔天体重轻松掉

控制体重最佳的时间是晚上,晚上坚持“5个不”,隔天体重轻松掉

运动健身号
2026-04-06 10:00:11
特朗普宣布对伊朗实施两周停火

特朗普宣布对伊朗实施两周停火

中国日报网
2026-04-08 08:20:03
短剧女神余茵「暴瘦剩35kg」吸氧续命! 腿细如竹竿叹:再瘦人就没了

短剧女神余茵「暴瘦剩35kg」吸氧续命! 腿细如竹竿叹:再瘦人就没了

ETtoday星光云
2026-04-07 15:18:10
民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

共工之锚
2026-03-31 00:27:37
回加拿大生活的大山,61岁已老态龙钟,重庆妻子却风韵犹存!

回加拿大生活的大山,61岁已老态龙钟,重庆妻子却风韵犹存!

悦君兮君不知
2026-04-06 23:04:40
“台湾与上海比想像中近很多”,郑丽文:难得的和平机遇一定要把握

“台湾与上海比想像中近很多”,郑丽文:难得的和平机遇一定要把握

星岛记事
2026-04-07 19:43:21
Meta员工空转AI只为浪费token!烧的多挣的多,日均消耗2万亿

Meta员工空转AI只为浪费token!烧的多挣的多,日均消耗2万亿

量子位
2026-04-07 17:13:17
4轮中超0首发!伊万昔日弟子惨遭斯卢茨基冷落,沦为申花边缘人

4轮中超0首发!伊万昔日弟子惨遭斯卢茨基冷落,沦为申花边缘人

零度眼看球
2026-04-08 06:47:57
涉嫌严重违纪违法,罗鹏被查

涉嫌严重违纪违法,罗鹏被查

吉刻新闻
2026-04-07 16:23:23
断绝沟通,举国赴死!伊朗这波反杀操作,给全世界上了震撼一课

断绝沟通,举国赴死!伊朗这波反杀操作,给全世界上了震撼一课

健身狂人
2026-04-08 07:09:28
香港楼市,那是真的爆。

香港楼市,那是真的爆。

樱桃大房子
2026-04-07 22:16:49
三国臭名昭著的4个名人,结果被小说洗白,摇身一变成了正面人物

三国臭名昭著的4个名人,结果被小说洗白,摇身一变成了正面人物

铭记历史呀
2026-04-07 15:47:12
研究表明:性生活越频繁,射精和勃起问题越少!

研究表明:性生活越频繁,射精和勃起问题越少!

黯泉
2026-04-05 20:40:12
王励勤终于下定决心!4大老将逐步放弃,重点培养新生代为时不晚

王励勤终于下定决心!4大老将逐步放弃,重点培养新生代为时不晚

罗纳尔说个球
2026-04-07 12:00:49
杜兰特交易后首次客战太阳:一开始我确实很不爽 但现在已经放下

杜兰特交易后首次客战太阳:一开始我确实很不爽 但现在已经放下

罗说NBA
2026-04-08 06:01:32
2026-04-08 08:47:00
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
241778文章数 744012关注度
往期回顾 全部

科技要闻

造出地表最强AI,却死活不给你用!

头条要闻

郑丽文表态:感谢大陆热情接待 国民党坚持"九二共识"

头条要闻

郑丽文表态:感谢大陆热情接待 国民党坚持"九二共识"

体育要闻

科特迪瓦中场卡迪尔-凯塔被控过失杀人罪,面临九年以上监禁

娱乐要闻

女首富陈丽华离世 被曝生前已分好遗产

财经要闻

特朗普同意停火两周 伊朗:接受停火提议

汽车要闻

不止是大 极狐首款MPV问道V9静态体验

态度原创

房产
健康
数码
手机
公开课

房产要闻

重磅!三亚拟出安居房新政!

干细胞抗衰4大误区,90%的人都中招

数码要闻

售价413元!苹果官网上架iPhone斜挎包:可放置AirTag追踪器

手机要闻

古尔曼:苹果可折叠iPhone Fold仍按计划于9月推出

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版