网易首页 > 网易号 > 正文 申请入驻

DeepSeek-V3.1震撼发布,全球开源编程登顶!R1/V3首度合体,训练量暴增10倍

0
分享至


新智元报道

编辑:桃子

【新智元导读】DeepSeek-V3.1官宣了,作为首款「混合推理」模型,将开启智能体新时代。新模型共有671B参数,编码实力碾压DeepSeek-R1、Claude 4 Opus,登顶编程开源第一。

官宣了!

刚刚,DeepSeek正式上线DeepSeek-V3.1,这是迈向智能体时代第一步。

新版V3.1采用了「混合推理」,一个模型,两种模型:思考与非思考(自主切换)。


相较于DeepSeek-R1-0528 ,DeepSeek-V3.1-Think推理速度更快。

最关键的是,V3.1具备了强大的智能体能力,不论是工具使用,还是多步骤任务,全部拿捏。

在软件工程基准测试中,DeepSeek-V3.1全方位碾压V3-0324和R1-0528。


在人类的最后考试HLE中,V3.1拿下了29.8高分,另外在数学、知识问答、编程等任务中,全面超越推理模型R1。


CoT压缩训练后,V3.1-Think在输出token减少了20%-50%,与R1-0528打成平手

在Hugging Face上,一共开源了两款V3.1 Base和V3.1,前者在V3基础上又进行了8400亿token的持续预训练,扩展了上下文支持。


项目地址:

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

https://huggingface.co/deepseek-ai/DeepSeek-V3.1

总的来说,DeepSeek-V3.1此次更新的最大亮点:

  • 参数共671B,激活参数37B,上下文128k

  • 混合推理模式:一个模型,即可同时支持推理模式和非推理模式。

  • 更智能的工具调用能力:工具使用、智能体任务有了显著提升,多步推理能力强化,复杂搜索不在话下

  • 更高的推理效率:回答质量上与DeepSeek-R1-0528相媲美,思考效率飙升,反应快如闪电

  • 全面基准测试:实力全面碾压DeepSeek-R1-0528、DeepSeek-V3-0324

在API方面,deepseek-chat是非思考模式,deepseek-reasoner是思考模式,全部支持128k。


从9月5日开始,采用新的API定价

继OpenAI gpt-oss之后,DeepSeek终于做出了最强回应。


V3.1编程击败Claude 4,训练扩增10倍

HF模型卡中,给出了DeepSeek新模型技术的详细解读。

基于DeepSeek-V3.1-Base,DeepSeek-V3.1通过后训练优化完成。而V3.1-Base又是基于V3模型训练而来。


具体来说,它通过「两阶段长上下文扩展策略」构建,遵循了原始V3论文中的方法。

研究团队又扩展了数据集,收集了更多长文档,并大幅延长了两个训练阶段的规模。

32k扩展阶段增加了10倍,达6300亿Token,而128k扩展阶段增加了3.3倍,达到2090亿Token。


此外,DeepSeek-V3.1采用UE8M0 FP8缩放数据格式进行训练,确保与微尺度数据格式的兼容性。

在通用能力的基准测试中,开启思考模式V3.1,在MMLU、GPQA上拿下了亮眼的成绩。


数学方面,V3.1同样刷新SOTA,创下了最高分。


如上文所述,V3.1是迈向智能体时代第一步。它可以支持多种Code Agent框架,开发者可以自己搭建智能体。

在编码测试中,DeepSeek-V3.1-Thinking在Aider编码测试中,拿下了76.3%高分,远超Claude 4 Opus、Gemini 2.5 Pro(0325)。


在编码智能体测试中,DeepSeek-V3.1-Non Thinking性能碾压R1、V3。


此外,DeepSeek-V3.1可以支持Search Agent,在推理模式下可以使用。

当需要访问外部信息或最新信息的复杂问题,V3.1可以通过多轮工具调用流程,利用用户提供的搜索工具来完成。

基准测试中,尤其是BrowseComp上,V3.1实力粉碎了R1。


第三方Artificial Analysis基准,同样验证了DeepSeek-V3.1强大实力,仅次于gpt-oss。


在推理效率方面,V3.1也与OpenAI相当。


如今来看,DeepSeek-V3.1稳坐编程开源第一王座。


参考资料:

https://x.com/karminski3/status/1958429843558945015

https://x.com/deepseek_ai/status/1958417062008918312


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
摩根大通:关税严重冲击美中型企业

摩根大通:关税严重冲击美中型企业

新华社
2026-02-20 16:47:10
性能强、还舒适!春节开这几款硬派SUV,让你底气更足

性能强、还舒适!春节开这几款硬派SUV,让你底气更足

车壹圈
2026-02-21 14:25:59
上海配眼镜推荐 超高性价比配镜指南:3家省钱王 少花90%

上海配眼镜推荐 超高性价比配镜指南:3家省钱王 少花90%

小易商丘
2026-02-21 09:42:59
已对陈志犯罪集团提起诉讼!柬埔寨宣布,建立国家级打击网络诈骗机制,由首相洪玛奈领导

已对陈志犯罪集团提起诉讼!柬埔寨宣布,建立国家级打击网络诈骗机制,由首相洪玛奈领导

极目新闻
2026-02-21 09:59:37
四强全部诞生,塞大师2-6出局,赵心童创历史,半决赛再迎劲敌

四强全部诞生,塞大师2-6出局,赵心童创历史,半决赛再迎劲敌

郝小小看体育
2026-02-21 07:40:21
1987年薄一波去杭州看望陈云,见面笑道:电视里看你种树使很大劲

1987年薄一波去杭州看望陈云,见面笑道:电视里看你种树使很大劲

搜史君
2026-02-21 14:05:04
卓别林在晚宴上问周总理:可以送我一瓶茅台吗?总理回答令人感动

卓别林在晚宴上问周总理:可以送我一瓶茅台吗?总理回答令人感动

柳絮忆史
2026-01-02 07:15:03
集体涨价,一晚就涨了600多元!网友感叹:快成“奢侈品”了

集体涨价,一晚就涨了600多元!网友感叹:快成“奢侈品”了

小柱解说游戏
2026-02-19 20:31:31
DeepSeek推荐:一个家庭越来越富有的七个习惯

DeepSeek推荐:一个家庭越来越富有的七个习惯

洞见
2026-02-06 09:43:30
“继承权”无需再争!2026新规落地:父母房产按“这些规则”处理

“继承权”无需再争!2026新规落地:父母房产按“这些规则”处理

复转这些年
2026-01-27 03:00:03
志愿军送回受重伤美军,美军军医:我再也无法将中国人看作敌人!

志愿军送回受重伤美军,美军军医:我再也无法将中国人看作敌人!

晨光苏醒a
2026-02-20 23:30:32
黄金,重大利多来了!

黄金,重大利多来了!

杨子黄金
2026-02-21 09:18:29
深夜突发,三大指数盘中直线拉升!美国最高法院裁定特朗普政府大规模关税政策违法,美国或需退还1750亿美元!特朗普:判决可耻丨美股开盘

深夜突发,三大指数盘中直线拉升!美国最高法院裁定特朗普政府大规模关税政策违法,美国或需退还1750亿美元!特朗普:判决可耻丨美股开盘

每日经济新闻
2026-02-21 00:01:05
春节彩票休市后才明白:人生最大的奖,从来不在彩票站里

春节彩票休市后才明白:人生最大的奖,从来不在彩票站里

小李子体育
2026-02-21 13:54:03
就在杭州,近7亿人围观!眼下正是最佳观赏期,错过要等一年!

就在杭州,近7亿人围观!眼下正是最佳观赏期,错过要等一年!

杭州之声
2026-02-20 20:41:32
天生没手没脚,父母让他自生自灭,他却靠自己娶妻生子靠嘴养家

天生没手没脚,父母让他自生自灭,他却靠自己娶妻生子靠嘴养家

削桐作琴
2025-12-28 14:23:45
16球11助攻,昂达夫是本赛季第6位达成两双的五大联赛球员

16球11助攻,昂达夫是本赛季第6位达成两双的五大联赛球员

懂球帝
2026-02-21 03:37:09
痛心!7名中国游客沉入贝加尔湖溺亡,1月内发生2起,有游客前一天目击:到处都是冰裂...

痛心!7名中国游客沉入贝加尔湖溺亡,1月内发生2起,有游客前一天目击:到处都是冰裂...

极目新闻
2026-02-20 20:54:36
罗雪娟:与鲍春来分手后嫁大10岁丈夫,如今42岁儿女双全很幸福

罗雪娟:与鲍春来分手后嫁大10岁丈夫,如今42岁儿女双全很幸福

代军哥哥谈娱乐
2026-02-20 10:04:28
宜家最“偷懒”的广告,却高级得离谱

宜家最“偷懒”的广告,却高级得离谱

设计癖
2026-01-27 11:46:53
2026-02-21 15:11:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14564文章数 66632关注度
往期回顾 全部

科技要闻

智谱上市1月涨5倍,市值超越京东、快手

头条要闻

牛弹琴:一觉醒来世界大变 真急了的特朗普改新打法

头条要闻

牛弹琴:一觉醒来世界大变 真急了的特朗普改新打法

体育要闻

冬奥第一"海王"?一人和13国选手都有关系

娱乐要闻

镖人反超惊蛰无声拿下单日票房第二!

财经要闻

一觉醒来,世界大变,特朗普改新打法了

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

房产
家居
数码
时尚
军事航空

房产要闻

窗前即地标!独占三亚湾C位 自贸港总裁行宫亮相

家居要闻

本真栖居 爱暖伴流年

数码要闻

苹果低价MacBook下月登场:首次搭载A18 Pro手机芯片!

2026纽约秋冬时装周,在春天开启美的新故事!

军事要闻

硬核揭秘!福建舰“一马当先”底气何在

无障碍浏览 进入关怀版