网易首页 > 网易号 > 正文 申请入驻

DeepSeek-V3.1正式发布,混合推理架构加持,Agent能力再迎突破

0
分享至

21日,DeepSeek宣布,DeepSeek发布了其最新的大语言模型DeepSeek-V3.1,通过引入混合推理架构和显著增强的智能体(Agent)能力,进一步加剧了全球AI市场的技术竞赛。

V3.1版本的核心亮点是采用了全新的混合推理架构允许模型在一个统一框架内支持“思考”与“非思考”两种模式。根据官方公告,新版本通过训练后优化,在工具使用与编程、搜索等智能体任务上表现获得较大提升。需要注意的是,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度。UE8M0 FP8是针对即将发布的下一代国产芯片设计。

据社区测试数据显示,新模型在Aider多语言编程基准测试中得分超越了Anthropic的Claude 4 Opus,同时保持了显著的成本优势。这一性能突破已在开发者社区引发广泛关注,模型在Hugging Face平台的热度迅速攀升。

DeepSeek同步升级了API接口,将上下文窗口扩展至128K,并新增了对Anthropic API格式的支持以简化迁移。更重要的是,公司宣布将于2025年9月6日起执行新的API定价方案并取消夜间优惠,这被视为其在服务能力扩容后,加速商业化进程的关键一步。

混合推理架构,迈向Agent时代

据DeepSeek官网,本次升级包含以下主要变化:

  • 混合推理架构:一个模型同时支持思考模式与非思考模式;
  • 更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案;
  • 更强的 Agent 能力:通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。

在效率方面,新的思考模式(V3.1-Think)经过思维链压缩训练,相比上一代模型(R1-0528),在任务表现基本持平的情况下,token消耗量可减少20%至50%。


新模型着重强化了以编程和搜索为代表的Agent能力。根据DeepSeek公布的数据,V3.1在代码修复(SWE)和命令行终端任务(Terminal-Bench)测试中,性能相较于公司以往模型有明显提高。在搜索任务上,模型在需要多步推理的复杂搜索测试(browsecomp)中也大幅领先。


社区进行的第三方测试进一步证实了其编程能力的跃升。数据显示,在Aider编程基准上,V3.1取得了71.6%的高分,超越了包括Claude 4 Opus在内的多个知名模型。同时,该测试也凸显了其成本效益,完成一次编程任务的成本仅为1.01美元,远低于部分专有闭源模型。这些性能指标的提升,直接增强了DeepSeek在自动化编程和复杂信息处理等商业场景中的吸引力。

开源与API更新同步推进

DeepSeek继续其开源策略,已将V3.1的Base模型和后训练模型在Hugging Face与魔搭社区上发布。据称,此次发布的模型参数量为685B,Base模型在V3基础上额外进行了840B token的训练。公司特别提醒开发者,新模型采用了UE8M0 FP8 Scale的参数精度,且分词器(tokenizer)和聊天模板有较大调整,部署时需参考最新文档。

与此同时,API服务也全面升级。除了将上下文长度扩展至128K外,DeepSeek还为开发者提供了更强大的工具调用功能,例如支持strict模式的Function Calling以确保输出格式的规范性。

此外,为降低生态迁移成本,API增加了对Anthropic API格式的兼容支持,方便使用Claude Code框架的开发者接入DeepSeek模型。


商业化提速:API价格调整在即

在技术与产品更新之外,DeepSeek也迈出了清晰的商业化步伐。公司宣布,将从北京时间2025年9月6日凌晨起,对开放平台的API接口调用价格进行调整,届时将执行新版价格表,并同步取消实行已久的夜间时段优惠。

  • 输入:0.5元/百万tokens(缓存命中);4元/百万tokens(缓存未命中)。
  • 输出:12元/百万 tokens。

在价格调整生效前,所有API服务仍按原价格政策计费。公司表示,此举是为更好地满足用户调用需求,并已对API服务资源进行了扩容。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
勇士负于雷霆后,科尔的赛后言论引发库明加在勇士长期未来的疑问

勇士负于雷霆后,科尔的赛后言论引发库明加在勇士长期未来的疑问

好火子
2026-01-04 01:28:06
马杜罗被擒!特朗普沾沾自喜,殊不知酿成大祸,美国或成最大输家

马杜罗被擒!特朗普沾沾自喜,殊不知酿成大祸,美国或成最大输家

小莜读史
2026-01-04 01:25:06
大胆预测,世预赛中日男篮对决,中国男篮的大腿,是以下四位

大胆预测,世预赛中日男篮对决,中国男篮的大腿,是以下四位

一纸情书s
2026-01-03 04:04:40
官媒发文,饺子再破天花板,让张艺谋和整个电影界“沉默”了

官媒发文,饺子再破天花板,让张艺谋和整个电影界“沉默”了

诺诺谈史
2026-01-01 06:27:59
慢病患者的春天真的来了!2026新政“两免”福利落地,实在太好了

慢病患者的春天真的来了!2026新政“两免”福利落地,实在太好了

老特有话说
2026-01-03 22:42:06
赵露思直播卖货动作幅度太大露出内裤,遭质疑博流量,太败好感!

赵露思直播卖货动作幅度太大露出内裤,遭质疑博流量,太败好感!

桑葚爱动画
2026-01-02 19:46:41
年产量首破450万吨油当量!“深海一号”完成100船原油外输

年产量首破450万吨油当量!“深海一号”完成100船原油外输

中国日报网
2026-01-03 08:25:02
莫言:夫妻能过就好好过,最好别离婚,你渐渐就会发现,跟谁过都是一个鬼样,或许更糟糕

莫言:夫妻能过就好好过,最好别离婚,你渐渐就会发现,跟谁过都是一个鬼样,或许更糟糕

北极星心理
2025-12-31 06:50:45
“美国空军几乎关闭了所有飞行跟踪应答器”

“美国空军几乎关闭了所有飞行跟踪应答器”

观察者网
2026-01-03 15:24:05
前国脚定居西班牙多年,卖5套房花费1000万,如今没有工作吃老本

前国脚定居西班牙多年,卖5套房花费1000万,如今没有工作吃老本

素衣读史
2025-12-30 18:06:27
湖北美术馆发生火灾 现场探访:明火已扑灭,现场拉起警戒线

湖北美术馆发生火灾 现场探访:明火已扑灭,现场拉起警戒线

红星新闻
2026-01-03 19:19:14
47岁刘涛居家瘫坐照杀疯了!黑T白裤配粉拖,普通女人的松弛美

47岁刘涛居家瘫坐照杀疯了!黑T白裤配粉拖,普通女人的松弛美

孤城落日
2025-12-20 12:17:01
司晓迪疯狂开大!自曝睡过鹿晗、林更新、檀健次,关晓彤受牵连

司晓迪疯狂开大!自曝睡过鹿晗、林更新、檀健次,关晓彤受牵连

叶公子
2026-01-03 13:00:17
雷军否认小米7000法务:希望新的一年强化团队建设,打击黑水军

雷军否认小米7000法务:希望新的一年强化团队建设,打击黑水军

IT之家
2026-01-03 22:49:05
据说全球仅20例!巴西一女子在同一晚与2名男子发生了关系

据说全球仅20例!巴西一女子在同一晚与2名男子发生了关系

忠于法纪
2025-12-04 11:25:07
湖人队主帅雷迪克仅用4字,解释了海耶斯和艾顿的换人决定

湖人队主帅雷迪克仅用4字,解释了海耶斯和艾顿的换人决定

好火子
2026-01-04 01:35:08
赵薇钻空子,凌晨空降酒庄直播间,多次亲自家主播,正嗨聊时被封

赵薇钻空子,凌晨空降酒庄直播间,多次亲自家主播,正嗨聊时被封

非常先生看娱乐
2026-01-01 18:03:27
美媒扒SGA“空气哨”细节:霍福德无接触被吹犯规 库里疯狂挠头

美媒扒SGA“空气哨”细节:霍福德无接触被吹犯规 库里疯狂挠头

Emily说个球
2026-01-03 22:26:20
委内瑞拉政局大概率要“翻天”,抗美大旗难再扛

委内瑞拉政局大概率要“翻天”,抗美大旗难再扛

奇思妙想生活家
2026-01-03 22:24:04
特朗普官宣马杜罗被捕照,送纽约公开羞辱,俄军瓦格纳一枪没开?

特朗普官宣马杜罗被捕照,送纽约公开羞辱,俄军瓦格纳一枪没开?

触摸史迹
2026-01-04 00:42:31
2026-01-04 03:27:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
139615文章数 2652024关注度
往期回顾 全部

科技要闻

雷军:骂小米汽车有流量,但别故意抹黑

头条要闻

牛弹琴:美国入侵委内瑞拉 给世界带来三个血的教训

头条要闻

牛弹琴:美国入侵委内瑞拉 给世界带来三个血的教训

体育要闻

青岛西海岸官宣:郑智出任一线队主教练

娱乐要闻

司晓迪事件再升级 司晓迪称鹿晗最好

财经要闻

具身智能抢人大战:毕业一年 年薪300万

汽车要闻

奕派科技全年销量275,752辆 同比增长28.3

态度原创

家居
亲子
房产
公开课
军事航空

家居要闻

无形有行 自然与灵感诗意

亲子要闻

后续!月嫂给婴儿偷喂安眠药被抓,身份被扒,知情人曝行业内幕

房产要闻

海大誉府新年家年华暨2号楼耀世加推发布会圆满落幕

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普称将干涉伊朗骚乱事件 伊朗政府发声明强烈谴责

无障碍浏览 进入关怀版