网易首页 > 网易号 > 正文 申请入驻

DeepSeek-V3.1正式发布,混合推理架构加持,Agent能力再迎突破

0
分享至

21日,DeepSeek宣布,DeepSeek发布了其最新的大语言模型DeepSeek-V3.1,通过引入混合推理架构和显著增强的智能体(Agent)能力,进一步加剧了全球AI市场的技术竞赛。

V3.1版本的核心亮点是采用了全新的混合推理架构允许模型在一个统一框架内支持“思考”与“非思考”两种模式。根据官方公告,新版本通过训练后优化,在工具使用与编程、搜索等智能体任务上表现获得较大提升。需要注意的是,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度。UE8M0 FP8是针对即将发布的下一代国产芯片设计。

据社区测试数据显示,新模型在Aider多语言编程基准测试中得分超越了Anthropic的Claude 4 Opus,同时保持了显著的成本优势。这一性能突破已在开发者社区引发广泛关注,模型在Hugging Face平台的热度迅速攀升。

DeepSeek同步升级了API接口,将上下文窗口扩展至128K,并新增了对Anthropic API格式的支持以简化迁移。更重要的是,公司宣布将于2025年9月6日起执行新的API定价方案并取消夜间优惠,这被视为其在服务能力扩容后,加速商业化进程的关键一步。

混合推理架构,迈向Agent时代

据DeepSeek官网,本次升级包含以下主要变化:

  • 混合推理架构:一个模型同时支持思考模式与非思考模式;
  • 更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案;
  • 更强的 Agent 能力:通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。

在效率方面,新的思考模式(V3.1-Think)经过思维链压缩训练,相比上一代模型(R1-0528),在任务表现基本持平的情况下,token消耗量可减少20%至50%。

新模型着重强化了以编程和搜索为代表的Agent能力。根据DeepSeek公布的数据,V3.1在代码修复(SWE)和命令行终端任务(Terminal-Bench)测试中,性能相较于公司以往模型有明显提高。在搜索任务上,模型在需要多步推理的复杂搜索测试(browsecomp)中也大幅领先。

社区进行的第三方测试进一步证实了其编程能力的跃升。数据显示,在Aider编程基准上,V3.1取得了71.6%的高分,超越了包括Claude 4 Opus在内的多个知名模型。同时,该测试也凸显了其成本效益,完成一次编程任务的成本仅为1.01美元,远低于部分专有闭源模型。这些性能指标的提升,直接增强了DeepSeek在自动化编程和复杂信息处理等商业场景中的吸引力。

开源与API更新同步推进

DeepSeek继续其开源策略,已将V3.1的Base模型和后训练模型在Hugging Face与魔搭社区上发布。据称,此次发布的模型参数量为685B,Base模型在V3基础上额外进行了840B token的训练。公司特别提醒开发者,新模型采用了UE8M0 FP8 Scale的参数精度,且分词器(tokenizer)和聊天模板有较大调整,部署时需参考最新文档。

与此同时,API服务也全面升级。除了将上下文长度扩展至128K外,DeepSeek还为开发者提供了更强大的工具调用功能,例如支持strict模式的Function Calling以确保输出格式的规范性。

此外,为降低生态迁移成本,API增加了对Anthropic API格式的兼容支持,方便使用Claude Code框架的开发者接入DeepSeek模型。

商业化提速:API价格调整在即

在技术与产品更新之外,DeepSeek也迈出了清晰的商业化步伐。公司宣布,将从北京时间2025年9月6日凌晨起,对开放平台的API接口调用价格进行调整,届时将执行新版价格表,并同步取消实行已久的夜间时段优惠。

  • 输入:0.5元/百万tokens(缓存命中);4元/百万tokens(缓存未命中)。
  • 输出:12元/百万 tokens。

在价格调整生效前,所有API服务仍按原价格政策计费。公司表示,此举是为更好地满足用户调用需求,并已对API服务资源进行了扩容。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
太过分!全红婵遭专群网暴,港媒曝光才敢说,人民日报白岩松怒了

太过分!全红婵遭专群网暴,港媒曝光才敢说,人民日报白岩松怒了

手工制作阿歼
2026-04-08 11:39:18
足协官宣中超2例误判!河南队被漏判点球,国安进球被吹前未犯规

足协官宣中超2例误判!河南队被漏判点球,国安进球被吹前未犯规

我爱英超
2026-04-08 16:21:48
中俄反对涉霍尔木兹海峡决议草案,草案未获通过;伊朗代表:感谢中俄!

中俄反对涉霍尔木兹海峡决议草案,草案未获通过;伊朗代表:感谢中俄!

大风新闻
2026-04-08 11:03:05
伊朗民众组成人链保护发电厂和桥梁

伊朗民众组成人链保护发电厂和桥梁

界面新闻
2026-04-07 22:42:24
三星家族结清12万亿遗产税!兄妹3人与母砸锅卖铁硬扛

三星家族结清12万亿遗产税!兄妹3人与母砸锅卖铁硬扛

时尚的弄潮
2026-04-08 02:41:46
开车致女友截瘫后失联男子首发声,女子起诉男方并回应传闻

开车致女友截瘫后失联男子首发声,女子起诉男方并回应传闻

大象新闻
2026-04-07 15:37:04
一场119-105的21分大逆转让湖人绝望,西部首轮两组对决基本确定

一场119-105的21分大逆转让湖人绝望,西部首轮两组对决基本确定

毒舌NBA
2026-04-08 13:57:14
不回休斯顿了?离开火箭,秒变准全明星!弃将摊牌:愿终老太阳队

不回休斯顿了?离开火箭,秒变准全明星!弃将摊牌:愿终老太阳队

熊哥爱篮球
2026-04-08 12:28:21
新加坡急了,外长几乎是拍着桌子,让中国“尊重”马六甲的地位。

新加坡急了,外长几乎是拍着桌子,让中国“尊重”马六甲的地位。

南权先生
2026-01-26 15:41:26
李小林被查!铁血军魂不许玷污一声惊雷,又一只“老虎”应声落马

李小林被查!铁血军魂不许玷污一声惊雷,又一只“老虎”应声落马

触摸史迹
2026-04-07 18:20:41
张雪峰接班人武亮首场直播:解答所有疑问,未来把公司交给张姩菡

张雪峰接班人武亮首场直播:解答所有疑问,未来把公司交给张姩菡

谈史论天地
2026-04-08 05:34:57
黎巴嫩总理称正加强外交政治沟通,寻求实现停火

黎巴嫩总理称正加强外交政治沟通,寻求实现停火

界面新闻
2026-04-08 20:29:42
从年赚358亿到巨亏234亿,美团为啥沦落至此,难怪国家禁外卖大战

从年赚358亿到巨亏234亿,美团为啥沦落至此,难怪国家禁外卖大战

轩逸阿II
2026-04-03 09:21:18
国籍风波不过7年,央视出手,邓亚萍迎噩耗,曝出两点重要信息

国籍风波不过7年,央视出手,邓亚萍迎噩耗,曝出两点重要信息

梨花黛娱
2026-04-08 14:51:22
不是挺硬气吗?怎么一觉醒来全慌了?日本这回是真踢到了铁板

不是挺硬气吗?怎么一觉醒来全慌了?日本这回是真踢到了铁板

安安说
2026-04-06 14:50:41
美国华裔科学家李飞飞:若夺下诺贝尔奖,我定以中国人身份领奖!

美国华裔科学家李飞飞:若夺下诺贝尔奖,我定以中国人身份领奖!

南宗历史
2026-04-07 17:55:41
蒙古大变天,就在所有人以为新总理必反华时,他却对华正式交底了

蒙古大变天,就在所有人以为新总理必反华时,他却对华正式交底了

夏目历史君
2026-04-07 19:58:21
巨鲸割肉2000万!比特币“死亡螺旋”开启,31,000美元只是开始?

巨鲸割肉2000万!比特币“死亡螺旋”开启,31,000美元只是开始?

奔跑财经
2026-04-08 13:48:44
华南多地局地气温超40℃ 专家:未来一周 高温范围将继续扩大

华南多地局地气温超40℃ 专家:未来一周 高温范围将继续扩大

财联社
2026-04-08 17:45:03
周杰伦演唱划水升级!在日本连唱两小时不休息,国内拉兄弟团帮唱

周杰伦演唱划水升级!在日本连唱两小时不休息,国内拉兄弟团帮唱

陈意小可爱
2026-04-08 18:15:59
2026-04-08 22:28:49
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
144230文章数 2653160关注度
往期回顾 全部

科技要闻

造出地表最强AI,却死活不给你用!

头条要闻

男子支付85万做消毒液生意 根据一张出警图片发现被骗

头条要闻

男子支付85万做消毒液生意 根据一张出警图片发现被骗

体育要闻

40岁,但实力倒退12年

娱乐要闻

杨颖邓超低调现身观众席 支持陈赫话剧

财经要闻

天津海河乳业回应直播间涉黄

汽车要闻

5门5座/新复古造型 缤果Pro将于4月14日开启预售

态度原创

游戏
艺术
手机
旅游
教育

kun哥独家爆料!《地平线6》限定手柄、耳机来了

艺术要闻

齐白石『凌波仙子』

手机要闻

天玑9500对决!REDMI K90 Max和一加Ace 6至尊版,谁才是最终选择

旅游要闻

告别“老三样”,南京江宁乡村游靠“新场景”火出圈

教育要闻

前飞利浦团队打造线上 STEM 创客空间,零广告费覆盖全美 50 州

无障碍浏览 进入关怀版