网易首页 > 网易号 > 正文 申请入驻

DeepSeek-V3.1正式发布,混合推理架构加持,Agent能力再迎突破

0
分享至

21日,DeepSeek宣布,DeepSeek发布了其最新的大语言模型DeepSeek-V3.1,通过引入混合推理架构和显著增强的智能体(Agent)能力,进一步加剧了全球AI市场的技术竞赛。

V3.1版本的核心亮点是采用了全新的混合推理架构允许模型在一个统一框架内支持“思考”与“非思考”两种模式。根据官方公告,新版本通过训练后优化,在工具使用与编程、搜索等智能体任务上表现获得较大提升。需要注意的是,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度。UE8M0 FP8是针对即将发布的下一代国产芯片设计。

据社区测试数据显示,新模型在Aider多语言编程基准测试中得分超越了Anthropic的Claude 4 Opus,同时保持了显著的成本优势。这一性能突破已在开发者社区引发广泛关注,模型在Hugging Face平台的热度迅速攀升。

DeepSeek同步升级了API接口,将上下文窗口扩展至128K,并新增了对Anthropic API格式的支持以简化迁移。更重要的是,公司宣布将于2025年9月6日起执行新的API定价方案并取消夜间优惠,这被视为其在服务能力扩容后,加速商业化进程的关键一步。

混合推理架构,迈向Agent时代

据DeepSeek官网,本次升级包含以下主要变化:

  • 混合推理架构:一个模型同时支持思考模式与非思考模式;
  • 更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案;
  • 更强的 Agent 能力:通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。

在效率方面,新的思考模式(V3.1-Think)经过思维链压缩训练,相比上一代模型(R1-0528),在任务表现基本持平的情况下,token消耗量可减少20%至50%。


新模型着重强化了以编程和搜索为代表的Agent能力。根据DeepSeek公布的数据,V3.1在代码修复(SWE)和命令行终端任务(Terminal-Bench)测试中,性能相较于公司以往模型有明显提高。在搜索任务上,模型在需要多步推理的复杂搜索测试(browsecomp)中也大幅领先。


社区进行的第三方测试进一步证实了其编程能力的跃升。数据显示,在Aider编程基准上,V3.1取得了71.6%的高分,超越了包括Claude 4 Opus在内的多个知名模型。同时,该测试也凸显了其成本效益,完成一次编程任务的成本仅为1.01美元,远低于部分专有闭源模型。这些性能指标的提升,直接增强了DeepSeek在自动化编程和复杂信息处理等商业场景中的吸引力。

开源与API更新同步推进

DeepSeek继续其开源策略,已将V3.1的Base模型和后训练模型在Hugging Face与魔搭社区上发布。据称,此次发布的模型参数量为685B,Base模型在V3基础上额外进行了840B token的训练。公司特别提醒开发者,新模型采用了UE8M0 FP8 Scale的参数精度,且分词器(tokenizer)和聊天模板有较大调整,部署时需参考最新文档。

与此同时,API服务也全面升级。除了将上下文长度扩展至128K外,DeepSeek还为开发者提供了更强大的工具调用功能,例如支持strict模式的Function Calling以确保输出格式的规范性。

此外,为降低生态迁移成本,API增加了对Anthropic API格式的兼容支持,方便使用Claude Code框架的开发者接入DeepSeek模型。


商业化提速:API价格调整在即

在技术与产品更新之外,DeepSeek也迈出了清晰的商业化步伐。公司宣布,将从北京时间2025年9月6日凌晨起,对开放平台的API接口调用价格进行调整,届时将执行新版价格表,并同步取消实行已久的夜间时段优惠。

  • 输入:0.5元/百万tokens(缓存命中);4元/百万tokens(缓存未命中)。
  • 输出:12元/百万 tokens。

在价格调整生效前,所有API服务仍按原价格政策计费。公司表示,此举是为更好地满足用户调用需求,并已对API服务资源进行了扩容。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
乒乓球全运会:林诗栋0-2落后大逆转!11-3大胜,3-0领先冲16强!

乒乓球全运会:林诗栋0-2落后大逆转!11-3大胜,3-0领先冲16强!

刘姚尧的文字城堡
2025-11-11 18:30:46
安徽高考生詹胡涛去世,年仅18岁,刚考上交通大学,前后仅2个月

安徽高考生詹胡涛去世,年仅18岁,刚考上交通大学,前后仅2个月

阅识
2025-11-12 10:15:35
香港一对兄弟被发现陈尸家中!初查死因令人唏嘘

香港一对兄弟被发现陈尸家中!初查死因令人唏嘘

看看新闻Knews
2025-11-12 14:56:02
卡地亚晚宴明星站位曝地位:那英、郭晶晶靠边站,C位实至名归

卡地亚晚宴明星站位曝地位:那英、郭晶晶靠边站,C位实至名归

查尔菲的笔记
2025-11-10 16:06:40
约基奇轰35+15+7仍无缘今日最佳!对不起,你碰到创纪录的切特了

约基奇轰35+15+7仍无缘今日最佳!对不起,你碰到创纪录的切特了

世界体育圈
2025-11-12 14:47:14
媒体人:余嘉豪冒着被解约的风险回国打全运会;西乙俱乐部严重不满

媒体人:余嘉豪冒着被解约的风险回国打全运会;西乙俱乐部严重不满

懂球帝
2025-11-12 15:02:13
毛主席临终前为何拿掉叶剑英军权?令人不解,多年后才知主席苦心

毛主席临终前为何拿掉叶剑英军权?令人不解,多年后才知主席苦心

云端书馆
2024-12-24 08:49:00
何穗产后大秀身材!上围火辣,私密位尴尬,陈伟霆男友视角好绝!

何穗产后大秀身材!上围火辣,私密位尴尬,陈伟霆男友视角好绝!

艳姐的搞笑视频
2025-11-12 17:11:18
33岁仕途不顺,34岁千古帝王

33岁仕途不顺,34岁千古帝王

我是历史其实挺有趣
2025-11-12 16:30:45
马凯硕怒怼西方记者:你的提问,完美暴露了你对中国模式的无知

马凯硕怒怼西方记者:你的提问,完美暴露了你对中国模式的无知

历史求知所
2025-11-11 16:55:03
新加坡总统公开警告中国:要想世界和平,中国得放弃一样东西

新加坡总统公开警告中国:要想世界和平,中国得放弃一样东西

文史旺旺旺
2025-11-12 18:39:06
西安7岁女孩寒风中穿凉鞋路边捡吃的,父亲称妻子离世家境窘迫,民政局:已妥善安排

西安7岁女孩寒风中穿凉鞋路边捡吃的,父亲称妻子离世家境窘迫,民政局:已妥善安排

极目新闻
2025-11-12 13:23:24
美方114页报告曾得结论:若跟中国打起来,战争或在一个月内结束

美方114页报告曾得结论:若跟中国打起来,战争或在一个月内结束

阿校谈史
2025-11-12 12:04:54
失业之后我才发现:搞钱的野路子原来这么多,而我却只知道上班

失业之后我才发现:搞钱的野路子原来这么多,而我却只知道上班

小鬼头体育
2025-11-11 08:58:38
逼姚明退役,他凭一己之力让中国篮球倒退了二十年

逼姚明退役,他凭一己之力让中国篮球倒退了二十年

篮球国度
2025-11-12 15:02:37
25岁被俱乐部三停处罚,队友比赛他逛街,恐被邵佳一踢出国家队

25岁被俱乐部三停处罚,队友比赛他逛街,恐被邵佳一踢出国家队

体坛风之子
2025-11-12 07:00:03
首个有期徒刑正式宣判,恒大、中植“关键人”一个都跑不了!

首个有期徒刑正式宣判,恒大、中植“关键人”一个都跑不了!

深蓝财经
2025-11-11 19:39:46
局势已恶化,马科斯被要求下台,菲国61个市镇大断电,还忙着反华

局势已恶化,马科斯被要求下台,菲国61个市镇大断电,还忙着反华

boss外传
2025-11-11 17:30:03
虞莉清在江西被带走接受调查

虞莉清在江西被带走接受调查

微月都
2025-11-12 11:57:56
“毒衣服”被曝光,致癌物超标,会改变DNA!这4种衣服谨慎购买

“毒衣服”被曝光,致癌物超标,会改变DNA!这4种衣服谨慎购买

DrX说
2025-11-11 14:30:30
2025-11-12 20:43:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
137405文章数 2651409关注度
往期回顾 全部

科技要闻

前阿里人亲述: “经济上行”期双11什么样

头条要闻

1家5口被邻居杀害:3岁孩子都没放过 行凶全程仅2分钟

头条要闻

1家5口被邻居杀害:3岁孩子都没放过 行凶全程仅2分钟

体育要闻

消磨你上千小时的足球游戏,走过第20年

娱乐要闻

再王珞丹和白百何 明白两人"差别"在哪

财经要闻

段永平最新访谈:聊企业经营 投资理念

汽车要闻

7座皆独立座椅/新增5座版 体验第三代吉利豪越L

态度原创

房产
数码
家居
旅游
公开课

房产要闻

海垦城建·鹿城壹号品牌发布会暨美学示范区璀璨启幕

数码要闻

IBM发布旗下最先进量子处理器“量子夜鹰”,今年底交付

家居要闻

情感之所 生活教会设计

旅游要闻

环两山引领区广州片区吃喝玩乐游购全攻略宝藏电子地图发布

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版