网易首页 > 网易号 > 正文 申请入驻

DeepSeek-V3.2正式发布,推理性能逼近GPT-5

0
分享至

ChatGPT三岁生日这天,DeepSeek正式发布了V3.2及其增强版V3.2-Speciale,新版本在架构效率、推理能力和智能体性能三个维度实现突破,同时API价格维持了此前的大幅降价,输入token降至每百万1元,输出token降至2元。

相比DeepSeek-V3.1,DeepSeek-V3.2唯一的架构修改是通过继续训练引入了DeepSeek Sparse Attention(DSA)。传统Transformer的注意力计算复杂度为O(L²),DSA通过“闪电索引器”和细粒度token选择,将复杂度降至O(Lk),其中k为2048。在H800集群实测中,处理128K上下文时,V3.2的推理成本仅为V3.1-Terminus的三分之一左右。关键是这种效率提升几乎没有损失性能,在MMLU-Pro、GPQA Diamond等标准测试中,两者得分基本持平。

推理能力方面,V3.2通过超过预训练成本10%的强化学习投入,在AIME 2025数学竞赛中达到93.1%通过率,HMMT二月赛92.5%,Codeforces编程评级2386分,整体水平与GPT-5相当。相比Kimi K2 Thinking,V3.2在保持相近准确率的同时,平均输出长度减少约30%,显著降低了实际使用成本。强化学习框架引入了“无偏KL估计”和“离策略序列掩码”等技术,有效解决了大规模RL训练的稳定性问题。

V3.2-Speciale则专注于极限推理能力。该版本在2025年国际数学奥林匹克(IMO)中解决六题中的五题获得金牌,在国际信息学奥林匹克(IOI)得分492分(满分600)同样获得金牌,在ICPC世界总决赛中解决12题中的10题排名第二。这是首个在多项国际顶级竞赛中达到金牌水平的开源通用模型。

智能体能力是另一大亮点。DeepSeek开发了大规模任务合成系统,自动生成1827个环境和85000个任务,涵盖代码工程、搜索增强、通用问题解决等场景。在SWE-Verified代码修复测试中,V3.2解决了73.1%的真实GitHub问题;在Tool-Decathlon工具使用测试中达到35.2%通过率,领先于其他开源模型。特别设计的上下文管理策略,让模型在工具调用过程中保留推理历史,避免重复计算。

目前,相关模型权重、推理代码等已在社区开源。






特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
太甜!苏翊鸣生日当天夺中国首金 朱易晒亲密合照 回复:爱你宝贝

太甜!苏翊鸣生日当天夺中国首金 朱易晒亲密合照 回复:爱你宝贝

念洲
2026-02-19 07:14:06
街上为什么不放刘德华的《恭喜发财》了?

街上为什么不放刘德华的《恭喜发财》了?

娱乐硬糖
2026-02-18 12:39:39
浙江一103岁“功夫奶奶”五世同堂,百余人围坐吃团圆饭,最远的从新疆赶回来,家人:身体比我们这些儿女都好,坚持自己照顾自己

浙江一103岁“功夫奶奶”五世同堂,百余人围坐吃团圆饭,最远的从新疆赶回来,家人:身体比我们这些儿女都好,坚持自己照顾自己

大象新闻
2026-02-18 14:43:03
法国艺术圈地震!芭蕾女神、哲学少女,都被钢琴家送给了爱泼斯坦!

法国艺术圈地震!芭蕾女神、哲学少女,都被钢琴家送给了爱泼斯坦!

新欧洲
2026-02-18 19:44:34
为流量不惜造谣国际大事,凤凰卫视还有底线吗?

为流量不惜造谣国际大事,凤凰卫视还有底线吗?

老马拉车莫少装
2026-02-19 05:25:32
俄女外交官扎哈罗娃回忆首次在北京过年:不知道怎么放鞭炮,把草地点燃,好多人帮忙灭火

俄女外交官扎哈罗娃回忆首次在北京过年:不知道怎么放鞭炮,把草地点燃,好多人帮忙灭火

极目新闻
2026-02-18 10:14:33
揭秘《飞驰人生3》断层领先原因:这就是韩寒价值观的胜利

揭秘《飞驰人生3》断层领先原因:这就是韩寒价值观的胜利

人格志
2026-02-18 20:52:58
伊朗突然作起死来了...

伊朗突然作起死来了...

西楼饮月
2026-02-18 23:02:15
美国网友提问:为什么中国不能发明任何新东西,只能从西方窃取?

美国网友提问:为什么中国不能发明任何新东西,只能从西方窃取?

青橘罐头
2026-02-17 11:07:51
春节档3部新片豆瓣开分:《飞驰人生3》7.6分、《镖人》7.5分、《星河入梦》7.0分

春节档3部新片豆瓣开分:《飞驰人生3》7.6分、《镖人》7.5分、《星河入梦》7.0分

极目新闻
2026-02-18 10:22:47
“空气香甜女”杨舒平,已被美国驱逐出境,如今回国下场大快人心

“空气香甜女”杨舒平,已被美国驱逐出境,如今回国下场大快人心

小李子体育
2026-02-18 20:11:43
翻车!春晚“真弹幕”骗局?骂春晚发不出,夸的秒显,网友当傻子

翻车!春晚“真弹幕”骗局?骂春晚发不出,夸的秒显,网友当傻子

戗词夺理
2026-02-18 17:43:36
云南客船4死后续:更多细节曝光,人倒扣在水里,根本来不及救

云南客船4死后续:更多细节曝光,人倒扣在水里,根本来不及救

离离言几许
2026-02-18 21:45:35
湖北宜城发生一起烟花爆竹爆炸事故,已致12人死亡,爆炸原因正在进一步调查

湖北宜城发生一起烟花爆竹爆炸事故,已致12人死亡,爆炸原因正在进一步调查

每日经济新闻
2026-02-18 18:23:54
中国游客称因道路积雪被困俄罗斯“极光村” 超40小时,俄媒:滞留游客都已离开

中国游客称因道路积雪被困俄罗斯“极光村” 超40小时,俄媒:滞留游客都已离开

上游新闻
2026-02-17 20:22:05
最后一圈超越夺冠!亚洲短道速滑首金 中国颗粒无收 附最新奖牌榜

最后一圈超越夺冠!亚洲短道速滑首金 中国颗粒无收 附最新奖牌榜

侃球熊弟
2026-02-19 04:53:39
成为这个项目最伟大的运动员!徐梦桃创历史卫冕,邵琪斩获一枚铜牌!

成为这个项目最伟大的运动员!徐梦桃创历史卫冕,邵琪斩获一枚铜牌!

上观新闻
2026-02-18 21:50:05
高市早苗内阁集体辞职,是谢幕还是开场? 上午辞职下午重选背后唱的哪一出

高市早苗内阁集体辞职,是谢幕还是开场? 上午辞职下午重选背后唱的哪一出

大象新闻
2026-02-18 16:44:05
苏翊鸣徐梦桃连夺金牌,中国队排名上升5位,两人各获4枚奖牌

苏翊鸣徐梦桃连夺金牌,中国队排名上升5位,两人各获4枚奖牌

老癘体育解说
2026-02-18 22:14:27
娱乐圈著名6对“死对头”,个个矛盾根深蒂固,至今老死不相往来

娱乐圈著名6对“死对头”,个个矛盾根深蒂固,至今老死不相往来

a入画浅相思
2026-02-18 18:16:12
2026-02-19 08:24:49
问芯 incentive-icons
问芯
访遍天下芯事,聆听大时代人物芯声
173文章数 29关注度
往期回顾 全部

科技要闻

怒烧45亿,腾讯字节阿里决战春节

头条要闻

男子租新能源车自驾因APP控车失灵返程 起诉索赔被驳

头条要闻

男子租新能源车自驾因APP控车失灵返程 起诉索赔被驳

体育要闻

首金!苏翊鸣唱国歌落泪 自信比1呐喊

娱乐要闻

明星过年百态!黄晓明等现身三亚

财经要闻

面条火腿香菇酱!上市公司这些年请你吃

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

时尚
数码
艺术
游戏
本地

马年壁纸送上,祝大家新年快乐,马上发财!

数码要闻

倍思上架小冰充100W充电头,149元

艺术要闻

震惊!安徒生竟是画家,他的田园生活太美了!

《死或生》新作女性角色引争议 被LGBT人士痛批

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

无障碍浏览 进入关怀版