网易首页 > 网易号 > 正文 申请入驻

DeepSeek-V3.2 在推理任务中的表现优于 GPT-5

0
分享至


作者 | Anthony Alford

译者 | 平川

DeepSeek 发布 DeepSeek-V3.2,这是一个开源的推理和代理 AI 模型家族。在多项推理基准测试中,其高性能计算版本 DeepSeek-V3.2-Speciale 表现优于 GPT-5,与 Gemini-3.0-Pro 相当。

DeepSeek 在开发 DeepSeek-V3.2 时应用了三项新技术。首先,他们使用了一种更高效的注意力机制,称为 DeepSeek 稀疏注意力(DSA),这降低了模型的计算复杂性。他们还扩展了强化学习阶段,使其消耗的计算资源超过了预训练。最后,为了改进模型使用工具的能力,他们开发了一个代理任务合成管道。最终,该模型在一系列编码、推理和代理基准测试中的表现超过了其他大多数开源模型,并且与 GPT-5 和 Gemini-3.0-Pro 等前沿闭源模型持平或更好。不过,DeepSeek 团队指出:

尽管取得了这些成果,我们承认,DeepSeek 与前沿封闭源模型相比还存在某些局限性……首先,由于训练过程的 FLOP 总数较少,DeepSeek-V3.2 在世界知识的广度方面仍然落后于领先的专有模型。在未来的迭代中,我们计划通过扩大预训练的计算量来解决这一知识差距问题。其次,令牌效率仍然是一个挑战……未来的工作将专注于优化模型推理链的智能密度以提高效率。第三,解决复杂任务的能力仍然不如前沿模型,这激励我们进一步完善我们的基础模型和后训练方法。

InfoQ 报道过 DeepSeek 之前的几个版本,包括最初的 DeepSeek-V3 以及他们的第一个推理模型 DeepSeek-R1。这两个版本都是在 2025 年初发布的。2025 年晚些时候,InfoQ 报道了 DeepSeek-V3.1,这是一个混合推理模型,在单一系统中融合了思考模式与非思考模式。


DeepSeek-V3.2 基准测试性能(图片来源:DeepSeek 技术报告)

DeepSeek-V3.2 使用的架构与 DeepSeek-V3.1 相同,只是使用了新的 DSA 注意力机制。团队从 DeepSeek-V3.1 的一个检查点入手,在继续预训练并生成 DeepSeek-V3.2 之前,将上下文长度扩展到了 128K。新的注意力机制将计算复杂性从 O(L^2) 降低到了 O(Lk),其中 L 是上下文长度,k<

对于后训练,团队使用了专家蒸馏(specialist distillation)技术。他们训练了一组专门针对特定领域的专家模型:编码、数学运算和几个代理任务。然后,这些专家模型生成合成训练数据,用于微调主模型。

在 Hacker News 上关于 DeepSeek-V3.2 的讨论中,部分用户指出了高性能开源模型的优势。一位用户写道:

如果你试图构建基于 AI 的应用程序,你应该比较基于供应商的解决方案和使用自己的硬件托管开源模型之间的成本……然后将其与 GPT-5 的成本进行比较,这比较简单,因为每(百万)令牌的成本可以从网站上获取。运行 DeepSeek(或更成熟的 Qwen3)这类系统能为你节省的云服务开支,绝对超乎想象……DeepSeek 和 Qwen 能在廉价 GPU 上流畅运行,而其他模型会直接卡死。

DeepSeek-V3.2 模型文件可以从 Huggingface 上下载,但高计算资源版本 DeepSeek-V3.2-Speciale 目前仅通过 DeepSeek 的 API 提供。

https://www.infoq.com/news/2026/01/deepseek-v32/

声明:本文为 InfoQ 翻译,未经许可禁止转载。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
很多人低估了一万块的威力

很多人低估了一万块的威力

洞见
2026-01-12 20:34:37
巴萨删坎塞洛加盟公告,记者:新月要的文件未送达,影响不大

巴萨删坎塞洛加盟公告,记者:新月要的文件未送达,影响不大

懂球帝
2026-01-13 21:57:24
军事专家李莉并没有清空作品

军事专家李莉并没有清空作品

难得君
2026-01-13 11:46:20
韩国某中学把“中华人民共和国”当作班级目标引争议

韩国某中学把“中华人民共和国”当作班级目标引争议

随波荡漾的漂流瓶
2026-01-10 17:50:06
中国最牛骗子,劳改犯摇身一变成空降高官,锐意改革政绩突出

中国最牛骗子,劳改犯摇身一变成空降高官,锐意改革政绩突出

史政先锋
2026-01-05 19:53:45
中超再迎1名准世界杯国脚:深圳锁定29岁前欧冠主力外援!

中超再迎1名准世界杯国脚:深圳锁定29岁前欧冠主力外援!

邱泽云
2026-01-14 15:06:10
库里9中2却迎22分大胜!梅尔顿18分钟23分 还骂科尔12人轮换吗?

库里9中2却迎22分大胜!梅尔顿18分钟23分 还骂科尔12人轮换吗?

颜小白的篮球梦
2026-01-14 14:52:10
宋庆龄拒绝与孙中山合葬,坦言:她陪我53年,我答应要和她葬一起

宋庆龄拒绝与孙中山合葬,坦言:她陪我53年,我答应要和她葬一起

史之铭
2026-01-12 16:26:19
“性萧条”才是这个时代真正的危机

“性萧条”才是这个时代真正的危机

深蓝夜读
2025-09-24 16:00:09
官方发文,王俊杰再破天花板,让胡明轩和整个国际男篮“沉默”了

官方发文,王俊杰再破天花板,让胡明轩和整个国际男篮“沉默”了

晓焎科普
2026-01-14 05:14:44
从一线明星,沦落到拍短剧,这5位演员走到今天这步,怪不了别人

从一线明星,沦落到拍短剧,这5位演员走到今天这步,怪不了别人

阿纂看事
2026-01-13 18:05:31
勇士大胜开拓者,杨瀚森23+2梅尔顿替补发威

勇士大胜开拓者,杨瀚森23+2梅尔顿替补发威

萧壛记录风土人情
2026-01-14 14:48:51
贺娇龙:质疑和批评,能让我更清醒,如果都是赞扬声一片,我飘了怎么办?我找不到北了怎么办?

贺娇龙:质疑和批评,能让我更清醒,如果都是赞扬声一片,我飘了怎么办?我找不到北了怎么办?

新京报政事儿
2021-08-05 17:56:25
AI营销概念龙头+AIGC开发者大会将举行,该公司有望爆发!

AI营销概念龙头+AIGC开发者大会将举行,该公司有望爆发!

巨丰财经
2026-01-12 16:32:58
周琦:去年赵睿第一选择不是北京首钢,而是南方某球队

周琦:去年赵睿第一选择不是北京首钢,而是南方某球队

孤影来客
2026-01-14 14:29:53
安徽小伙在小国家创业,“享受”一夫多妻、开放生活的他如今怎样

安徽小伙在小国家创业,“享受”一夫多妻、开放生活的他如今怎样

牛牛叨史
2026-01-06 12:59:43
特朗普通告全球,大战无法避免?中国突然表态,美开始担心两件事

特朗普通告全球,大战无法避免?中国突然表态,美开始担心两件事

壹切的壹切
2026-01-14 14:16:18
218:213!美众议院投票出炉,特朗普松口撤军,美国霸权或将被改写

218:213!美众议院投票出炉,特朗普松口撤军,美国霸权或将被改写

来科点谱
2026-01-12 08:57:32
看了这张和刘亦菲、李沁的合影,李念是不是隐退的太早了?

看了这张和刘亦菲、李沁的合影,李念是不是隐退的太早了?

木子爱娱乐大号
2026-01-14 13:57:20
毛主席外孙女婿陈东升:35岁经商,55岁娶孔东梅,65岁身价550亿

毛主席外孙女婿陈东升:35岁经商,55岁娶孔东梅,65岁身价550亿

雍亲王府
2026-01-13 07:45:03
2026-01-14 16:08:49
InfoQ incentive-icons
InfoQ
有内容的技术社区媒体
11940文章数 51697关注度
往期回顾 全部

科技要闻

美国批准英伟达H200卖给中国,但有条件

头条要闻

电车失控在市区以超100km/h时速连撞15车 阿维塔回应

头条要闻

电车失控在市区以超100km/h时速连撞15车 阿维塔回应

体育要闻

牛津学霸买下儿时主队,让它成为英超黑马

娱乐要闻

何晴去世30天,许亚军终于发声

财经要闻

姚振华举报:观致汽车资产被低价拍卖

汽车要闻

曝Model Y或降到20万以内!

态度原创

艺术
健康
旅游
教育
军事航空

艺术要闻

八大山人『山水花鸟册』

血常规3项异常,是身体警报!

旅游要闻

桂西南大德天旅游联盟发布2026年计划 多举措预热新年旅游市场

教育要闻

小升初压轴题,求圆的面积?

军事要闻

美再发安全警告 敦促美公民立即离开伊朗

无障碍浏览 进入关怀版