网易首页

注册免费邮箱

网易首页 > 网易科技 > 网易科技 > 正文

趁硅谷过节“开大”！DeepSeek上线“奥数金牌”模型！填平谷歌OpenAI护城河

2025-11-28 10:24:11　来源: 网易科技报道

北京举报

0

分享至

作者 | 辰辰

出品 | 网易科技

专挑节假日搞大新闻”的DeepSeek又出手了。

就在大洋彼岸的工程师们准备切火鸡庆祝节日时，DeepSeek保持了极客传统，悄然上线了DeepSeekMath-V2。

开源权重、IMO金牌水平、超越GPT-5。 这套熟悉的“三连击”，再次巩固了DeepSeek作为“开源灯塔”的地位。 在算力受限的背景下，DeepSeek 再次证明了自己：不需要庞大的 GPU 集群，也能用算法奇迹在最硬核的数学赛道上，教闭源巨头们“做人”。

它“不搞虚的”，直接拿数学竞赛界的“终极试金石”，包括2025国际数学奥林匹克（IMO 2025） 和 普特南数学竞赛（Putnam） 的真题开练。在严苛的基准测试中，它交出了一份与 GPT-5和 Gemini 2.5 Pro 平起平坐，甚至更胜一筹的完美答卷。

1. 战绩彪悍：AI “碾压”人类学霸

DeepSeekMath-V2到底有多强？数据不会说谎。

—— IMO 2025金牌得主，比肩谷歌 OpenAI。 在 IMO 2025的基准测试中，DeepSeekMath-V2成功解出6道题中的5道，达到“金牌”水准。这一成绩直接对标谷歌 DeepMind 和 OpenAI 此前引以为傲的闭源模型。 要知道，在此之前，这种级别的推理能力是硅谷巨头们严防死守的商业机密。

—— 普特南竞赛：118分 VS 人类最高分90分。 威廉·罗威尔·普特南数学竞赛（Putnam）可以说是北美本科生的“噩梦”，以难度极高著称，中位数得分甚至接近于0。DeepSeek 团队透露，DeepSeekMath-V2在2024年的普特南考题测试中，12道题做对了11道，最后一道也仅有微小瑕疵，最终得分118分（满分120）。相比之下，人类选手的最高分只有90分左右。这说明 AI 不仅仅是在“背题”，而是具备了超越顶尖人类选手的逻辑解题能力。

此外，DeepSeekMath-V2在代数、几何等5大数学领域全面超越 GPT-5和 Gemini 2.5 Pro。

2. 揭秘：为什么它能这么聪明？

数学推理一直是 AI 的软肋，因为大模型很容易“一本正经地胡说八道”（幻觉问题）。DeepSeek 是如何解决这个问题的？

答案是“元验证”（Meta-Verification）技术。

传统的 AI 训练是“给糖吃”：答案对了就奖励。但在高等数学证明中，答案对不代表过程对。AI 很容易瞎编一个过程然后蒙对答案。

但 DeepSeek 引入了一套“左右互搏”机制：

其中生成器就像一个学生，负责写解题步骤。验证器则是老师，负责检查逻辑漏洞，不仅仅看答案，还要看推导过程是否严谨。

更绝的是，他们还训练了一个“二阶验证器”，用来监督“老师”批改得对不对，防止模型为了拿分而钻空子。 这种递归式的验证结构，逼着模型必须学会真正的逻辑推理，而不是投机取巧。

而在推理阶段，模型不是张口就来。它会针对一个问题生成64个候选证明路径，然后用验证器逐一打分，挑出逻辑最严密的那一个。 这种“三思而后行”的模式，正是通往通用人工智能（AGI）的关键一步。

此外，DeepSeekMath-V2还打造了数字闭环生态，用验证反馈直接优化生成质量，用自主产生的高难度训练样本推动系统迭代。

3. 最大的杀手锏：它是开源的！

这才是让技术界沸腾的真正原因。

以往，无论是 OpenAI 还是谷歌都选择闭源。你想用顶级的数学推理能力？只能付费调用 API，不仅数据要传到云端，使用更受限于人。

但 DeepSeek 直接掀了桌子：模型权重公开下载，Apache 2.0协议。

Hugging Face 的 CEO 克莱门特·德朗格（Clément Delangue）为此激动地发推表示：

“据我所知，没有任何聊天机器人或 API 能给你提供 IMO 金牌级别的模型。但今天变了，你可以在 Hugging Face 上直接下载 DeepSeek Math-V2的权重。”

这意味着，高校研究人员、企业开发者都可以在本地部署这个“数学天才”。所有人都可以体验在本地运行“奥数金牌” AI 的快感，无需担心数据隐私，也不用看硅谷大厂的脸色。 一夜之间，曾经被视为核心竞争力的“推理护城河”，变成了人人可用的基础设施。

一经上线，全球各路技术播客和达人纷纷上手试用。

技术博主、英国程序大佬西蒙·威利森（Simon Willison）快速对 DeepSeek Math-V2的发布做了技术层面解读，强调这是一个开放权重模型。他还特意提到，OpenAI和谷歌的同等模型有将近700G，相比之下DeepSeek Math-V2要小得多。

BinaryVerse 发布的播客也称 DeepSeekMath-V2在某些数学推理基准上超越了已有闭源大模型，但同时也提到，模型“对常识问答或通用场景并非全面领先”。

Hacker News 等社区也纷纷对模型指标和能力发表个人看法。不少人惊讶模型的强大能力，但也有人质疑大量推理算力带来的优异指标是否可迁移到常规使用场景。许多评论强调“惊艳但令人不安”的速度，讨论模型在更广义推理与安全性方面的意义。

4. 逆风翻盘：算力受限下的极致优化

DeepSeek 的这次突围，背景其实略带悲壮。

由于芯片供应问题，DeepSeek 在算力硬件上并不占优，旗舰模型 R2甚至因硬件兼容性问题而被迫推迟。

但在这种极限施压下，DeepSeekMath-V2证明了一件事：算法的创新可以弥补算力的不足。

它没有单纯依赖暴力堆砌英伟达的 GPU 集群，而是通过“冷启动”训练——让 AI 自己生成训练数据，自己训练自己，还用自动化标注系统摆脱了对昂贵人工标注数据的依赖。

5. 结语

DeepSeekMath-V2的发布证实：在通往 AGI 的道路上，开源模型并没有掉队，甚至正在反超。

当硅谷还在试图用“安全”为由将顶级模型锁在黑盒子里时，来自中国企业的 DeepSeek 选择大度把钥匙交给了全世界。

对于所有 AI 从业者来说，这是一个最好的时代。

延伸阅读

本文来源：网易科技报道责任编辑：王凤枝_NT2541

相关推荐

热点推荐

DeepSeek再破谷歌OpenAI垄断：开源IMO数学金牌大模型

量子位 2025-11-28 12:41:40
6 跟贴 6
地图上根本找不到的“硅谷”？原来它只是一个科技巨头聚集区

名人堂典客 2025-11-28 12:46:00
2 跟贴 2

贝索斯神秘AI公司爆出，收购前OpenAI大佬创企，已融资440亿

智东西 2025-11-28 19:01:57
1 跟贴 1

OpenAI预测：ChatGPT订阅用户5年后翻6倍、订阅累积收入达1.91万亿

智东西 2025-11-27 12:11:59
2 跟贴 2
从贝佐斯到马斯克，硅谷科技男都想变帅？各种打针开刀，也颜值焦虑上了

英国那些事儿 2025-10-31 23:31:40
14 跟贴 14

专业运动员和机器人踢球，机器人一个小伎俩，人类瞬间被击败！

欣欣旅行家 2025-11-27 09:20:39
0 跟贴 0

899三年级数学下册第五单元第二节，考90分以上的同学很少，来看

我服子佩 2025-11-28 11:32:57
1 跟贴 1
878二年级妈妈买来36个桃子，每盘装5个，至少需要几个盘子

我服子佩 2025-11-25 12:38:44
1 跟贴 1

谷歌TPU火了，和英伟达GPU谁更胜一筹？

财联社 2025-11-27 15:31:19
0 跟贴 0
国产最强多模态宝座又易主？671B参数练就“火眼金睛”，基于DeepSeek打造

智东西 2025-11-28 18:37:19
0 跟贴 0
初中数学解高次方程，两种方法

天天数理学习分享 2025-11-28 10:47:20
1 跟贴 1
光辉坠毁之后的印度赢学，信息污染有多严重？连Deepseek都中招了

最后的苏霍伊视频 2025-11-28 09:13:52
2 跟贴 2
漫画讲解：矩阵是什么？线性代数是什么？

新发现杂志 2025-11-28 20:47:03
0 跟贴 0
一道印度的小学数学思维题，难住了很多家长

大力小学数学 2025-11-28 16:24:00
1 跟贴 1
898三年级数学下册第五单元，这套试卷难度不小，这一单元不好学

我服子佩 2025-11-28 11:32:31
3 跟贴 3
小升初附加题：a×b×c=5486，求a，b，c各是多少

大力小学数学 2025-11-25 13:49:00
0 跟贴 0
892二年级数学下册第六单元测试卷――分享（保存打印）

我服子佩 2025-11-27 11:42:50
1 跟贴 1
不只是“做题家”！DeepSeek最新模型打破数学推理局限，部分性能超越Gemini DeepThink

钛媒体APP 2025-11-28 13:41:07
0 跟贴 0
俄军透露红军城市区作战细节，乌军战斗骨干躲入地下管道，泽连斯基同日发声

扬子晚报 2025-11-25 12:13:37
1563 跟贴 1563
897一年级孩子们看到一个条件，直呼不会做，小女孩高高：简单

我服子佩 2025-11-27 11:44:14
1 跟贴 1
探访美国阳气中医院，就像走进硅谷的高科技IT公司丨四海中医

凤凰卫视 2025-11-24 21:55:26
0 跟贴 0
人类成工具？TESCREAL洗脑硅谷，美食家也难逃流量裹挟！

鸟儿太能吃 2025-11-27 12:13:24
0 跟贴 0
谷歌TPU，不是为了取代GPU

网易财经 2025-11-26 16:14:27
31 跟贴 31
媒体：琉球主权归属这笔旧账是该算算了

北京日报 2025-11-28 18:23:54
454 跟贴 454
妈妈辅导孩子学写数字，每一笔都写得出乎意料

重庆热点 2025-11-27 14:06:51
0 跟贴 0
官方回应“充电宝3C认证全面失效”：已获3C认证充电宝不受新标准影响

环球网资讯 2025-11-27 17:13:04
1460 跟贴 1460
数学140多分，英语135分，获得雷鸣奖学金

民生大参考 2025-11-25 21:30:58
0 跟贴 0
哈工大高分子专业录取分数

老盖实话升学 2025-11-25 01:10:19
0 跟贴 0
初中数学代数式求值题目，关键在于降次

三乐大掌柜 2025-11-27 10:31:22
6 跟贴 6
初中数学计算题目，题目的本质还是因式分解

三乐大掌柜 2025-11-28 11:05:33
3 跟贴 3
美国凭啥一直领先谷歌前CEO：得靠中国顶尖留学生毕业就发绿卡

网易科技态度见闻 2025-11-26 17:02:27
0 跟贴 0
四年级数学奥数题火车过桥 #小学数学#数学思维#小学奥数#四年级数学#数学思维训练

慢歌轻步谣 2025-11-27 20:23:37
0 跟贴 0
期中成绩出来了，孩子各科90+，换新教材这道“坎”我们平稳迈过！

亲子游戏大全 2025-11-28 20:16:18
0 跟贴 0
OpenAI扩张野心的背后：甲骨文等合作伙伴正背负千亿美元债务

财联社 2025-11-28 16:24:15
1 跟贴 1
中国和日本算数乘法，日本的算法简直太奇葩，哪边更好

咔嚓乐子 2025-11-26 15:15:47
1 跟贴 1
谷歌Gemini 3免费使用的4种方法

倪云华洞察 2025-11-26 20:04:31
5 跟贴 5
韦东奕已获评北大副教授，作为团队核心成员验证王虹对挂谷猜想的证明

超级数学建模 2025-11-28 22:52:32
0 跟贴 0
大利好！六部门发文促消费！形成3个万亿级消费领域！支持A、机器人、养老等赛道

究竟视频 2025-11-27 06:04:30
0 跟贴 0
ISSN是页码？别搞错！1分钟讲清本质

老盖实话升学 2025-11-27 00:58:18
0 跟贴 0
英伟达回应谷歌芯片威胁：仍领先行业一代，继续供货谷歌

界面新闻 2025-11-26 08:31:31
0 跟贴 0

女子约会后满脸爆痘进急诊！医生：你可能对男友过敏了

女子约会后满脸爆痘进急诊！医生：你可能对男友过敏了

最英国

2025-11-27 19:04:00

香港5级火灾酿128死！幸存住户忆逃生：感谢管理员救命之恩

香港5级火灾酿128死！幸存住户忆逃生：感谢管理员救命之恩

环球趣闻分享

2025-11-28 19:45:07

68岁赵本山近况曝光：卖房卖飞机救女，百亿身家换不来女儿好睡眠

68岁赵本山近况曝光：卖房卖飞机救女，百亿身家换不来女儿好睡眠

明月光

2025-11-22 13:57:08

许昕关联公司欠税被通告！但欠税的金额，却让人啼笑皆非

许昕关联公司欠税被通告！但欠税的金额，却让人啼笑皆非

十点街球体育

2025-11-28 15:20:28

中国男篮不敌韩国！听听各界媒体专家怎么说郭士强要负主要责任

中国男篮不敌韩国！听听各界媒体专家怎么说郭士强要负主要责任

体坛热消息

2025-11-28 22:02:08

“越南大嫂”持枪劫狱救夫案检方提起多项重罪指控

“越南大嫂”持枪劫狱救夫案检方提起多项重罪指控

扬子晚报

2025-11-28 17:16:22

高市政府内部失火，外部遇险：中方警告之后，俄方也亮出强硬牌

高市政府内部失火，外部遇险：中方警告之后，俄方也亮出强硬牌

路路观察官方号

2025-11-28 22:58:14

年轻时的高市早苗，在相貌上已经占据了优势，人变相貌也跟着变

年轻时的高市早苗，在相貌上已经占据了优势，人变相貌也跟着变

大江

2025-11-27 11:28:33

全家移民、抛弃妻女，舆论缠身的水均益，从不像表面那么简单

全家移民、抛弃妻女，舆论缠身的水均益，从不像表面那么简单

小熊侃史

2025-11-28 22:25:27

A股买卖都要收5元吗？详解A股“佣金、印花税、过户费”怎么算

A股买卖都要收5元吗？详解A股“佣金、印花税、过户费”怎么算

小白鸽财经

2025-11-28 07:10:02

1毫克足以致命！无药可解！29岁小伙连吃三碗，肝肾衰竭

1毫克足以致命！无药可解！29岁小伙连吃三碗，肝肾衰竭

健身狂人

2025-11-25 10:34:16

不到24小时！央媒3次点名杨紫，事实证明，孙红雷当初确实没说谎

不到24小时！央媒3次点名杨紫，事实证明，孙红雷当初确实没说谎

黄谋仕

2025-11-28 21:59:09

斯洛特透露与高层对话内容，曝利物浦内部关注萨拉赫续约后表现

斯洛特透露与高层对话内容，曝利物浦内部关注萨拉赫续约后表现

体育妞世界

2025-11-28 11:50:17

许尔勒：踢球的各种要求让我觉得不是我的生活，所以选择退役

许尔勒：踢球的各种要求让我觉得不是我的生活，所以选择退役

懂球帝

2025-11-28 11:57:33

《赛德克·巴莱》重映引哗然：别被“抗日”标签骗了！

《赛德克·巴莱》重映引哗然：别被“抗日”标签骗了！

红色少女主播

2025-11-28 23:36:56

L！isa巡演露臀引全网互撕？艺术自由与低俗的边界之战

L！isa巡演露臀引全网互撕？艺术自由与低俗的边界之战

翰林涛涛

2025-11-27 14:58:03

Lisa巡演造型惹争议，身穿超短热裤透视装等，真空上阵大幅度蹦跳

Lisa巡演造型惹争议，身穿超短热裤透视装等，真空上阵大幅度蹦跳

花哥扒娱乐

2025-11-27 19:52:31

解放军14天炮火连射震慑,日本硬闯盯梢,无人机机场栽跟头尴尬

解放军14天炮火连射震慑,日本硬闯盯梢,无人机机场栽跟头尴尬

慢歌轻步谣

2025-11-28 23:10:15

44岁男演员陈宇。突发脑出血在成都出租屋去世

44岁男演员陈宇。突发脑出血在成都出租屋去世

山野卢员外

2025-11-28 23:07:14

马来西亚下血本了！凑了73.6亿，把整个国家的5G都交给了华为中兴

马来西亚下血本了！凑了73.6亿，把整个国家的5G都交给了华为中兴

科普100克克

2025-11-28 15:57:03

网易新闻

iOS

Android

科技要闻

马斯克：给不出2000亿颗芯片？我自己来！

头条要闻

香港消防员：大埔火灾再次刷新了香港近30年前的遭遇

头条要闻

香港消防员：大埔火灾再次刷新了香港近30年前的遭遇

体育要闻

约基奇与卢卡：饮食可以怎样改变你？

娱乐要闻

周依然自曝家中有人脉、压番肖战

财经要闻

许家印前妻，大量资产曝光

汽车要闻

对话胡晓庆：仰望的底气，不止极致技术

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

艺术

家居

手机

教育

公开课

艺术要闻

罕见！深圳第二高楼“京基100”的另一个方案，形如帆船

家居要闻

简洁明亮温馨舒适居所

手机要闻

华为Mate80系列突然售罄：别加价买，原因很真实了！

教育要闻

初中一开学，智商全打折了？

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2025 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版

×