"不靠标注数据！DeepSeek-R1 让 AI 像人一样 “顿悟” 解题"|推理|正确率|deepseek

"不靠标注数据！DeepSeek-R1 让 AI 像人一样 “顿悟” 解题"

2025-10-08 19:19:28　来源: 阿器谈史

河南举报

分享至

最近AI圈炸了个小惊雷，杭州有家叫DeepSeek的公司，把研究直接发上了《自然》，就是那个全球顶流的科学期刊。

他们搞出的DeepSeek-R1模型，居然能让AI像咱们人一样琢磨逻辑、解难题，更狠的是，训练这模型花的钱，比同级别模型少了快九成，直接跟OpenAI的旗舰模型叫板。

以前看AI圈总觉得是巨头们的游戏，这次中国公司能搞出这动静，确实有点出乎我意料，以前AI想练出推理能力，那路子特别绕。

得靠人一条一条标数据，告诉AI“这题该这么解”“那步是对的”，也就是行业里说的监督式微调。

就像教小孩做题，每道题都得先给答案，不仅费时间，烧的钱还吓人。

我之前看过报道，OpenAI搞GPT-4的时候，光标注数据就花了几千万美元，单条复杂逻辑题的标注费都能到8美元。

更麻烦的是，人能想到的题有限，没标过的跨学科题目，AI正确率直接掉一大截。

去年有个医疗AI模型，就因为没标过罕见病的诊断逻辑，临床测试时误诊了三次，这要是真用到实际诊疗里，后果不堪设想。

本来想，AI推理是不是就得一直靠人喂数据？但DeepSeek这次还真走出了另一条路。
不靠人喂答案，AI自己“悟”出解题招
DeepSeek没像以前那样直接给AI答案，而是搞了个奖励机制，有点像咱们玩游戏，答对了给加分，答错了就扣分。

他们先做了个叫DeepSeek-R1-Zero的模型，训练时一点人工标注的数据都不用，就让模型自己在题海里试错。

练了几千轮之后，神奇的事儿发生了：这模型居然自己琢磨出了“思考链”，解题时会一步一步写思路，还会停下来检查“刚才那步是不是错了”，甚至有那种“哦！原来该这么走”的顿悟时刻。

我觉得这事儿特有意思，就像以前老师教题总直接给解法，现在改成只告诉“要算出这个结果”，学生自己摸索解题步骤，反而能练出真本事。

后来DeepSeek又加了点高质量数据微调，最后成了DeepSeek-R1，不仅推理能力没掉，输出的结果还更符合咱们人的需求。
这模型一出来，行业里不少人都惊着了，它在好几个权威测试里，跟OpenAI的o1打得有来有回。

比如美国数学邀请赛AIME，一次性做对的概率快到80%，跟o1就差一点点，解高等数学题的MATH-500数据集，正确率更是飙到快98%，比之前谷歌保持的纪录还高。

能跟o1站在一个水平线上，已经很能说明问题了，毕竟o1之前在AI推理圈基本是“标杆”一样的存在。

而且DeepSeek是咱们中国公司，能在这个领域追上甚至部分超过国外巨头，这波确实给国内AI长了脸。
成本砍半还开源，中小公司终于能玩AI了
比性能更让人惊喜的是成本，这模型烧的钱，比同级别闭源模型少了90%到95%。

我查了下行业分析，以前搞个同级别的推理模型，得花两千多万美元，DeepSeek-R1居然只要一百多万。

省钱的门道也简单：不用花大价钱标注数据，需要的计算资源也少，以前要1024张高端GPU，现在256张就够了。

这意味着啥，以前只有谷歌、OpenAI这种巨头能玩得起的AI推理技术，现在中小企业也能碰了。

有个初创公司的朋友跟我说，他们之前想搞个工程计算的AI模型，一算研发成本得几千万，直接打了退堂鼓，现在用DeepSeek的技术，几百万就能启动，这差距可不是一星半点。
更敞亮的是，DeepSeek还把模型开源了。

去年8月代码放GitHub上，一周就有两万多个星标，一千多个开发者帮忙改代码，连谷歌、Meta的前员工都参与进来了。

现在已经有三十多个垂直领域的模型，是基于它改出来的，覆盖了金融风控、工程计算这些领域。

搞不清以前那些AI公司为啥总把技术攥得那么紧，闭源就算了，API调用费还死贵，中小企业用一年得花十几万。

DeepSeek这波开源，相当于把技术门槛给拆了，大家一起琢磨怎么把AI推理做得更好，这才是让技术普及的正经路子嘛。

比如之前有个基于类似技术的模型，解读法律条文时出了错，把“防卫过当”判成了“正当防卫”，就是因为奖励机制没考虑到伦理边界。

而且现在这模型在常识推理上还差点意思，正确率也就六成多，跟咱们人的常识判断比，还有不小的差距。

如此看来，AI自主学习确实是个好方向，但安全关必须把好，不然在医疗、法律这些严肃领域用，很容易出问题。

不过DeepSeek说今年要搞DeepSeek-R2，目标是把常识推理正确率提上去，还加安全校验模块，我还挺期待的。

总的来说，DeepSeek这波操作，不只是一个公司的技术突破，更给AI推理指了个新方向，从“靠人喂数据”到“自己学本事”。

它不仅让AI推理的成本降了下来，还通过开源让更多人能参与进来，推动整个行业往“民主化”走。

毫无疑问，未来要是能解决安全和常识的问题，这种能自主思考的AI，说不定真能帮咱们解决气候模拟、疾病诊断这些复杂事儿。

而这场由中国公司引领的AI“思想解放”，也肯定会让全球AI行业的格局，变得更不一样。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

"不靠标注数据！DeepSeek-R1 让 AI 像人一样 “顿悟” 解题"

OPPO Reno15系列深评：实况封神+颜值暴击

燃气公司未告知让用户承担燃气表电池费 遭业主起诉

燃气公司未告知让用户承担燃气表电池费 遭业主起诉

结束最后一次对决，陈梦和朱雨玲笑着相拥

宋佳夺影后动了谁的奶酪

青云租陷兑付危机 集资与放贷的双面生意

更加豪华 更加全地形 极石ADAMAS

态度原创

优雅浪漫的绘画，美到让人想直接住进去！

开屏叭啦吧 ｜一年级的小朋友们，最喜欢哪门学科？

确山北泉古寺披金甲

深海迷航＋无人深空？开放世界多人捡垃圾《永恒天空》免费大更

燃气公司未告知让用户承担燃气表电池费遭业主起诉

燃气公司未告知让用户承担燃气表电池费遭业主起诉

青云租陷兑付危机集资与放贷的双面生意

更加豪华更加全地形极石ADAMAS

开屏叭啦吧｜一年级的小朋友们，最喜欢哪门学科？