网易首页 > 网易号 > 正文 申请入驻

"不靠标注数据!DeepSeek-R1 让 AI 像人一样 “顿悟” 解题"

0
分享至


最近AI圈炸了个小惊雷,杭州有家叫DeepSeek的公司,把研究直接发上了《自然》,就是那个全球顶流的科学期刊。

他们搞出的DeepSeek-R1模型,居然能让AI像咱们人一样琢磨逻辑、解难题,更狠的是,训练这模型花的钱,比同级别模型少了快九成,直接跟OpenAI的旗舰模型叫板。

以前看AI圈总觉得是巨头们的游戏,这次中国公司能搞出这动静,确实有点出乎我意料,以前AI想练出推理能力,那路子特别绕。

得靠人一条一条标数据,告诉AI“这题该这么解”“那步是对的”,也就是行业里说的监督式微调。



就像教小孩做题,每道题都得先给答案,不仅费时间,烧的钱还吓人。

我之前看过报道,OpenAI搞GPT-4的时候,光标注数据就花了几千万美元,单条复杂逻辑题的标注费都能到8美元。

更麻烦的是,人能想到的题有限,没标过的跨学科题目,AI正确率直接掉一大截。

去年有个医疗AI模型,就因为没标过罕见病的诊断逻辑,临床测试时误诊了三次,这要是真用到实际诊疗里,后果不堪设想。



本来想,AI推理是不是就得一直靠人喂数据?但DeepSeek这次还真走出了另一条路。
不靠人喂答案,AI自己“悟”出解题招

DeepSeek没像以前那样直接给AI答案,而是搞了个奖励机制,有点像咱们玩游戏,答对了给加分,答错了就扣分。

他们先做了个叫DeepSeek-R1-Zero的模型,训练时一点人工标注的数据都不用,就让模型自己在题海里试错。

练了几千轮之后,神奇的事儿发生了:这模型居然自己琢磨出了“思考链”,解题时会一步一步写思路,还会停下来检查“刚才那步是不是错了”,甚至有那种“哦!原来该这么走”的顿悟时刻。



我觉得这事儿特有意思,就像以前老师教题总直接给解法,现在改成只告诉“要算出这个结果”,学生自己摸索解题步骤,反而能练出真本事。

后来DeepSeek又加了点高质量数据微调,最后成了DeepSeek-R1,不仅推理能力没掉,输出的结果还更符合咱们人的需求。
这模型一出来,行业里不少人都惊着了,它在好几个权威测试里,跟OpenAI的o1打得有来有回。

比如美国数学邀请赛AIME,一次性做对的概率快到80%,跟o1就差一点点,解高等数学题的MATH-500数据集,正确率更是飙到快98%,比之前谷歌保持的纪录还高。



能跟o1站在一个水平线上,已经很能说明问题了,毕竟o1之前在AI推理圈基本是“标杆”一样的存在。

而且DeepSeek是咱们中国公司,能在这个领域追上甚至部分超过国外巨头,这波确实给国内AI长了脸。
成本砍半还开源,中小公司终于能玩AI了
比性能更让人惊喜的是成本,这模型烧的钱,比同级别闭源模型少了90%到95%。

我查了下行业分析,以前搞个同级别的推理模型,得花两千多万美元,DeepSeek-R1居然只要一百多万。



省钱的门道也简单:不用花大价钱标注数据,需要的计算资源也少,以前要1024张高端GPU,现在256张就够了。

这意味着啥,以前只有谷歌、OpenAI这种巨头能玩得起的AI推理技术,现在中小企业也能碰了。

有个初创公司的朋友跟我说,他们之前想搞个工程计算的AI模型,一算研发成本得几千万,直接打了退堂鼓,现在用DeepSeek的技术,几百万就能启动,这差距可不是一星半点。
更敞亮的是,DeepSeek还把模型开源了。



去年8月代码放GitHub上,一周就有两万多个星标,一千多个开发者帮忙改代码,连谷歌、Meta的前员工都参与进来了。

现在已经有三十多个垂直领域的模型,是基于它改出来的,覆盖了金融风控、工程计算这些领域。

搞不清以前那些AI公司为啥总把技术攥得那么紧,闭源就算了,API调用费还死贵,中小企业用一年得花十几万。

DeepSeek这波开源,相当于把技术门槛给拆了,大家一起琢磨怎么把AI推理做得更好,这才是让技术普及的正经路子嘛。



比如之前有个基于类似技术的模型,解读法律条文时出了错,把“防卫过当”判成了“正当防卫”,就是因为奖励机制没考虑到伦理边界。

而且现在这模型在常识推理上还差点意思,正确率也就六成多,跟咱们人的常识判断比,还有不小的差距。

如此看来,AI自主学习确实是个好方向,但安全关必须把好,不然在医疗、法律这些严肃领域用,很容易出问题。

不过DeepSeek说今年要搞DeepSeek-R2,目标是把常识推理正确率提上去,还加安全校验模块,我还挺期待的。




总的来说,DeepSeek这波操作,不只是一个公司的技术突破,更给AI推理指了个新方向,从“靠人喂数据”到“自己学本事”。

它不仅让AI推理的成本降了下来,还通过开源让更多人能参与进来,推动整个行业往“民主化”走。

毫无疑问,未来要是能解决安全和常识的问题,这种能自主思考的AI,说不定真能帮咱们解决气候模拟、疾病诊断这些复杂事儿。

而这场由中国公司引领的AI“思想解放”,也肯定会让全球AI行业的格局,变得更不一样。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
意足协主席:无缘世界杯不仅是足协的责任,政治界同样有责任

意足协主席:无缘世界杯不仅是足协的责任,政治界同样有责任

懂球帝
2026-04-01 07:37:16
19岁女生被困柬埔寨,绑匪正脸照曝光,网友放话:你的下场会很惨

19岁女生被困柬埔寨,绑匪正脸照曝光,网友放话:你的下场会很惨

央小北
2026-04-01 02:35:51
47岁张彤现状:住上海豪宅,注重健身,自称不结婚不生娃生活很爽

47岁张彤现状:住上海豪宅,注重健身,自称不结婚不生娃生活很爽

凡知
2026-04-01 07:25:19
阿根廷5-0,可怕的不是大胜,而是梅西的无私!卫冕世界杯真有戏

阿根廷5-0,可怕的不是大胜,而是梅西的无私!卫冕世界杯真有戏

球场没跑道
2026-04-01 10:06:19
深夜连环暴击!美军定点清剿阿巴斯港,弱军硬扛终是螳臂当车

深夜连环暴击!美军定点清剿阿巴斯港,弱军硬扛终是螳臂当车

老马拉车莫少装
2026-04-01 08:13:45
泪流满面!昆山一个只有31人小厂,老板宣布:全员放3天带薪春假

泪流满面!昆山一个只有31人小厂,老板宣布:全员放3天带薪春假

火山詩话
2026-04-01 08:48:24
恭喜!湖人提前锁定季后赛成西部第3队 勇夺太平洋赛区冠军

恭喜!湖人提前锁定季后赛成西部第3队 勇夺太平洋赛区冠军

醉卧浮生
2026-04-01 09:49:59
青海通报“纯牛奶出现透明液体”:成立调查组进驻生产企业开展全面调查

青海通报“纯牛奶出现透明液体”:成立调查组进驻生产企业开展全面调查

大风新闻
2026-03-31 22:08:03
“支持伊朗就去伊朗”成了无耻者的座右铭

“支持伊朗就去伊朗”成了无耻者的座右铭

阿尔法34号
2026-04-01 07:02:23
种种迹象表明,伊朗战争要结束了

种种迹象表明,伊朗战争要结束了

凤眼论
2026-04-01 09:44:42
主场0-1负日本!英格兰球迷炸锅:历史级耻辱 数万人狂嘘

主场0-1负日本!英格兰球迷炸锅:历史级耻辱 数万人狂嘘

叶青足球世界
2026-04-01 08:42:28
最佳睡眠时长更新了,不是8小时!上海交大:睡眠达到这一“黄金时长”,最利于代谢,帮助预防糖尿病

最佳睡眠时长更新了,不是8小时!上海交大:睡眠达到这一“黄金时长”,最利于代谢,帮助预防糖尿病

华医网
2026-03-31 05:40:56
投资人开抢张雪!浙江国资投了,重庆国资出手为张雪机车提供200亩生产基地

投资人开抢张雪!浙江国资投了,重庆国资出手为张雪机车提供200亩生产基地

和讯网
2026-03-31 19:20:26
虎跳峡遇难独生子后续!遗体肉眼可见,还没捞上来,不是不想捞

虎跳峡遇难独生子后续!遗体肉眼可见,还没捞上来,不是不想捞

阿纂看事
2026-03-31 17:32:23
真敢说!39岁张雪:创业13年重庆从没有支持过我 一个子儿都没有

真敢说!39岁张雪:创业13年重庆从没有支持过我 一个子儿都没有

念洲
2026-04-01 09:39:30
中巴呼吁立即停火止战

中巴呼吁立即停火止战

环球时报国际
2026-04-01 11:55:26
伊朗:美以妄想控制霍尔木兹海峡 这一愿望将永远无法实现

伊朗:美以妄想控制霍尔木兹海峡 这一愿望将永远无法实现

闪电新闻
2026-03-31 16:01:20
队史第一人!梅西连续21年为阿根廷破门,戏耍8人防线,连刷5纪录

队史第一人!梅西连续21年为阿根廷破门,戏耍8人防线,连刷5纪录

奥拜尔
2026-04-01 08:29:38
湖人127-113战胜骑士 球员评价:4人优秀,3人及格,2人低迷

湖人127-113战胜骑士 球员评价:4人优秀,3人及格,2人低迷

篮球资讯达人
2026-04-01 12:59:02
美媒痛批特朗普:你最愚蠢错误,就是将中国定义为“同等级”对手

美媒痛批特朗普:你最愚蠢错误,就是将中国定义为“同等级”对手

梁讯
2026-03-31 18:15:59
2026-04-01 13:20:49
阿器谈史 incentive-icons
阿器谈史
以史为鉴,古为今用;不忘初心,砥砺奋进。
9184文章数 1404关注度
往期回顾 全部

科技要闻

营收翻倍、巨亏31亿!中国大模型太烧钱了

头条要闻

英法意葡等10国发表联合声明 中方:以色列应立即撤军

头条要闻

英法意葡等10国发表联合声明 中方:以色列应立即撤军

体育要闻

NBA扩军,和篮球无关?

娱乐要闻

宋宁峰人设崩塌!带娃偷情+反向索赔

财经要闻

电商售械三水光针 机构倒货or假货猖獗?

汽车要闻

2026年3月小米汽车交付超2万台 新SU7上市即交付

态度原创

手机
房产
家居
游戏
公开课

手机要闻

大上科技墨水屏手机投屏器Link第二代发布,支持60Hz高刷

房产要闻

海口二手房,疯狂成交!贝壳最新数据曝光!

家居要闻

经典配色 昼色银河

日本PS5遭疯抢断货!涨价前的最后疯狂?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版