网易首页 > 网易号 > 正文 申请入驻

从1亿+到29.4万!DeepSeek让AI告别烧钱时代

0
分享至

最近AI圈出了个大新闻,中国的DeepSeek把自家R1模型的论文发上了《自然》,这事儿本身就够炸的,更让人惊掉下巴的是,这模型训练推理能力才花了29.4万美元。

我刚看到这数的时候还以为眼花了,反复确认好几遍才敢相信,要知道以前想搞个能上顶刊的AI模型,没个几亿根本拿不下来。



29.4万美元的“炸弹”:戳破AI圈的烧钱迷思

DeepSeek这波操作,直接给整个行业来了个“降维打击”,今年年初R1刚亮相时,大家都觉得这模型性能强、还开源,成本肯定低不了,就是没人知道具体数。

直到最近论文一公开,512块H800芯片,80小时,29.4万美元搞定推理训练,基础模型也才600万美元。



路透社、CNN这些美媒都看懵了,CNBC直接说这钱干了超级大厂才敢碰的活,戳破了“没顶尖GPU玩不了AI”的说法。

本来想觉得就是DeepSeek运气好,后来发现跟同行一对比才知道多厉害,2023年OpenAI的奥尔特曼说他们基础模型训练成本远超1亿美元,这差距可不是一点半点。



以前AI圈总觉得“烧钱越多越牛”,不少团队一门心思凑GPU,好像没堆够数量就没底气。

DeepSeek这事儿算给大家提了个醒,不是钱花得少就做不出好东西,关键是怎么把钱花在刀刃上。搞不清那些还在盲目砸钱的团队,看到这数会不会重新算算账。



从R1-Zero到R1:AI自己“悟”出解题门道

光成本低还不够,能做到性能不打折,背后的技术才是真门道。

R1能有现在的本事,全靠它的前身R1-Zero打基础,这R1-Zero跟别的AI不一样,不用人教套路,就靠纯强化学习自己练,答对加分,答错扣分,连思考步骤都不规定。

在2024年AIME数学测试里,它的准确率从15.6%一路涨到77.9%,开了自洽解码后直接飙到86.7%,比不少人类选手还厉害。



更有意思的是,训练的时候它还会主动延长思考链,有时候输出上万个token,突然冒一句“等一下,我需要验证”。

如此看来,这AI都快有“反思能力”了,而且全程没人指导,这哪是训练模型,简直是看AI“开窍”。

不过R1-Zero也有缺点,语言混用、读着费劲,没法直接用。



无奈之下,团队搞了多轮精炼,先用好数据修语言问题,再强化学习提推理能力,接着扩知识面,最后对齐人类偏好。

很显然,这套流程没走一点弯路,既保住了R1的深度推理能力,还让它能跟人顺畅聊天,数学、编程这些硬活也没落下。



透明化+开源:给AI行业立了新规矩

DeepSeek最让人佩服的,不只是成本和技术,还有它的透明。

之前有美国官员质疑,说用H800这种“阉割版”芯片练不出高性能模型,还造谣他们违规弄了H100。

结果DeepSeek在《自然》的补充文件里直接明说,R1全程用的都是合法买的H800,一点没含糊。



而且他们不光回应质疑,还把训练细节、强化学习策略、数据来源全公开了,谁都能复现。

以前AI圈不少公司都把模型当“黑箱”,藏着掖着怕别人学去,DeepSeek这波操作,相当于把“家底”亮出来,反而让大家更信任。



更关键的是,R1还开源到了HuggingFace,下载量破了1090万次,成了首个经同行评审的主流大语言模型。

《自然》都夸这事儿有价值,让大模型从公司私藏变成了能科学验证的系统,毫无疑问,这给行业指了条新路子:AI竞争不是比谁GPU多、烧钱狠,而是比谁策略巧、够透明。



现在再看AI圈,DeepSeek这一课算是教透了,以前大家总觉得搞AI得靠“钞能力”,中小团队根本没机会。

现在好了,有了低成本、可复现的路子,更多人能扎进来做研究。如此看来,AI不再是少数大厂的“烧钱游戏”,这才是行业该有的样子。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
好落魄!49岁赵薇广东吃饭,被扒住潮州老旧小区,人生再无回头路

好落魄!49岁赵薇广东吃饭,被扒住潮州老旧小区,人生再无回头路

呆冰和章鱼
2025-12-12 15:13:02
牢A还是太保守了,女留子英国学粤语,知情人:她都拍视频了

牢A还是太保守了,女留子英国学粤语,知情人:她都拍视频了

泽泽先生
2026-01-27 21:24:40
没滤镜真可怕!秦海璐满脸沟壑,梅婷黑胖土,章子怡肿成大饼脸

没滤镜真可怕!秦海璐满脸沟壑,梅婷黑胖土,章子怡肿成大饼脸

林轻吟
2026-01-28 09:06:51
李蓓:上月已清仓黄金,未来10至20年不值得投资,持有黄金可能错失其他重大机遇

李蓓:上月已清仓黄金,未来10至20年不值得投资,持有黄金可能错失其他重大机遇

界面新闻
2026-01-27 16:46:11
小鼠研究表明,挖鼻孔与阿尔茨海默病之间存在令人惊讶的联系

小鼠研究表明,挖鼻孔与阿尔茨海默病之间存在令人惊讶的联系

心中的麦田
2026-01-21 20:18:15
阿根廷一男子冲撞总统座车

阿根廷一男子冲撞总统座车

新华社
2026-01-28 11:57:04
知名制片人姜莹莹被腾讯解聘,移送公安局,给出的原因太恶劣!

知名制片人姜莹莹被腾讯解聘,移送公安局,给出的原因太恶劣!

一盅情怀
2026-01-25 15:54:20
北约秘书长谄媚称“欧洲永远离不开美国”

北约秘书长谄媚称“欧洲永远离不开美国”

扬子晚报
2026-01-27 11:06:09
春节前理发有讲究!这两天千万别剪,你知道是哪两天吗?

春节前理发有讲究!这两天千万别剪,你知道是哪两天吗?

丁丁鲤史纪
2026-01-27 09:38:45
传闻:霍老爷子生前将南沙财富独留长孙霍启刚,二房三房束手无策

传闻:霍老爷子生前将南沙财富独留长孙霍启刚,二房三房束手无策

卡西莫多的故事
2026-01-26 10:32:26
牢A被女记者“追击”!

牢A被女记者“追击”!

新动察
2026-01-27 14:05:11
香港多家金店涌现卖金长龙

香港多家金店涌现卖金长龙

中国日报网
2026-01-27 20:23:04
大S雕像正式完工,裹着黑帆布等忌日揭晓,现场曝光与高以翔为邻

大S雕像正式完工,裹着黑帆布等忌日揭晓,现场曝光与高以翔为邻

开开森森
2026-01-28 10:55:21
媒体爆料:未来24小时内美国可能对伊朗发动袭击

媒体爆料:未来24小时内美国可能对伊朗发动袭击

老马拉车莫少装
2026-01-26 22:24:25
张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

山东教育
2026-01-27 11:38:18
今天,A股放量并未大涨,迹象很明显,做好准备了,A股可能这样走

今天,A股放量并未大涨,迹象很明显,做好准备了,A股可能这样走

史行途
2026-01-28 11:18:19
爆:原中国移动集团董事长奚国华!

爆:原中国移动集团董事长奚国华!

通信头条
2026-01-26 22:07:15
一个要求,震动东京:中国要求日本尽快归还,清算终于开始了

一个要求,震动东京:中国要求日本尽快归还,清算终于开始了

铁锤简科
2026-01-27 20:42:44
黄仁勋厉害,到深圳就满街跑,结果在八合里吃牛肉火锅时被围堵了

黄仁勋厉害,到深圳就满街跑,结果在八合里吃牛肉火锅时被围堵了

小娱乐悠悠
2026-01-28 11:08:25
北大教授人口学家声称中国大学连印度孟加拉都不如!因为不用英语

北大教授人口学家声称中国大学连印度孟加拉都不如!因为不用英语

火山诗话
2026-01-27 14:40:23
2026-01-28 13:24:49
阿柒的讯
阿柒的讯
爱生活|爱运动|爱体育|感谢关注
10489文章数 464关注度
往期回顾 全部

科技要闻

它是神也是毒!Clawdbot改名卷入千万诈骗

头条要闻

德媒封面:5位欧洲领导人手持武器 配文"唐纳德够了"

头条要闻

德媒封面:5位欧洲领导人手持武器 配文"唐纳德够了"

体育要闻

冒充职业球员,比赛规则还和对手现学?

娱乐要闻

王祖贤入驻某音:一条7秒视频吸粉55万

财经要闻

40倍杠杆断裂!水贝一黄金平台兑付困难

汽车要闻

中国豪华车老大之争:奥迪凭啥干掉奔驰宝马?

态度原创

手机
艺术
数码
公开课
军事航空

手机要闻

小米17 Max配徕卡2亿镜头 无背屏Q2季度发布

艺术要闻

震撼!19世纪油画巨匠的作品美得不可思议!

数码要闻

AMD Ryzen AI软件更新1.7版本:支持新模型,优化多项参数表现

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗竖起巨幅宣传画:一艘美军航母被炸

无障碍浏览 进入关怀版