网易首页 > 网易科技 > IT业界 > 正文

别被误导 | 李飞飞团队用不到50美元训练出媲美DeepSeek R1的AI推理模型??

0
分享至

作者:张发恩 创新奇智CTO

转载自公众号:后向传播

最近一篇新闻标题《李飞飞团队用不到50美元训练出媲美DeepSeek R1的AI推理模型》吸引了不少眼球,似乎预示着AI技术即将迎来一场“廉价革命”。 不少人可能会惊呼:“什么?不到50美元就能训练出媲美DeepSeek Rl的AI模型?这AI也太便宜了吧!”

但,事实真的如此吗? 作为一名AI从业者,看到这个标题,我感觉事情并不简单。仔细研读新闻和相关论文后,我发现这篇新闻的解读存在不少夸大和误导之处。 我详细读了原论文,尽可能还原事实,避免大家被不实信息所误导。

“标题党”嫌疑:事实可能并非如此“美好”

1. “媲美DeepSeek R1”?实际效果可能与你的期待有差距

DeepSeek R1是DeepSeek公司推出的 闭源 大模型,而新闻中提到的 s1模型 , 实际上是与 OpenAI的o1-preview模型 以及 DeepSeek-R1 800K数据蒸馏出的32B模型 做对比。注:DeepSeek R1是670B的大模型,与DeepSeek-R1 800K数据蒸馏出的32B模型是完全不同的两个模型。

论文中的实验结果表明,s1模型在 部分 推理任务上(例如AIME24竞赛数学题)超过了o1-preview , 但这并不代表s1模型就 全面媲美 甚至 超越 了DeepSeek R1。更重要的是, s1的效果离DeepSeek-R1 800K数据蒸馏出的32B模型 还有不小的差距 。新闻标题用 “媲美DeepSeek Rl” 这样的字眼, 容易给读者造成 s1模型已经可以和DeepSeek的顶尖模型相提并论 的 错误印象 。下图是s1论文披露的实验数据(https://arxiv.org/pdf/2501.19393)

2. “不到50美元”?请注意限定语和实际成本

新闻中 “用不到50美元的云计算费用” 的说法, 容易让人误以为训练一个高性能AI推理模型只需要区区几十美元 。但实际上,这50美元仅仅是 指论文中s1模型在16张H100 GPU上训练26分钟的云计算费用 。

这 “不到50美元” 的成本, 仅仅是模型微调阶段的计算成本 ,并不包括 :

  • 前期数据收集和清洗成本
    为了构建高质量的1K训练数据集s1K,研究团队需要从59K原始数据集中进行筛选和标注,这其中投入的人力成本和时间成本远不止50美元 。
  • 预训练模型的成本
    s1模型是基于 Qwen2.5-32B-Instruct 这个 已经预训练好的大模型 进行微调的。 预训练大模型的成本是极其高昂的 ,动辄数百万美元甚至更高。新闻有意忽略了预训练阶段的巨大投入,只强调微调的低成本,有“避重就轻”之嫌 。

3. “训练出媲美...的AI推理模型”?数据筛选的功劳不可忽视

新闻标题容易让人觉得, 是李飞飞团队提出了一种 革命性的模型训练方法 ,才能用 “不到50美元” 训练出高性能模型。 但深入分析论文后, 我们发现 数据筛选 在 s1模型的成功中扮演了至关重要的角色。

s1模型的核心创新之一, 在于其构建的 高质量小样本数据集 s1K 。 研究团队并非随机使用1K数据进行训练, 而是从59K 数据集中 精心筛选 出1K 高质量样本。 筛选过程主要包括:

  • 质量筛选
    去除低质量、存在格式错误或 API 错误的数据。
  • 难度筛选
    去除 Qwen2.5-7B-Instruct 或 Qwen2.5-32B-Instruct 等模型能够轻松解答的简单问题。
  • 多样性筛选
    根据 MSC 分类系统对问题进行领域分类, 确保数据集涵盖不同领域的知识。

实验结果表明,使用精心筛选的1K 数据训练的模型,性能甚至可以媲美使用全量59K 数据训练的模型 ,远超 随机选择数据或仅考虑数据长度、多样性的方法。这说明,在数据驱动的AI领域,数据质量往往比数据数量更重要 。 s1模型的成功, 很大程度上归功于其高质量的数据筛选策略,而非仅仅是 “低成本” 训练 。

论文的创新之处:小样本高效微调 + 推理预算强制

当然, 这篇论文并非一无是处。 s1论文在以下方面还是有其创新性和贡献的 :

1. 验证了小样本高效微调的可行性

s1论文再次印证了 高质量小样本数据在模型微调中的巨大潜力 。 在算力成本高昂、 数据获取困难的背景下, 如何利用少量数据训练出高性能模型 一直是 AI 领域的研究热点。 s1论文提供了一个 利用数据筛选策略实现小样本高效微调 的成功案例, 为后续研究提供了有益的参考。 尤其值得肯定的是, 论文开源了高质量的 s1K 数据集 , 这将有助于推动小样本学习和推理相关领域的研究进展。

2. 提出 “推理预算强制” 方法, 探索推理过程干预

s1论文提出的 “推理预算强制 (Budget Forcing)” 方法,也为 模型推理过程的干预和调控 提供了一种新的思路。 通过 强制结束或延长模型的思考时间 , s1模型能够在推理过程中进行自我调整和优化 ,从而在一定程度上提升推理性能。 这种 在推理阶段对模型行为进行干预 的思想,具有一定的启发意义 ,未来或可应用于更多推理优化方法的研究中。

理性看待技术进步,“标题党”新闻对行业有害

总的来说,“李飞飞团队50美元AI模型” 这篇新闻标题存在夸大和误导之处 , 容易让读者对 AI 技术的现状产生不切实际的幻想。 s1模型 的成功, 是数据质量、 巧妙技术和现有预训练模型共同作用的结果, 并非 “廉价” 和 “速成” 的代名词 。

我们肯定 s1论文在小样本学习和推理干预方面 的探索和贡献 ,赞赏研究团队开源高质量数据集的举动 。但同时,我们必须保持清醒的认识 :

  • AI 技术的发展仍然面临诸多挑战
     “廉价” 和 “通用” 的 AI 模型离我们还很遥远 。
  • 数据质量是 AI 模型性能的关键
     “炼丹” 并非易事,需要精细的调参和优化 。
  • “标题党” 式新闻 为了博取眼球, 不惜夸大事实甚至歪曲真相
     容易误导公众,甚至对行业发展产生负面影响 。

作为AI从业者和爱好者,我们应该保持理性思考,客观看待技术进步,警惕 “标题党” 式新闻的危害,共同营造一个健康、理性的 AI 发展环境 。 脚踏实地,一步一个脚印,才是 AI 技术走向成熟的正确道路 。

延伸阅读
相关推荐
热点推荐
狂甩百亿、品牌接连跑路!昔日“中国奢侈品之王”,撑不住了?

狂甩百亿、品牌接连跑路!昔日“中国奢侈品之王”,撑不住了?

青眼财经
2025-12-02 21:56:03
突传死讯!香港知名富商离世终年96岁,二儿子在睡梦中不幸猝死

突传死讯!香港知名富商离世终年96岁,二儿子在睡梦中不幸猝死

可乐谈情感
2025-12-03 01:12:56
监管部门已指导小红书、B站等平台自查清理涉唱衰楼市等违规信息

监管部门已指导小红书、B站等平台自查清理涉唱衰楼市等违规信息

新京报
2025-12-02 22:31:12
一句话实现全网比价、点外卖、订车票,“豆包手机”遭抢购,现货被炒至7999元,溢价两倍多

一句话实现全网比价、点外卖、订车票,“豆包手机”遭抢购,现货被炒至7999元,溢价两倍多

蓝鲸新闻
2025-12-02 15:46:09
中驻日大使正告高市早苗,中方要求再次升级,撤回言论已经不够了

中驻日大使正告高市早苗,中方要求再次升级,撤回言论已经不够了

策略述
2025-12-02 16:36:24
彻底不装了:美国停止向乌克兰提供武器,并切断与德国联系

彻底不装了:美国停止向乌克兰提供武器,并切断与德国联系

史政先锋
2025-12-02 22:35:57
日本队帮大忙,中国男篮脸面还在,晋级世界杯大反转,可以庆祝了

日本队帮大忙,中国男篮脸面还在,晋级世界杯大反转,可以庆祝了

宗介说体育
2025-12-02 16:21:37
“跳梁小丑”降央卓玛跌落神坛,不会被世界宽容,名誉彻底崩塌​

“跳梁小丑”降央卓玛跌落神坛,不会被世界宽容,名誉彻底崩塌​

老谢谈史
2025-12-02 20:02:30
47岁吴建豪减重40斤,尖嘴猴腮像换了个人,比实际年龄老20岁

47岁吴建豪减重40斤,尖嘴猴腮像换了个人,比实际年龄老20岁

乐悠悠娱乐
2025-12-02 10:40:58
炸裂!陈若琳被曝和杨旭文已订婚!多个同框照被扒,杨旭文秒回应

炸裂!陈若琳被曝和杨旭文已订婚!多个同框照被扒,杨旭文秒回应

阿纂看事
2025-12-02 23:06:45
全球媒体聚焦 | 外媒:关税政策导致美制造业活动连续九个月萎缩

全球媒体聚焦 | 外媒:关税政策导致美制造业活动连续九个月萎缩

国际在线
2025-12-02 20:56:05
胡春华发表署名文章

胡春华发表署名文章

社评
2025-10-31 10:11:37
54岁瓜帅看呆了:曼城5-1后崩盘连丢3球!读秒门线惊魂+险被绝平

54岁瓜帅看呆了:曼城5-1后崩盘连丢3球!读秒门线惊魂+险被绝平

我爱英超
2025-12-03 06:10:56
央视女外卖员短片被骂,骆驼祥子拉黄包车,不是为了欣赏沿途风景

央视女外卖员短片被骂,骆驼祥子拉黄包车,不是为了欣赏沿途风景

壹月情感
2025-12-02 16:42:19
111场轰100球!就在凌晨,哈兰德创造英超33年历史纪录,曼城5-4

111场轰100球!就在凌晨,哈兰德创造英超33年历史纪录,曼城5-4

侃球熊弟
2025-12-03 04:47:30
持续近5小时,普京与美特使会谈结束!泽连斯基称俄乌和平协议无简单解决方案!普京发声:俄罗斯无法接受……

持续近5小时,普京与美特使会谈结束!泽连斯基称俄乌和平协议无简单解决方案!普京发声:俄罗斯无法接受……

每日经济新闻
2025-12-03 06:55:09
明年起避孕套要征税了!国家"催生"又一猛招,网友:早就没欲望了

明年起避孕套要征税了!国家"催生"又一猛招,网友:早就没欲望了

派大星纪录片
2025-12-02 13:40:17
火箭一签一裁!雄鹿旧将加盟休城 28岁哈里斯将被放弃腾出名额

火箭一签一裁!雄鹿旧将加盟休城 28岁哈里斯将被放弃腾出名额

罗说NBA
2025-12-03 06:25:55
有关台湾沦为战场问题

有关台湾沦为战场问题

新民周刊
2025-12-03 09:09:03
网传云南宣威对全市儿童妈妈实施“月经管理”,尴尬了谁?

网传云南宣威对全市儿童妈妈实施“月经管理”,尴尬了谁?

兵叔评说
2025-12-02 17:55:34
2025-12-03 10:27:03

科技要闻

砍项目、停广告、全员加班!

头条要闻

取170万遭抢劫当事人:歹徒都没给我机会 照头就一枪

头条要闻

取170万遭抢劫当事人:歹徒都没给我机会 照头就一枪

体育要闻

从夏天到冬天,中国男篮的手感也凉了?

娱乐要闻

郑恺晒与陈赫等10人合影被扒

财经要闻

“羊毛党”手法翻新 运费险又被盯上了

汽车要闻

对话祁素彬:放高风筝后,也要不停的拽线

态度原创

房产
旅游
健康
家居
教育

房产要闻

“烂尾”六年!海口这个豪宅,突然复活!

旅游要闻

“黄河华山 家在渭南”渭南文旅宣传暨冬季文旅消费季活动启动

警惕乳腺报告五大信号警报!

家居要闻

电影质感 中古风格的家

教育要闻

76%计划出国!美国学生正在“逃离”本土教育?

无障碍浏览 进入关怀版
×