网易首页 > 网易号 > 正文 申请入驻

【人工智能】OpenAI o1 竞争对手 S1 AI 模型的训练费用不到 50 美元,那么 S1 AI 模型是什么?

0
分享至

今年 1 月,中国人工智能初创公司 DeepSeek 以其成本效益高、最先进的人工智能模型引发了一场革命。该公司推出了两款模型 DeepSeek-V3 和 DeepSeek-V1,其性能可与 OpenAI 和谷歌的前沿模型相媲美,而且成本仅为大型科技公司所用模型的一小部分。

DeepSeek 为人工智能领域更审慎的创新铺平了道路。现在,一种新模型引发了人工智能界的好奇心。斯坦福大学和华盛顿大学的研究人员以微薄的 50 美元(约 4,400 卢比)云计算积分训练了一个名为 S1 的推理模型。

S1 是什么?

根据研究论文,S1-32B 模型是一个开源高级语言模型,专注于推理任务。它与其他 AI 模型的不同之处在于其“测试时间扩展”技术,该技术允许它在测试期间动态使用额外的计算资源来迭代其响应。据报道,S1 直接与 OpenAI 的 o1 推理模型竞争,因为它通过思考相关问题来生成提示的答案,这也使它能够检查自己的回答。这种方法不同于仅依赖于事先训练大型语言模型的传统方法。

例如,如果你让模型解释用Android平板电脑取代 iPhone 的成本是多少,它会将问题分解为几个步骤,其中可能包括检查目前有多少人使用 iPhone 以及制造 Android 平板电脑的成本是多少。

它是如何训练的?

S1 模型通过精心挑选的高质量数据集 S1K 进行训练,该数据集包含 1,000 个精心挑选的问题。这些问题是根据其难度、多样性和质量选择的。该数据集还包括数学、推理和科学方面的复杂问题。该模型开发的另一个关键方面是在这个小数据集上进行监督微调 (SFT)。根据研究论文,SFT 只需要在 16 个 NVIDIA H100 GPU 上进行 26 分钟的训练。尽管数据集很小,但由于使用了嵌入在预训练基础模型 Qwen2.5-32B-Instruct 中的知识,S1 实现了较高的推理精度。

S1 还基于现成的语言模型,该模型通过研究Google的Gemini 2.0 Flash Thinking Experimental 中的问题和答案进行推理训练。Google 模型展示了每个回答过程背后的思维,这使得 S1 的开发人员能够为他们的模型提供较少的训练数据——1000 个精心挑选的带答案的问题。他们本质上是教 S1 模型模仿 Gemini 的思维过程。

在性能方面,S1 已在三个推理基准(AIME24、MATH500 和 GPQA Diamond)上进行了评估。在测试中,该模型的准确性显着提高,并且优于 OpenAI 的闭源模型 O1 Preview。S1 模型在数学竞赛问题上的性能提升高达 27%。虽然早期的模型需要强化学习和大量数据集,但 S1-32B 表明仅使用 1,000 个样本进行有效训练就可以建立竞争性推理模型。

这对人工智能意味着什么?

S1 模型表明了透明度和开源贡献在人工智能开发中的重要性。随着 s1 的开发过程公开,研究人员希望在这一领域开展更多合作和创新。研究人员还表明需要克服测试时间扩展的限制,这表明需要探索替代的预算强制方法并应用强化学习技术来进一步增强推理能力。

简而言之,S1 是一个突破性的模型,它集高效的训练、创新的测试时间扩展和开源原则于一体。

免责声明:

本文所发布的内容和图片旨在传播行业信息,版权归原作者所有,非商业用途。如有侵权,请与我们联系。所有信息仅供参考和分享,不构成任何投资建议。投资者应基于自身判断和谨慎评估做出决策。投资有风险,入市需谨慎。

注我们,一起探索AWM

2025-02-01

2025-02-06

2024-12-14

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
ASML总裁:不卖给中国光刻机,人家也可以不卖给你稀土和传统芯片

ASML总裁:不卖给中国光刻机,人家也可以不卖给你稀土和传统芯片

粤语音乐喷泉
2026-03-07 18:57:50
父亲年前从国企退休,我以为退休金也就三四千块钱

父亲年前从国企退休,我以为退休金也就三四千块钱

五元讲堂
2026-02-25 14:26:11
穿“鸟”的人少了,穿“山”的人多了?商场这一幕,太真实了

穿“鸟”的人少了,穿“山”的人多了?商场这一幕,太真实了

白色得季节
2026-03-06 10:44:56
高中的潜规则:60%多的人上不了本科,能上985的,不会在普高出现

高中的潜规则:60%多的人上不了本科,能上985的,不会在普高出现

好爸育儿
2026-02-12 16:04:52
钱多有何用?儿子涉毒女儿拾荒流浪,71岁成龙晚年凄凉,无人同情

钱多有何用?儿子涉毒女儿拾荒流浪,71岁成龙晚年凄凉,无人同情

有范又有料
2025-09-09 15:22:11
城市更新有望冲刺10万亿规模

城市更新有望冲刺10万亿规模

21世纪经济报道
2026-03-05 21:10:32
中国女篮!韩旭正式归队,且与球队完成了一次合练

中国女篮!韩旭正式归队,且与球队完成了一次合练

体育哲人
2026-03-07 23:25:43
赫子铭直播回应离婚,坦言已再婚,过的十分幸福,比何洁要显年轻

赫子铭直播回应离婚,坦言已再婚,过的十分幸福,比何洁要显年轻

郭蛹包工头
2026-03-07 22:52:47
女人这两件事,99%不会告诉男人,100%的男人都不知道

女人这两件事,99%不会告诉男人,100%的男人都不知道

青苹果sht
2026-01-20 05:45:59
95分钟绝杀!40岁C罗狂喜:没有他利雅得胜利也能赢 11连胜2分领跑

95分钟绝杀!40岁C罗狂喜:没有他利雅得胜利也能赢 11连胜2分领跑

风过乡
2026-03-08 07:37:49
恶心了中国十年的萨德,被调往中东

恶心了中国十年的萨德,被调往中东

超级学爸蛋总
2026-03-05 20:05:15
如何判断中东战事后续对A股的双重影响?

如何判断中东战事后续对A股的双重影响?

李志林
2026-03-08 06:55:06
雙囍|田啟文結婚周星馳以一個方式,成功低調到賀︰我很感謝他

雙囍|田啟文結婚周星馳以一個方式,成功低調到賀︰我很感謝他

粤睇先生
2026-03-07 23:10:00
英媒曝鲁尼糟了!上周末凌晨三点烂醉而归 贤妻摘下婚戒决心不再忍

英媒曝鲁尼糟了!上周末凌晨三点烂醉而归 贤妻摘下婚戒决心不再忍

劲爆体坛
2026-03-07 11:02:03
中国正加速抛售美债,美专家:中国用了新抛售方式,完全无法干预

中国正加速抛售美债,美专家:中国用了新抛售方式,完全无法干预

似水流年忘我
2026-01-29 01:24:08
独家调查:消失在 08:10 —穆杰塔巴的“生存奇迹”与暗黑交易

独家调查:消失在 08:10 —穆杰塔巴的“生存奇迹”与暗黑交易

卷卷百事通
2026-03-07 09:20:44
谷维素加维生素B12,可改善老年人4大常见问题,建议收藏!

谷维素加维生素B12,可改善老年人4大常见问题,建议收藏!

李药师谈健康
2026-03-06 13:25:58
玩家用PS手柄发现大疆重大漏洞!官方直接奖励3万美元

玩家用PS手柄发现大疆重大漏洞!官方直接奖励3万美元

游民星空
2026-03-07 16:33:25
米兰冬残奥首日中国2金2银2铜,创境外参赛历史最佳开局

米兰冬残奥首日中国2金2银2铜,创境外参赛历史最佳开局

懂球帝
2026-03-08 10:37:13
新款日产NV200官方谍照曝光!网友:定价9万必卖爆

新款日产NV200官方谍照曝光!网友:定价9万必卖爆

汽车网评
2026-03-06 22:24:14
2026-03-08 11:07:00
七元宇宙 incentive-icons
七元宇宙
AI、Web3、Meta聚合型精选内容分享。以前沿视角,探索科技未来;让每一个人,都走在时代的前沿
2042文章数 92关注度
往期回顾 全部

科技要闻

OpenClaw最大的推手是闲鱼和小红书

头条要闻

媒体:伊朗问题要注意普京的动向 其在向美以喊话

头条要闻

媒体:伊朗问题要注意普京的动向 其在向美以喊话

体育要闻

塔图姆298天走完这段路 只用27分钟征服这座城

娱乐要闻

周迅新恋情曝光,李亚鹏等人已成过去

财经要闻

油价要失控?

汽车要闻

华为乾崑全新激光雷达落地 鸿蒙智行同步技术升级

态度原创

游戏
房产
手机
亲子
军事航空

RPG+SLG单机《华夏史诗:战国》Demo试玩上线

房产要闻

传统学区房熄火?2月海口二手房爆火的板块竟然是…

手机要闻

麒麟9030产能火力全开!华为Mate 80系列销量激增:已突破400万台

亲子要闻

12岁孩子肠癌晚期,肿瘤年轻化不是开玩笑!

军事要闻

美第三个航母打击群据称准备部署至中东

无障碍浏览 进入关怀版