网易首页 > 网易号 > 正文 申请入驻

李飞飞团队“50美元”复现DeepSeek R1真相:基座为阿里云Qwen模型

0
分享至

《科创板日报》2月6日讯 (记者 毛明江 黄心怡) 今日一则关于人工智能领域的新闻引发广泛关注。

据报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

这一消息无疑在AI界投下了一颗重磅炸弹,真相究竟如何?

《科创板日报》记者调查和采访业内人士后发现,s1模型的训练并非从零开始,而是基于阿里云通义千问(Qwen)模型进行监督微调。这意味着,s1模型的神奇“低成本”,是建立在已具备强大能力的开源基础模型之上。

▍通义模型的“基座”作用

根据李飞飞等人的研究论文,s1模型的训练仅使用了1000个样本数据。按照业内共识,这一数据量在AI训练中可谓微乎其微,通常不足以训练出一个具备推理能力的模型。

青年AI科学家、上海交通大学人工智能学院谢伟迪副教授告诉《科创板日报》记者,如果仔细研究斯坦福s1的论文会发现,s1模型的神奇是以通义千问模型为基座进行微调,这1000个样本训练的作用更像是“锦上添花”,而非“从零开始”。

国内某知名大模型公司CEO也向《科创板日报》记者表示:“从论文原文来看,所谓用50美元训练出新的具有推理能力的模型,实际上只是用从谷歌模型中提炼出来的1000个样本,然后对通义千问模型进行监督微调。这种微调的成本确实很低,但明显是站在既有领先模型的‘肩上’才能做到。


斯坦福s1论文原文也注明模型是以阿里通义千问模型为基础微调

谢伟迪指出,国内外还有其他团队也声称用极低的成本,训练出了具有推理能力的新模型。但一阅读其论文原文,就会发现它们无一例外都是基于通义模型作为基座进行的。


国外多位人工智能研究者也指出,不少的“新”模型都是建立通义模型基础上

以通义千问模型作为基座,确实可以用很少的样本数据就达到产生新的推理模型的效果,但如果换成其他基座模型,新模型能力却没有任何的提升。所以,能力真正神奇的是Qwen模型,而不是s1。 ” 谢伟迪说。

▍低成本训练大模型有局限,但也是方向

尽管s1模型的低成本训练在某种程度上展示了AI训练的潜力,但其局限性也不容忽视。

首先,这种低成本训练依赖于已有的强大基座模型,如阿里通义千问模型。如果没有这样的基座模型,低成本训练的效果将大打折扣。

其次,1000个样本数据的训练量在大多数情况下是不够的,尤其是在需要处理复杂任务的场景中。

此外,低成本训练的成功也引发了对AI模型知识产权和伦理问题的讨论。如果越来越多的研究依赖于已有的基座模型进行微调,那么这些基座模型的开发者是否应该获得相应的回报?如何确保AI技术的公平使用和共享?这些问题都需要业界进一步探讨和解决。

尽管s1模型的低成本训练引发了争议,但其背后的研究思路无疑为AI领域提供了新的思考方向。

武汉人工智能学院一位资深研究人员向《科创板日报》记者表示,如何在保证模型性能的前提下,降低训练成本,是AI研究的一个重要课题。未来,随着技术的进步和算法的优化,或许我们真的能够看到更多低成本、高性能的AI模型问世。

责任编辑:李曦_NN2587

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中纪委:禁止机关事业单位职工干这6种副业

中纪委:禁止机关事业单位职工干这6种副业

乡知乡见
2025-03-24 17:28:08
大S遗产变4人分!台媒曝S妈拿2亿,孩子各1亿,具俊晔成最大赢家

大S遗产变4人分!台媒曝S妈拿2亿,孩子各1亿,具俊晔成最大赢家

小咪侃娱圈
2025-03-28 10:17:42
马步芳霸占侄女当小妾,随后又对她说:把你母亲和小妹也一起叫来

马步芳霸占侄女当小妾,随后又对她说:把你母亲和小妹也一起叫来

风城春史
2025-03-27 18:40:09
女网最新战报,2-0:世界第1创历史,22胜第1人,距冠军一步之遥

女网最新战报,2-0:世界第1创历史,22胜第1人,距冠军一步之遥

娱乐看阿敞
2025-03-28 10:19:20
49岁巴特尔近况:升官从政,和大10岁妻子很恩爱,35岁继女很漂亮

49岁巴特尔近况:升官从政,和大10岁妻子很恩爱,35岁继女很漂亮

赵仔说
2025-03-27 14:15:19
消费贷(利率2.5%)替换房贷(3.3%)划算不,真相比你想的更残酷

消费贷(利率2.5%)替换房贷(3.3%)划算不,真相比你想的更残酷

说故事的阿袭
2025-03-26 16:18:04
傅崐萁民调,曝光!

傅崐萁民调,曝光!

陈景圣
2025-03-27 16:39:30
亚亚跪求:留在湾湾陪伴3个孩子!原来最不想回大陆的是这个女人

亚亚跪求:留在湾湾陪伴3个孩子!原来最不想回大陆的是这个女人

大风文字
2025-03-21 16:52:52
马斯克掀桌子!14万特斯拉Model Q上市,续航500km+自动驾驶

马斯克掀桌子!14万特斯拉Model Q上市,续航500km+自动驾驶

沙雕小琳琳
2025-03-27 19:32:16
俄乌单日交火208次,欧盟8000亿“重新武装欧洲”计划受阻

俄乌单日交火208次,欧盟8000亿“重新武装欧洲”计划受阻

史政先锋
2025-03-27 20:47:07
“有容乃大”,还得是陈数……

“有容乃大”,还得是陈数……

印象逍遥子
2025-03-27 15:32:50
小米新机官宣:4月发布,同档无敌!

小米新机官宣:4月发布,同档无敌!

小兔子发现大事情
2025-03-27 17:29:53
上海女子突然被提醒:入账4.7万元!上海这些人已拿到钱,有人直呼“太方便”

上海女子突然被提醒:入账4.7万元!上海这些人已拿到钱,有人直呼“太方便”

上观新闻
2025-03-27 11:17:39
42岁男子舔狗式追求女主播,2年转账30多万,一段视频让其崩溃…

42岁男子舔狗式追求女主播,2年转账30多万,一段视频让其崩溃…

小人物看尽人间百态
2025-03-27 21:31:52
詹姆斯:我在季前赛坐板凳席上吃个水果 都被前湖人球员批评

詹姆斯:我在季前赛坐板凳席上吃个水果 都被前湖人球员批评

直播吧
2025-03-27 16:46:02
赵露思评论区沦陷!网友都在劝她:“退圈吧,回家吧好吗?”

赵露思评论区沦陷!网友都在劝她:“退圈吧,回家吧好吗?”

联友说娱
2025-03-27 15:26:15
西部局势大变!快船不争第5,湖人难超掘金,勇士、太阳要哭了

西部局势大变!快船不争第5,湖人难超掘金,勇士、太阳要哭了

两兄弟养牛
2025-03-28 06:26:32
在潜艇里工作有多难熬,工资来证明,潜艇兵的工资,是按小时计算

在潜艇里工作有多难熬,工资来证明,潜艇兵的工资,是按小时计算

阿七说史
2025-03-20 17:40:55
汪东兴点评邓公“他那两把刷子不如华主席”,邓公一句话,汪主动辞职

汪东兴点评邓公“他那两把刷子不如华主席”,邓公一句话,汪主动辞职

史论纵横
2023-06-21 21:36:51
北约秘书长警告:若俄罗斯对波兰或其他盟国发动任何攻击,北约将作出“毁灭性”回应

北约秘书长警告:若俄罗斯对波兰或其他盟国发动任何攻击,北约将作出“毁灭性”回应

环球网资讯
2025-03-26 21:44:14
2025-03-28 10:59:00
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
561196文章数 1006624关注度
往期回顾 全部

科技要闻

OpenAI吉卜力爆火背后,小团队还有机会吗

头条要闻

普京涉乌表态升级:俄军会将乌军彻底击溃

头条要闻

普京涉乌表态升级:俄军会将乌军彻底击溃

体育要闻

勒布朗,第八个压秒绝杀

娱乐要闻

大S遗愿曝光!汪小菲曾打电话咆哮S妈

财经要闻

26个副总裁的蔚来 比不过王凤英的小鹏?

汽车要闻

雪豹四驱 星途揽月C-DM上市售20.99万起

态度原创

本地
艺术
旅游
公开课
军事航空

本地新闻

我在新昌当女主|"穿越"千年,在天姥山感受大唐盛世

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

旅游要闻

广西三月三搜索量上涨超400%

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

4名美军士兵失踪 距白俄边境不到10公里

无障碍浏览 进入关怀版