网易首页 > 网易号 > 正文 申请入驻

李飞飞团队“50美元”复现DeepSeek R1?真相是…...

0
分享至

今日一则关于人工智能领域的新闻引发广泛关注。

据报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

这一消息无疑在AI界投下了一颗重磅炸弹,真相究竟如何?

《科创板日报》记者调查和采访业内人士后发现,s1模型的训练并非从零开始,而是基于阿里云通义千问(Qwen)模型进行监督微调。这意味着,s1模型的神奇“低成本”,是建立在已具备强大能力的开源基础模型之上。

通义模型的“基座”作用

根据李飞飞等人的研究论文,s1模型的训练仅使用了1000个样本数据。按照业内共识,这一数据量在AI训练中可谓微乎其微,通常不足以训练出一个具备推理能力的模型。

青年AI科学家、上海交通大学人工智能学院谢伟迪副教授告诉《科创板日报》记者,如果仔细研究斯坦福s1的论文会发现,s1模型的神奇是以通义千问模型为基座进行微调,这1000个样本训练的作用更像是“锦上添花”,而非“从零开始”。

国内某知名大模型公司CEO也向《科创板日报》记者表示:“从论文原文来看,所谓用50美元训练出新的具有推理能力的模型,实际上只是用从谷歌模型中提炼出来的1000个样本,然后对通义千问模型进行监督微调。这种微调的成本确实很低,但明显是站在既有领先模型的‘肩上’才能做到。


斯坦福s1论文原文也注明模型是以阿里通义千问模型为基础微调

谢伟迪指出,国内外还有其他团队也声称用极低的成本,训练出了具有推理能力的新模型。但一阅读其论文原文,就会发现它们无一例外都是基于通义模型作为基座进行的。


国外多位人工智能研究者也指出,不少的“新”模型都是建立通义模型基础上

以通义千问模型作为基座,确实可以用很少的样本数据就达到产生新的推理模型的效果,但如果换成其他基座模型,新模型能力却没有任何的提升。所以,能力真正神奇的是Qwen模型,而不是s1。” 谢伟迪说。

低成本训练大模型有局限,但也是方向

尽管s1模型的低成本训练在某种程度上展示了AI训练的潜力,但其局限性也不容忽视。

首先,这种低成本训练依赖于已有的强大基座模型,如阿里通义千问模型。如果没有这样的基座模型,低成本训练的效果将大打折扣。

其次,1000个样本数据的训练量在大多数情况下是不够的,尤其是在需要处理复杂任务的场景中。

此外,低成本训练的成功也引发了对AI模型知识产权和伦理问题的讨论。如果越来越多的研究依赖于已有的基座模型进行微调,那么这些基座模型的开发者是否应该获得相应的回报?如何确保AI技术的公平使用和共享?这些问题都需要业界进一步探讨和解决。

尽管s1模型的低成本训练引发了争议,但其背后的研究思路无疑为AI领域提供了新的思考方向。

武汉人工智能学院一位资深研究人员向《科创板日报》记者表示,如何在保证模型性能的前提下,降低训练成本,是AI研究的一个重要课题。未来,随着技术的进步和算法的优化,或许我们真的能够看到更多低成本、高性能的AI模型问世。

本文源自:科创板日报

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
惊现老鼠,全部下架!杨国福突然被曝!曾冲刺麻辣烫第一股

惊现老鼠,全部下架!杨国福突然被曝!曾冲刺麻辣烫第一股

21世纪经济报道
2025-03-19 21:37:32
杭州夜店因2.6元代驾费被整治事件,背后的原因细思极恐!

杭州夜店因2.6元代驾费被整治事件,背后的原因细思极恐!

老唐有话说
2025-03-20 16:31:17
腾讯挑战台积电地位!

腾讯挑战台积电地位!

中国半导体论坛
2025-03-20 20:56:38
理想汽车正式停发!

理想汽车正式停发!

电动知家
2025-03-20 19:57:57
过安检能让多少人“身败名裂”?网友分享太炸裂,一看一个不吱声

过安检能让多少人“身败名裂”?网友分享太炸裂,一看一个不吱声

奇特短尾矮袋鼠
2024-06-26 20:24:41
回顾:女子穷游蒙古国被强奸,女子很崩溃,女子讲述事发过程

回顾:女子穷游蒙古国被强奸,女子很崩溃,女子讲述事发过程

胡侃社会百态
2025-03-20 11:18:12
午睡可能影响寿命!再次提醒:55岁以后,牢记午睡“四不要”

午睡可能影响寿命!再次提醒:55岁以后,牢记午睡“四不要”

肿瘤的真相与误区
2025-02-02 19:35:52
凯记:绿军新老板将在波士顿买房去看所有主场比赛 是名绿军死忠

凯记:绿军新老板将在波士顿买房去看所有主场比赛 是名绿军死忠

直播吧
2025-03-20 22:55:03
清华教授:整个社会陷入了一场“忙碌症”

清华教授:整个社会陷入了一场“忙碌症”

尚曦读史
2025-03-19 09:11:19
江苏气象发布:还有极端低温1℃+雨雨雨

江苏气象发布:还有极端低温1℃+雨雨雨

鲁中晨报
2025-03-21 08:36:11
蒋友青正式定居大陆!在杭州创业当网红,租豪华别墅给员工做宿舍

蒋友青正式定居大陆!在杭州创业当网红,租豪华别墅给员工做宿舍

娱圈小愚
2025-03-20 11:09:39
U22国奥逼平乌兹,众网友力捧U20,现实:依木兰荆纪闻比谁强?

U22国奥逼平乌兹,众网友力捧U20,现实:依木兰荆纪闻比谁强?

生活新鲜市
2025-03-21 05:43:25
真的让汪小菲说中了,大S遗物或将搬离豪宅,具俊晔要为大S圆梦!

真的让汪小菲说中了,大S遗物或将搬离豪宅,具俊晔要为大S圆梦!

阿纂看事
2025-03-20 14:50:52
北青体育:比分落后伊万不愿冒险,想把塞鸟用在更关键的比赛中

北青体育:比分落后伊万不愿冒险,想把塞鸟用在更关键的比赛中

直播吧
2025-03-21 04:45:17
中国为啥还不收台湾?唐湘龙的解释是我听过的最好的回答

中国为啥还不收台湾?唐湘龙的解释是我听过的最好的回答

阿器谈史
2025-03-19 17:18:43
万斯的性取向

万斯的性取向

哲空空
2025-03-19 11:36:32
送检13款“零添加”酱油,只有它不含重金属,目的不单纯!

送检13款“零添加”酱油,只有它不含重金属,目的不单纯!

水泥土的搞笑
2025-03-20 10:55:05
雅迪爱玛遭遇“价格刺客”!董明珠999元电动车捅破行业暴利真相

雅迪爱玛遭遇“价格刺客”!董明珠999元电动车捅破行业暴利真相

振华观史
2025-03-18 13:44:57
对华出口暴跌60%!法国没想到中美很果断,马克龙的话中方不会忘

对华出口暴跌60%!法国没想到中美很果断,马克龙的话中方不会忘

牛锅巴小钒
2025-03-20 17:10:56
已经被国家禁止的5个居家物件,看看你还在用吗?真别再买了

已经被国家禁止的5个居家物件,看看你还在用吗?真别再买了

我不是博士
2024-11-12 18:40:11
2025-03-21 09:52:49
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
6399511文章数 543489关注度
往期回顾 全部

科技要闻

黄仁勋公开认错!承认不该唱衰量子计算

头条要闻

媒体:泽连斯基记者会上突然接起马克龙电话 当众撒糖

头条要闻

媒体:泽连斯基记者会上突然接起马克龙电话 当众撒糖

体育要闻

柯丝蒂·考文垂当选国际奥委会主席

娱乐要闻

主流媒体为大S发声,生前最后一条动态被提起

财经要闻

黄仁勋,拐点出现

汽车要闻

搭华为ADS 3.3 问界新M5 Ultra售22.98万起

态度原创

健康
教育
手机
时尚
家居

护龈工具大PK,冠军会花落谁家?

教育要闻

泰晤士发布2025全球国际化大学排名:中国包揽全球前4名!

手机要闻

苹果 iPhone 屏幕防护专利获批:多层“铠甲”实现抗刮痕、低反光

被30岁的虞书欣吓到了!她的脸怎么变这样了

家居要闻

阳光简约 清新大气

无障碍浏览 进入关怀版