网易首页 > 网易号 > 正文 申请入驻

50美元复现DeepSeek R1,李飞飞团队为何也选了阿里Qwen

0
分享至

作者 | 硬 AI

编辑 | 硬 AI

春节期间,中国AI的技术变革在全世界掀起浪潮。

继DeepSeek的低成本推理模型震惊硅谷和华尔街之后,昨日,李飞飞等斯坦福大学和华盛顿大学研究人员发布的最新研究成果再次引发业界热议:基于阿里通义千问Qwen2.5-32B-Instruct开源模型为底座,仅使用16块H100 GPU,通过26分钟的监督微调,便打造出了性能卓越比肩OpenAI的O1和DeepSeek的R1等尖端推理模型的s1-32B模型。

这一模型不仅在数学及编码能力上与OpenAI的o1和DeepSeek的R1等顶尖推理模型相当,在竞赛数学问题上的表现更是比o1-preview高出27%。

不过,值得注意的是,虽然媒体报道中强调s1模型只要不到50美元成本,但s1模型的训练并非从零开始,而是基于阿里云通义千问(Qwen)模型进行监督微调。

这意味着,s1模型的神奇“低成本”,是建立在已具备强大能力的通义千问开源基础模型“巨人肩膀”之上完成的。

如此惊人的效果,再次证实了通义千问模型的技术实力。

阿里的开源模型推动AI普惠,引发产业变革

在李飞飞团队之前,AI初创公司DeepSeek也选择了通义千问作为核心技术底座。DeepSeek官方透露,他们将DeepSeek-R1的强大推理能力成功蒸馏到6个开源模型中,其中4个都基于Qwen系列。特别是基于Qwen-32B蒸馏的模型,已经实现了对标OpenAI o1-mini的卓越性能。这一系列成功案例再次说明了通义千问在开源社区的巨大影响力和良好口碑,逐渐取代Llama成为开源社区最重要的标杆基座模型。

自2023年8月开源以来,阿里云通义千问已相继推出Qwen、Qwen1.5、Qwen2、Qwen2.5等四代模型,涵盖大语言模型、多模态模型、数学模型和代码模型等数十款产品。这些模型在HuggingFace的Open LLM Leaderboard、Chatbot Arena大模型盲测榜单、司南OpenCompass等多个国内外权威评测中屡创佳绩,展现出全球领先的性能水平。

通义千问率先在业界实现了"全尺寸、全模态、多场景"的开源布局。从1.5B到72B乃至110B的全系列开源,为开发者和企业提供了最大的选择空间。数据显示,2024年仅Qwen2.5-1.5B-Instruct一款模型就占据全球模型下载量的26.6%,远超第二名Llama-3.1-8B-Instruct-GGUF的6.44%。在视觉理解领域,Qwen-VL及Qwen2-VL两款模型的全球下载量更是突破3200万次。一周前,Qwen2.5-VL的全新升级再次引发开源社区的热烈响应。

目前,通义千问在海内外开源社区的衍生模型数量已突破9万,超越Llama系列,成为世界最大的生成式语言模型族群。这一成就不仅体现了通义千问的技术实力,更凸显了其在推动AI普惠方面的重要贡献。

中国大模型引发全球关注,阿里巴巴推动中国AI资产重估

通过持续开源领先模型,阿里云不仅繁荣了AI开发生态,更吸引越来越多的开发者和企业用上先进的云计算基础设施,从而推动了“云+AI”从技术创新到商业良性循环的完整闭环。

这一成绩展现了阿里云"强大模型+充足算力+完整云平台"的综合实力。

今年1月29日春节期间,阿里云发布的通义千问Qwen2.5-Max超大规模MoE模型,在Chatbot Arena大模型盲测中以1332分位列全球第七,超越DeepSeek-V3、OpenAI o1-mini和Claude-3.5-Sonnet等强劲对手,成为非推理类中国大模型中的佼佼者。

外资机构对这一趋势给予了高度关注。大摩、高盛、德银认为,DeepSeek和阿里通义打响了中国大模型"AI普惠"的第一枪,这种技术突破与去年北美云计算服务商的发展轨迹高度相似。

根据大摩此前的研报,低成本高性能模型也将重塑数据中心行业格局:对于中国数据中心而言,短期内,如果大型科技公司采用类似技术路线,可能减少AI训练相关需求。但从长远来看,低成本模型将推动推理需求增长,对一线城市数据中心形成利好。

瑞银在昨日的研报更是以"冰雪消融,春暖花开,又到了追涨中概互联网的季节"这么浪漫的标题,来看多以阿里巴巴为代表的中国AI资产。

随着国内LLM从模型到应用的蓬勃发展,数据中心和基础设施将迎来新一轮增长机遇。计算能力需求的扩大不仅带来规模效应,更将提升整个产业链的定价能力。

DeepSeek昨日因服务器紧张而暂停API充值服务的情况,正是印证了算力和云服务需求的迫切性。

国泰君安在今日的报告中表示,在以DeepSeek为首的低成本推理模型的逐渐普及下,推理成本及价格大幅削减势必会带来应用测的繁荣,这反过来还会拉动成倍数的总算力需求提升。

未来可期

阿里云通过开源战略和持续创新,正在推动全球AI技术深入发展。其"开源引领+云服务"的双轮驱动模式,一方面通过领先的开源模型降低AI应用门槛,推动技术普惠;另一方面借助日益增长的算力需求,带动云服务业务快速发展。

当前,随着AI普惠浪潮兴起,云计算基础设施的重要性愈发凸显。阿里云凭借技术积累和平台优势,正成为连接AI创新与产业升级的关键纽带,也将从这波产业变革中获得更大的发展机遇。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
对越反击战撤军前夕,200多名士兵突然投降越南,连累整个50军被裁撤

对越反击战撤军前夕,200多名士兵突然投降越南,连累整个50军被裁撤

寄史言志
2026-03-26 20:30:13
家长违停孩子开门杀撞人后逃逸?交警回应

家长违停孩子开门杀撞人后逃逸?交警回应

中国新闻周刊
2026-03-26 14:46:51
为何越来越多有钱人,宁愿买两套房和父母住对门,也要搬离别墅?

为何越来越多有钱人,宁愿买两套房和父母住对门,也要搬离别墅?

装修秀
2026-03-26 14:05:47
老子二千年前就说透了:上天会用各种方式,把你引到你该走的路上

老子二千年前就说透了:上天会用各种方式,把你引到你该走的路上

千秋文化
2026-03-24 21:30:09
张雪峰追悼会28日举行!拒绝鲜花挽联一切从简,生前竟捐了1200多万!

张雪峰追悼会28日举行!拒绝鲜花挽联一切从简,生前竟捐了1200多万!

舟望停云
2026-03-26 23:31:16
曾经走红,如今却“沦为笑柄”的4种数码产品,还是别再买了

曾经走红,如今却“沦为笑柄”的4种数码产品,还是别再买了

美家指南
2026-03-06 10:31:36
詹姆斯:布朗尼绝对配得上立足NBA 我们家的人做事从来不敷衍

詹姆斯:布朗尼绝对配得上立足NBA 我们家的人做事从来不敷衍

罗说NBA
2026-03-26 22:15:56
4个LV包都是假的!女子送检后傻眼:全在专柜买的啊,最新回应

4个LV包都是假的!女子送检后傻眼:全在专柜买的啊,最新回应

半岛晨报
2026-03-25 15:30:03
虽然毛主席享年83岁,保健医生却说:其实毛主席不具备长寿条件

虽然毛主席享年83岁,保健医生却说:其实毛主席不具备长寿条件

芳芳历史烩
2026-03-26 23:31:52
记者:利物浦把40万镑周薪给错了人,他们本应该留下阿诺德

记者:利物浦把40万镑周薪给错了人,他们本应该留下阿诺德

懂球帝
2026-03-26 15:47:08
知名歌手公开玩性感美女大作!网友赌他"最多十分钟"

知名歌手公开玩性感美女大作!网友赌他"最多十分钟"

游民星空
2026-03-26 17:09:32
“老人味”的祸首被揪出!医生提醒:55岁后要少碰,老了或也没味

“老人味”的祸首被揪出!医生提醒:55岁后要少碰,老了或也没味

今日养生之道
2026-03-23 11:46:39
张雪峰的病,速效救心丸能救吗?

张雪峰的病,速效救心丸能救吗?

中国新闻周刊
2026-03-25 16:23:30
天妒英才!西北工业大学严红教授离世,同门发声,透露患病情况

天妒英才!西北工业大学严红教授离世,同门发声,透露患病情况

凯旋学长
2026-03-26 14:50:48
张雪峰奶奶近况令人担忧,4年内子孙相继离世,不设追思会瞒着她

张雪峰奶奶近况令人担忧,4年内子孙相继离世,不设追思会瞒着她

古希腊掌管松饼的神
2026-03-26 11:29:25
出大事了,特朗普通报全球,美头号敌人已亮相,担心的事即将发生

出大事了,特朗普通报全球,美头号敌人已亮相,担心的事即将发生

策略述
2026-03-26 13:45:17
伊朗划定规则:俄罗斯、中国、印度5个朋友船只获准通过霍尔木兹

伊朗划定规则:俄罗斯、中国、印度5个朋友船只获准通过霍尔木兹

黄胜友
2026-03-26 17:58:23
伊朗称已组织超百万人为地面战斗做准备

伊朗称已组织超百万人为地面战斗做准备

闪电新闻
2026-03-27 00:18:15
给女儿留过亿财产后,张雪峰身家被扒底朝天,李雪琴的话有人信了

给女儿留过亿财产后,张雪峰身家被扒底朝天,李雪琴的话有人信了

爱下厨的阿酾
2026-03-26 20:14:43
杜月笙的识人术:只看对方的一个站姿,就能知道他是龙还是虫

杜月笙的识人术:只看对方的一个站姿,就能知道他是龙还是虫

千秋文化
2026-03-23 20:09:06
2026-03-27 00:59:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
143584文章数 2653029关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

本地
旅游
健康
艺术
公开课

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

旅游要闻

老外为羊拿铁扎堆魔都街头 法国游客花式夸上海

转头就晕的耳石症,能开车上班吗?

艺术要闻

都说乌克兰美女多,看完摄影师贝格玛 的作品我信了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版