网易首页 > 网易号 > 正文 申请入驻

阿里秘密研发新模型将发布,影响力指标成最重要考核

0
分享至

出品|虎嗅商业消费组

作者|苗正卿

题图|视觉中国

虎嗅独家获悉,阿里即将在2025年4月第二周发布新模型Qwen3,这将是阿里在2025年上半年最重要的模型产品,距离2024年9月阿里在云栖大会上发布Qwen2.5过去了大约七个月的时间。

据虎嗅独家了解,在2024年发布Qwen2.5后,阿里云内部的基础模型团队已经开始推动Qwen3相关项目。但2025年初DeepSeek的火爆,改变了团队的部分思路与重心。“2024年四季度,圈内已经意识到模型的推理能力很重要,但还不能说是最重要的方向,DeepSeek火爆后,推理能力已经成为绕不开的关键能力。”知情人士告诉虎嗅,DeepSeek-R1发布后,阿里云基础模型团队把策略中心进一步向模型的推理能力倾斜。

值得注意的是,在2024年下半年,阿里云基础模型团队对标的竞品模型主要是OpenAI的o1,而在DeepSeek-R1发布后,DeepSeek-R1已经成为了另一个主要对标模型。

虎嗅独家获悉,在阿里内部,基础模型团队最重要的考核维度是“模型影响力”。在内部,高层希望团队可以在业内成功塑造“最强模型”的心智。阿里集团CEO吴泳铭同时兼任阿里云CEO,据悉吴泳铭频繁参与到基础模型团队的业务沟通之中,并密切留意模型团队的各种进展。

两个具体的维度,被视为阿里基础模型团队的考核点:其一是衍生模型量,其二是在开发者社区的受欢迎度。

由于阿里采取模型开源策略,基于Qwen开源模型的衍生模型总量,被视为一个关键指标。截至目前,这一数据已经超过10万。而在开发者社区的欢迎度,阿里会考虑多个具体指标,比如开源模型下载量等。虎嗅获悉,2024年Qwen系列模型在开发者社区的下载量超过了2亿。

“在开发者社区之中,一个模型的影响力,主要有两个维度:一个是下载量,一个是衍生模型数。基于下载的开源模型,微调而成新的衍生模型后,需要重新上传至开发者社区。所以这两个维度可以比较好地反映一个开源模型的人气。”一位知情人士告诉虎嗅,在阿里内部针对全球开发者的模型影响力相关心智指标,从2024年开始就被高度重视,这和吴泳铭等技术出身的高管熟稔技术圈文化有关。

虎嗅另外独家获悉,2025年阿里模型团队也意识到了诸如智驾、AI Agent、AI硬件等机会风口的存在。为了更好地契合这些场景,基础模型团队依然会采取“多尺寸”策略。2024年发布的Qwen2系列,总共发布了7种不同的模型尺寸,而即将发布的Qwen3尺寸类型可能会更多。

值得注意的是,伴随Qwen3发布,阿里正在开启史上最大规模的校招,而虎嗅获悉,校招的HC之中涉及到基础模型团队的岗位量也达到史上最高。和以往不同的是,目前基础模型团队在招人过程中,更看重人才的“AI原生”,也就是说更希望引入一开始接触的就是大语言模型的人才,而非传统的NLP人才(自然语言模型)。

本文来自虎嗅,原文链接:https://www.huxiu.com/article/4187485.html?f=wyxwapp

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张雪峰去世,日媒用了这样一句话评价他...

张雪峰去世,日媒用了这样一句话评价他...

今日日本
2026-03-25 11:10:15
向余望必须MVP!陈泽仕+李新翔高分,于金永不够果决,两将不及格

向余望必须MVP!陈泽仕+李新翔高分,于金永不够果决,两将不及格

刀锋体育
2026-03-25 23:26:05
开业5天已快回本一半!花27万元拿下太昊陵庙会C位摊的猪蹄老板:每天营业14个小时,仅睡四五个小时,喉咙都喊哑了

开业5天已快回本一半!花27万元拿下太昊陵庙会C位摊的猪蹄老板:每天营业14个小时,仅睡四五个小时,喉咙都喊哑了

极目新闻
2026-03-24 22:57:22
丧心病狂!河南14岁少年被虐死案:死时穿纸尿裤,胃里空无一物

丧心病狂!河南14岁少年被虐死案:死时穿纸尿裤,胃里空无一物

春日在捕月
2026-03-25 01:00:23
知名演员于荣光到昆明一高校任职!成龙胡歌吴京等打Call

知名演员于荣光到昆明一高校任职!成龙胡歌吴京等打Call

掌上春城
2026-03-25 21:37:55
上海的租售比,开始离谱了

上海的租售比,开始离谱了

魔都财观
2026-03-26 07:41:08
心理学中有个词叫:拆屋效应(拿捏一个人,最有效的方式,不是谈条件,也不是画大饼,而是利用「拆屋效应」)

心理学中有个词叫:拆屋效应(拿捏一个人,最有效的方式,不是谈条件,也不是画大饼,而是利用「拆屋效应」)

经济观察网
2025-12-04 09:25:48
“戏混子”没走,比资本家丑孩子更可怕的是“星二代”开始世袭了

“戏混子”没走,比资本家丑孩子更可怕的是“星二代”开始世袭了

流史岁月
2026-01-26 10:58:30
伊朗最高领袖顾问重申结束战争条件

伊朗最高领袖顾问重申结束战争条件

界面新闻
2026-03-24 15:44:17
伊拉克哈巴尼亚军事基地遇袭致7人死亡

伊拉克哈巴尼亚军事基地遇袭致7人死亡

新华社
2026-03-25 16:18:03
简直降维打击,NBA扣篮大赛三冠王麦克朗荣膺G联赛历史得分王

简直降维打击,NBA扣篮大赛三冠王麦克朗荣膺G联赛历史得分王

懂球帝
2026-03-25 12:12:11
日本网友对比梅洛尼和高市早苗会见特朗普画面,发出提问 “维护国家尊严,谁的行为是正确的”

日本网友对比梅洛尼和高市早苗会见特朗普画面,发出提问 “维护国家尊严,谁的行为是正确的”

大象新闻
2026-03-25 15:49:04
40岁菲尔普斯现状曝光!退役后暴瘦到无人识,老婆长得很漂亮

40岁菲尔普斯现状曝光!退役后暴瘦到无人识,老婆长得很漂亮

小徐讲八卦
2026-03-23 14:19:30
称国民党一度往民进党路线靠拢,蓝营人士:选民干嘛要支持你

称国民党一度往民进党路线靠拢,蓝营人士:选民干嘛要支持你

海峡导报社
2026-03-26 07:21:03
重磅|2026QS世界大学学科排名正式发布!

重磅|2026QS世界大学学科排名正式发布!

新航道官方号
2026-03-25 19:41:30
外交部发言人反问日媒:“你见过有人未经允许持刀进入使馆与大使交谈的先例吗?”

外交部发言人反问日媒:“你见过有人未经允许持刀进入使馆与大使交谈的先例吗?”

新京报
2026-03-25 15:37:27
省下一亿镑!曼联自有 “新吉马良斯”,卡里克手握王炸

省下一亿镑!曼联自有 “新吉马良斯”,卡里克手握王炸

澜归序
2026-03-26 04:56:27
普通人一生的存款标准

普通人一生的存款标准

捣蛋窝
2026-03-21 11:14:00
旅行者号撞上"空气墙"?宇宙可能就是一场精心设计的大型模拟游戏

旅行者号撞上"空气墙"?宇宙可能就是一场精心设计的大型模拟游戏

李将平老师
2026-03-22 16:46:15
外交部发言人反问日媒:“你见过有人未经允许持刀进入使馆与大使交谈的先例吗?”

外交部发言人反问日媒:“你见过有人未经允许持刀进入使馆与大使交谈的先例吗?”

环球网资讯
2026-03-25 15:39:26
2026-03-26 08:51:00
虎嗅APP incentive-icons
虎嗅APP
个性化商业资讯与观点交流平台
25979文章数 687622关注度
往期回顾 全部

科技要闻

硅谷因AI大裁员?一线工程师戳破真相

头条要闻

"10元手冲咖啡"阿姨曾1天卖1000杯 如今只卖两三杯

头条要闻

"10元手冲咖啡"阿姨曾1天卖1000杯 如今只卖两三杯

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰遗产分割复杂!是否立遗嘱成关键

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

智己LS8放大招 30万内8系旗舰+全线控底盘秀实力

态度原创

教育
时尚
家居
数码
公开课

教育要闻

春风润乡土,春假育新人——春假为乡村教育注入新动能

《非穷尽列举》,好看又绝望

家居要闻

轻奢堇天府 小资情调

数码要闻

开源隐私平板open_slate发布:独立物理开关可切断传感器电源

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版