网易首页 > 网易号 > 正文 申请入驻

当AI竞赛进入深水区,阿里千问3靠什么赢下AI下半场?

0
分享至

4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3)。它的参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型。

不难看出,行业已从单纯追求参数规模向效率与实用性转型。Qwen3一经发布,就在Hugging Face、GitHub等开发者社区迅速获得了不错的反响。

业内分析认为,这是中国AI技术在高性能、低成本技术路线上的重要突破,进一步巩固了阿里在AI领域的地位。

而阿里在AI方向上的投入还在加大。2025年2月,阿里CEO吴泳铭宣布未来三年将投入3800亿元加码AI与云计算基础设施,这一数字超过了阿里过去十年在该领域的投入总和。

“Qwen3反映了最近的两个趋势:MoE和可选的思考模式,做到了一个领先,把预训练数据量一下子拉到了30多T的水平,上一个拉到这个水平的Llama 4已经落后了。”杭州久痕科技创始人、CEO汪源认为,Qwen3在性价比上有了巨大的提升,但是在多模态和长上下文方面还要加大力度去完善。

从技术架构到商业模式,从开源生态到行业应用,Qwen3的发布为市场提供了一个观察阿里AI战略的窗口。

既“聪明”又“经济”

回溯过去,阿里推出初代Qwen时,是国内第一波推出自研大模型的厂商之一。随着Qwen2.5系列在2024年发布,特别是基于MoE架构的Qwen2.5-Max在多模态评测中表现突出,通义千问已经跻身全球第一梯队。而Qwen3的推出,也显示了该系列模型在性能与效率上达到了新的高度。

据悉,Qwen3是国内首个“混合推理模型”,创新性地将“快思考”与“慢思考”集成于一体。这种设计借鉴了认知科学的双系统理论,使模型能够根据任务复杂度动态调整计算资源——简单任务(如日常问答)采用快速响应模式,复杂任务(如数学证明、代码生成)则启用深度推理模块。

在预训练方面,Qwen3的数据集相比Qwen2.5有了显著扩展。Qwen2.5是在18万亿个token上进行预训练的,而Qwen3使用的数据量几乎是其两倍,达到了约36万亿个token,涵盖了119种语言和方言。

此外,Qwen3的性能与成本优势也非常明显。其总参数量为235B,激活仅需22B。部署成本大幅下降,仅需4张H20即可部署Qwen3满血版,显存占用仅为性能相近模型的三分之一,但性能却全面超越了R1、OpenAI-o1等全球顶尖模型。

在多项权威基准测试中,该模型取得了突破性成绩:在奥数水平的AIME25测评中,Qwen3斩获81.5分,刷新开源纪录;在考察代码能力的LiveCodeBench评测中,Qwen3突破70分大关,表现甚至超过Grok3;在评估模型人类偏好对齐的ArenaHard测评中,Qwen3以95.6分超越OpenAI-o1及DeepSeek-R1。

阿里也延续了此前的开源策略,Qwen3采用Apache 2.0许可证开源,允许免费商用,这一策略与Meta的Llama系列形成直接竞争。根据公开数据,截至目前,通义千问模型家族全球下载量已突破3亿次,衍生模型超过10万个,超越了Llama成为全球最大的开源模型生态。

在AI这个时代级的机遇之下,多方力量的博弈很难让一家闭源厂商始终稳居上风。有观点认为,未来的AI胜利者,不会是那些试图通过封闭技术维持优势的公司,而是那些能够有效利用开放生态创造价值的企业。

“开源具有更深层的意义,即推动技术的普及和民主化。”沙利文大中华区执行总监崔楠表示,大厂通过开源降低了用户进入门槛,这种技术的普惠性不仅加速了AI技术的渗透率,也为整个行业的快速发展注入了活力。

开源策略的效果也立竿见影——Qwen3一经发布,在Hugging Face、GitHub等开发者社区迅速获得了不错的反响。截至目前,Qwen3在GitHub星标数已突破19k。

旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与一众顶级模型相比,表现出极具竞争力的结果。

落地野望

就在Qwen3发布同月,马云在内部讲话中强调,“高科技绝不仅是征服星辰大海,更应该呵护人间烟火”,这揭示了阿里AI的落地哲学——不单纯追求实验室指标,而是聚焦场景的实际价值。

当全球AI竞赛进入深水区,阿里也很清晰,真正的竞争力不在于参数规模的军备竞赛,而在于技术普惠与商业价值的闭环。

在大模型商业化落地上,Qwen3展现出了较强的突破性。其MoE架构显著降低了推理成本,并在推理机制上实现了思考与非思考模式的灵活切换,从而在推理效率和推理成本之间寻求到了较为平衡的状态。

Qwen3还有一个“思考预算”设置——开发者可以自己设定深度思考的最大token消耗,这能更好满足不同开发者对性能和成本的需求。

在模型矩阵布局上,阿里推出了多款不同参数的模型,包括两款30B和235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。开发者能够根据自身需求选择合适的模型,极大地提高了应用的可行性。例如,4B模型面向手机端,8B可在电脑和汽车端侧部署应用,32B则最受企业大规模部署欢迎。

尤其值得注意的是,Qwen3-4B的性能已媲美上一代72B模型,而Qwen3-30B-A3B的激活参数仅为QwQ-32B的10%,却表现更优,这意味着中小企业能以更低成本获得接近顶级模型的效能。

“通过降低大模型开发成本和优化端侧部署技术,能够显著带动更多智能终端设备的AI化升级和市场普及。”IDC中国研究总监潘雪菲表示。

Qwen3也为即将到来的智能体Agent和大模型应用爆发提供了支持。在评估模型Agent能力的BFCL评测中,Qwen3创下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等顶尖模型,将大幅降低Agent调用工具的门槛。

同时,Qwen3原生支持MCP协议,并具备强大的工具调用(function calling)能力,结合封装了工具调用模板和工具调用解析器的Qwen-Agent框架,将大大降低编码复杂性,实现高效的手机及电脑Agent操作等任务。

此前,通义千问与此前“爆火”的AI Agent Manus达成战略合作。“国产大模型与创新应用开始深度融合。”IDC中国高级分析师杨雯分析称,“大厂技术底座+初创应用创新”的模式将加速了国产模型的商业化落地,也为行业提供了技术协同的范例。

而对于阿里来说,这也是其整体AI战略的关键一环。

阿里最新财报显示,截至2024年12月31日的季度,云智能集团收入为317.42亿元(43.49亿美元),同比增长13%,相比上一季度7%的增速接近翻倍。AI相关产品收入连续六个季度实现三位数的同比增长。站在新技术周期的起点,AI有望成为阿里巴巴面向未来的新增长引擎。

未来,随着3800亿元投入的逐步释放,阿里的AI布局会进一步深化。可能的发展方向包括强化智能体能力、拓展多模态技术、加强垂直行业应用,特别是在金融、医疗、制造等领域的专业化落地。

Qwen3不会是终点,而是一个新起点——在AI驱动的新周期里,技术突破与商业创新的互动将愈发紧密。

文/董静怡 陶力

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
全面停止进口,一票否决!日本彻底傻眼,三十五年布局白费!

全面停止进口,一票否决!日本彻底傻眼,三十五年布局白费!

小曙说娱
2025-11-30 01:23:05
古特雷斯:联合国安理会“已不再代表世界”,并且是“无效的”

古特雷斯:联合国安理会“已不再代表世界”,并且是“无效的”

我心纵横天地间
2026-01-20 12:47:03
陈行甲回应俞敏洪150万年薪邀请:我加入新东方,他加入恒晖|封面头条

陈行甲回应俞敏洪150万年薪邀请:我加入新东方,他加入恒晖|封面头条

封面新闻
2026-01-20 11:49:04
明朝一男子将私房钱藏于木雕中,藏了600年,几任收藏家都没发现

明朝一男子将私房钱藏于木雕中,藏了600年,几任收藏家都没发现

铭记历史呀
2025-12-30 18:14:57
直到70岁米雪秒了54岁陈松伶,我才明白什么是:有钱难买老来俏!

直到70岁米雪秒了54岁陈松伶,我才明白什么是:有钱难买老来俏!

翰飞观事
2026-01-08 19:39:00
B站百万粉丝博主被封禁!疑似得罪米哈游被制裁

B站百万粉丝博主被封禁!疑似得罪米哈游被制裁

游民星空
2026-01-18 12:09:16
英特尔涨幅扩大至6%

英特尔涨幅扩大至6%

每日经济新闻
2026-01-20 23:35:03
李亚鹏的拎壶冲酒获支持,网友:这酒现在送礼老有牌面

李亚鹏的拎壶冲酒获支持,网友:这酒现在送礼老有牌面

映射生活的身影
2026-01-20 20:06:50
U23国足再创历史闯入亚洲杯决赛

U23国足再创历史闯入亚洲杯决赛

界面新闻
2026-01-21 01:31:02
什么叫洗钱?网友:比亚迪造卫星一年20亿,拍一个减肥电影要3亿

什么叫洗钱?网友:比亚迪造卫星一年20亿,拍一个减肥电影要3亿

夜深爱杂谈
2025-12-11 20:39:39
知名作家杜子建:嘲讽过李亚鹏的人,都欠他一个道歉,他配享太庙

知名作家杜子建:嘲讽过李亚鹏的人,都欠他一个道歉,他配享太庙

社会日日鲜
2026-01-20 05:48:59
王励勤出手了!国乒大洗牌重点培养5位选手 孙颖莎王楚钦陷入两难

王励勤出手了!国乒大洗牌重点培养5位选手 孙颖莎王楚钦陷入两难

做一个合格的吃瓜群众
2026-01-17 16:38:59
秦岚和王思聪的瓜,惊呆了!

秦岚和王思聪的瓜,惊呆了!

LULU生活家
2026-01-20 19:08:08
保护自己最好的方法:所有舒服的关系,都源于对彼此没有期待

保护自己最好的方法:所有舒服的关系,都源于对彼此没有期待

杏花烟雨江南的碧园
2026-01-18 13:06:24
出游:一场有意的“出神”

出游:一场有意的“出神”

疾跑的小蜗牛
2026-01-20 21:33:59
谋财害命的中药注射液,早该被清理进历史的垃圾堆

谋财害命的中药注射液,早该被清理进历史的垃圾堆

老爸讲科学
2025-10-20 16:11:11
与库尔德武装达成全面整合协议,叙过渡政府取得后阿萨德时代重大胜利

与库尔德武装达成全面整合协议,叙过渡政府取得后阿萨德时代重大胜利

澎湃新闻
2026-01-19 19:16:27
中央定调!退休新规实施,公务员事业单位不能申请延退,啥原因?

中央定调!退休新规实施,公务员事业单位不能申请延退,啥原因?

社保小达人
2026-01-20 10:50:09
一生坦诚!聂卫平出书谈自己的情感经历,初恋竟让其抛弃原配娶她

一生坦诚!聂卫平出书谈自己的情感经历,初恋竟让其抛弃原配娶她

情感大头说说
2026-01-21 00:19:09
山东硬汉最爱的啤酒“白月光”,引爆一颗巨雷

山东硬汉最爱的啤酒“白月光”,引爆一颗巨雷

金错刀
2026-01-19 16:14:47
2026-01-21 02:51:00
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
229770文章数 743593关注度
往期回顾 全部

科技要闻

收藏|这可能是CES2026最清醒一份复盘

头条要闻

丹麦首相:主权不谈判 准备贸易战

头条要闻

丹麦首相:主权不谈判 准备贸易战

体育要闻

勇士遭暴击!巴特勒重伤赛季报销

娱乐要闻

网红版闫学晶!600万粉博主阿爆翻车

财经要闻

李迅雷:2026买房不如租房

汽车要闻

奇瑞张贵兵:墨甲不做秀技术的企业 只做痛点终结者

态度原创

数码
健康
教育
家居
军事航空

数码要闻

行业唯一!红魔电竞平板3 Pro GOLDEN SAGA发布:镀金VC、24GB+1TB存储

血常规3项异常,是身体警报!

教育要闻

学习不再靠死磕,是从初二开始的

家居要闻

隽永之章 清雅无尘

军事要闻

德军13人前脚刚走 荷兰2名军人也撤离格陵兰岛

无障碍浏览 进入关怀版