网易首页 > 网易号 > 正文 申请入驻

通义千问深夜“王炸”更新!Qwen3升级版全面超越Kimi-K2,Agent能力亮眼

0
分享至

国内的AI大模型竞赛,再次被按下了加速键!

AI圈的小伙伴们可能还记得,几天前Kimi-K2的开源还在被津津乐道。然而,开源的王座,热度还没持续几天,就迎来了新的挑战者。

7月22日凌晨,阿里巴巴通义千问团队突然发布了旗舰模型Qwen3的重磅更新,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为Qwen3-235B-A22B-Instruct-2507-FP8。

新版本模型在多项核心能力上实现了惊人飞跃,不仅全面超越了Kimi-K2等顶级开源模型,甚至领先Claude-Opus4-Non-thinking等顶级闭源模型。

性能“爆表”,这次升级有多猛?

根据官方发布的数据,新模型的通用能力获得了全方位强化,在多个权威测评中表现极其亮眼:

包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面,在GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多测评中表现出色,超过Kimi-K2、DeepSeek-V3等顶级开源模型以及Claude-Opus4-Non-thinking等领先闭源模型。

值得一提的是,本次更新的Qwen3模型在Agent能力尤其亮眼:在BFCL(Agent能力)测评中表现卓越。这意味着模型在理解复杂指令、自主规划、调用工具以完成任务的能力上,达到了一个新的高度。“主打Agent”,将是未来AI应用的核心竞争力。


除了硬核的跑分,这次更新还带来了三大“体感”升级:

-在多语言的长尾知识覆盖方面,模型取得显著进步。
-在主观及开放性任务中,模型显著增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本。
-长文本提升到256K,上下文理解能力进一步增强。
告别“混合思维”,分离训练有多强?

这次最核心的变化,是技术路线的革新。

通义千问团队宣布,正式告别此前的“混合思维模式”,迈向全新的“分离训练”时代。他们将用于直接回答的Instruct模型和用于复杂思考的Thinking模型进行独立训练。


简单来说,就是让“快思考”和“慢思考”各司其职,从而在各自的领域都做到极致。

本次发布的 Qwen3-235B-A22B-Instruct-2507-FP8 ,就是“快思考”路线下的最新成果。它主打非思考模式(Non-thinking),追求的是在指令遵循、文本理解和知识问答等任务上,做到更快、更准、更强~

开源圈“卷”出新高度,大招还在后头!

从Kimi-K2到DeepSeek-V3,再到今天的Qwen3新版,国内的开源AI竞赛已经进入白热化阶段。每一次更新都伴随着性能的飞跃和王座的更迭。

更让人激动的是,通义千问团队在发布更新的同时,还留下了一个悬念:

“还有大招,马上就要来了!”

这不禁让人猜想,分离训练的另一端——专注于复杂推理的“Thinking”模型是否也已在路上?

目前,最新的Qwen3模型已在魔搭社区(ModelScope)和HuggingFace全面开源更新。如果你是AI开发者或爱好者,现在就可以去亲身体验这个“开源新王”的威力了

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
从2-0到2-2,惨遭补时绝平,穆里尼奥不敢相信,争冠难度变大

从2-0到2-2,惨遭补时绝平,穆里尼奥不敢相信,争冠难度变大

足球狗说
2025-11-10 06:47:07
周锡玮痛批蒋万安取消上海台北双城论坛愚蠢,上海没必要放低身段

周锡玮痛批蒋万安取消上海台北双城论坛愚蠢,上海没必要放低身段

蓝色海边
2025-11-10 12:47:19
19分大逆转!亚历山大35+7+6破纪录不可怕 卫冕冠军吓人的是这4点

19分大逆转!亚历山大35+7+6破纪录不可怕 卫冕冠军吓人的是这4点

锅子篮球
2025-11-10 12:30:54
吴亦凡现状曝光!在监狱度过14年自由时光,出狱后将面临化学阉割

吴亦凡现状曝光!在监狱度过14年自由时光,出狱后将面临化学阉割

八星人
2025-11-10 15:30:59
李嘉诚曾和梁洛施私下做交易,不把3个孙子纳入李家,是一种算计

李嘉诚曾和梁洛施私下做交易,不把3个孙子纳入李家,是一种算计

娱乐团长
2025-11-09 14:33:37
接连传来喜讯!佩通坦压力困境终现转机?

接连传来喜讯!佩通坦压力困境终现转机?

艾米手工作品
2025-11-10 14:02:31
上海男篮6分惜败,闫鹏飞14+11独木难支,浙江与四川会师半决赛

上海男篮6分惜败,闫鹏飞14+11独木难支,浙江与四川会师半决赛

替补席看球
2025-11-10 17:54:15
惊艳全球!新机曝光:10000mAh+骁龙8 Gen5+2亿潜望长焦!

惊艳全球!新机曝光:10000mAh+骁龙8 Gen5+2亿潜望长焦!

科技堡垒
2025-11-09 11:58:07
全红婵自己都没想到!世界泳联会给她那么大惊喜!从冠军变成传奇

全红婵自己都没想到!世界泳联会给她那么大惊喜!从冠军变成传奇

乐悠悠娱乐
2025-11-10 15:23:53
中央定调,退休新规,1965年到1969年期间出生,退休或将更受益?

中央定调,退休新规,1965年到1969年期间出生,退休或将更受益?

花心电影
2025-11-10 18:14:34
拿600万,全场2分1板,他和廖三宁坑惨北京队,遭许利民果断弃用

拿600万,全场2分1板,他和廖三宁坑惨北京队,遭许利民果断弃用

南海浪花
2025-11-10 18:20:41
A股:大家要做好心理准备,明天,11月11日,股市大概要这样走了

A股:大家要做好心理准备,明天,11月11日,股市大概要这样走了

振华观史
2025-11-10 16:05:44
高市早苗闯了大祸,日方意识到大事不妙,琉球怕是保不住

高市早苗闯了大祸,日方意识到大事不妙,琉球怕是保不住

闻识
2025-11-10 14:49:48
快递员河边救下一儿童,却被拘留7天,获释后被救者一家五口被灭门

快递员河边救下一儿童,却被拘留7天,获释后被救者一家五口被灭门

悬案解密档案
2025-11-06 10:39:29
中国证监会、财政部最新公布

中国证监会、财政部最新公布

新财资讯
2025-11-10 18:10:22
硬气!我外交官发大火,警告“斩首”高市早苗:你做好觉悟了吗?

硬气!我外交官发大火,警告“斩首”高市早苗:你做好觉悟了吗?

潮鹿逐梦
2025-11-10 12:06:44
我们为什么不愿意在举办奥运会了?事情坏就坏在国际奥委会自身。

我们为什么不愿意在举办奥运会了?事情坏就坏在国际奥委会自身。

百态人间
2025-10-18 11:53:06
脱口秀乱象即将终结!杨笠清空账号企图避难,官方下场惩治邪祟

脱口秀乱象即将终结!杨笠清空账号企图避难,官方下场惩治邪祟

阿讯说天下
2025-11-09 14:45:28
假如日本出兵介入台海,中国大陆可以攻打日本本土吗?

假如日本出兵介入台海,中国大陆可以攻打日本本土吗?

知鉴明史
2025-10-26 08:30:03
52岁TVB演员为救妻子,哭求捐款70万后续:陈晓东出手了,真仗义

52岁TVB演员为救妻子,哭求捐款70万后续:陈晓东出手了,真仗义

涵豆说娱
2025-11-10 14:27:41
2025-11-10 19:59:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
137288文章数 2651389关注度
往期回顾 全部

科技要闻

荷兰“玩脱”后,大众本田终于拿到芯片了

头条要闻

媒体:郑丽文出席吴石追思会令两岸震惊 岛内一片哗然

头条要闻

媒体:郑丽文出席吴石追思会令两岸震惊 岛内一片哗然

体育要闻

战绩崩盘!东契奇交易余震撕裂独行侠

娱乐要闻

51岁周迅的现状 给中年女性提了个醒?

财经要闻

最终,万科只成全了一个人

汽车要闻

智能又务实 奇瑞瑞虎9X不只有性价比

态度原创

教育
时尚
房产
数码
本地

教育要闻

【媒体聚焦】羊城晚报·羊城派 | 209名广东中职“青椒”赛场炫绝活:“猪模”能说话,蛋壳上跳芭蕾

上新|| 秋冬也可以穿的漂亮小裙子,美到心动

房产要闻

封关倒计时!三亚主城 2.3 万 /㎡+ 即买即住,手慢无!

数码要闻

中端对高端竟然不虚?锐龙7 9700X对比Ultra 9 285K游戏实战

本地新闻

这届干饭人,已经把博物馆吃成了食堂

无障碍浏览 进入关怀版