网易首页 > 网易号 > 正文 申请入驻

通义千问深夜“王炸”更新!Qwen3升级版全面超越Kimi-K2,Agent能力亮眼

0
分享至

国内的AI大模型竞赛,再次被按下了加速键!

AI圈的小伙伴们可能还记得,几天前Kimi-K2的开源还在被津津乐道。然而,开源的王座,热度还没持续几天,就迎来了新的挑战者。

7月22日凌晨,阿里巴巴通义千问团队突然发布了旗舰模型Qwen3的重磅更新,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为Qwen3-235B-A22B-Instruct-2507-FP8。

新版本模型在多项核心能力上实现了惊人飞跃,不仅全面超越了Kimi-K2等顶级开源模型,甚至领先Claude-Opus4-Non-thinking等顶级闭源模型。

性能“爆表”,这次升级有多猛?

根据官方发布的数据,新模型的通用能力获得了全方位强化,在多个权威测评中表现极其亮眼:

包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面,在GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多测评中表现出色,超过Kimi-K2、DeepSeek-V3等顶级开源模型以及Claude-Opus4-Non-thinking等领先闭源模型。

值得一提的是,本次更新的Qwen3模型在Agent能力尤其亮眼:在BFCL(Agent能力)测评中表现卓越。这意味着模型在理解复杂指令、自主规划、调用工具以完成任务的能力上,达到了一个新的高度。“主打Agent”,将是未来AI应用的核心竞争力。

除了硬核的跑分,这次更新还带来了三大“体感”升级:

-在多语言的长尾知识覆盖方面,模型取得显著进步。
-在主观及开放性任务中,模型显著增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本。
-长文本提升到256K,上下文理解能力进一步增强。
告别“混合思维”,分离训练有多强?

这次最核心的变化,是技术路线的革新。

通义千问团队宣布,正式告别此前的“混合思维模式”,迈向全新的“分离训练”时代。他们将用于直接回答的Instruct模型和用于复杂思考的Thinking模型进行独立训练。

简单来说,就是让“快思考”和“慢思考”各司其职,从而在各自的领域都做到极致。

本次发布的 Qwen3-235B-A22B-Instruct-2507-FP8 ,就是“快思考”路线下的最新成果。它主打非思考模式(Non-thinking),追求的是在指令遵循、文本理解和知识问答等任务上,做到更快、更准、更强~

开源圈“卷”出新高度,大招还在后头!

从Kimi-K2到DeepSeek-V3,再到今天的Qwen3新版,国内的开源AI竞赛已经进入白热化阶段。每一次更新都伴随着性能的飞跃和王座的更迭。

更让人激动的是,通义千问团队在发布更新的同时,还留下了一个悬念:

“还有大招,马上就要来了!”

这不禁让人猜想,分离训练的另一端——专注于复杂推理的“Thinking”模型是否也已在路上?

目前,最新的Qwen3模型已在魔搭社区(ModelScope)和HuggingFace全面开源更新。如果你是AI开发者或爱好者,现在就可以去亲身体验这个“开源新王”的威力了

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
兄弟仨凑80万买挖掘机,用了不到半年被人偷光,报警后车主懵了

兄弟仨凑80万买挖掘机,用了不到半年被人偷光,报警后车主懵了

阿伧说事
2026-05-11 19:23:22
蚕豆被点名!医生发现:吃得越多,高血压患者寿命或越短?真的吗

蚕豆被点名!医生发现:吃得越多,高血压患者寿命或越短?真的吗

路医生健康科普
2026-05-12 17:38:25
东契奇官方声明:今夏将与前女友争女儿抚养权 不会参加世预赛

东契奇官方声明:今夏将与前女友争女儿抚养权 不会参加世预赛

醉卧浮生
2026-05-12 14:06:08
最新 | 47岁资本大佬,涉嫌刑事犯罪!

最新 | 47岁资本大佬,涉嫌刑事犯罪!

天津广播
2026-05-12 12:17:43
又一个郭晶晶?退役后嫁顶级豪门,7年连生4娃,如今已是顶级阔太

又一个郭晶晶?退役后嫁顶级豪门,7年连生4娃,如今已是顶级阔太

珺瑶婉史
2026-05-03 19:20:12
心有不甘!日乒主帅盛赞梁靖崑的同时,直言张本智和是输球责任人

心有不甘!日乒主帅盛赞梁靖崑的同时,直言张本智和是输球责任人

探索新高度
2026-05-12 09:29:12
詹姆斯:系列赛失利的伤痛还很新鲜 不知道未来对我意味着什么

詹姆斯:系列赛失利的伤痛还很新鲜 不知道未来对我意味着什么

北青网-北京青年报
2026-05-12 20:26:19
陈海涛给广东队开出了巨额奖金!

陈海涛给广东队开出了巨额奖金!

体育哲人
2026-05-12 18:04:38
“45岁独身男子病逝15万存款被民政局转走”,当地回应:民政局从未经手该笔资金,系另一亲属所为,警方已赴外地调查

“45岁独身男子病逝15万存款被民政局转走”,当地回应:民政局从未经手该笔资金,系另一亲属所为,警方已赴外地调查

极目新闻
2026-05-12 14:27:27
安徽将迎中雨大雨

安徽将迎中雨大雨

网易安徽
2026-05-12 18:28:47
《放羊的星星》男演员李威卷入精舍杀人案,被判1年10个月有期徒刑,缓刑5年

《放羊的星星》男演员李威卷入精舍杀人案,被判1年10个月有期徒刑,缓刑5年

蓬勃新闻
2026-05-12 13:02:22
不断挑拨离间!小玥儿忍无可忍,一个动作揭开了与马筱梅的关系

不断挑拨离间!小玥儿忍无可忍,一个动作揭开了与马筱梅的关系

观察鉴娱
2026-05-12 09:28:50
“5000陪我一晚上有时间吗?” 沪上阿姨一员工用企业账号向顾客发送“有偿陪睡”信息,沪上阿姨:账号疑似被异地盗用,现警方已立案

“5000陪我一晚上有时间吗?” 沪上阿姨一员工用企业账号向顾客发送“有偿陪睡”信息,沪上阿姨:账号疑似被异地盗用,现警方已立案

扬子晚报
2026-05-12 15:33:56
还没出发前,特朗普就提出要求:中国向美采购小麦,为何这么急迫?

还没出发前,特朗普就提出要求:中国向美采购小麦,为何这么急迫?

麓谷隐士
2026-05-12 10:52:08
京沪高铁宣布“涨价”20%,二等座最高票价可超过800元

京沪高铁宣布“涨价”20%,二等座最高票价可超过800元

上观新闻
2026-05-12 08:38:08
巴基斯坦法塔赫-3火力全开,原来是中国HD-1导弹换了个马甲

巴基斯坦法塔赫-3火力全开,原来是中国HD-1导弹换了个马甲

瞩望云霄
2026-05-12 18:58:10
中国最大敌人,不是日本也非美国,而是裹着漂亮外衣的“自己人”

中国最大敌人,不是日本也非美国,而是裹着漂亮外衣的“自己人”

混沌录
2026-05-12 15:20:15
兵败如山倒!国产新能源或已经证明:中国压根不需要二线豪华品牌

兵败如山倒!国产新能源或已经证明:中国压根不需要二线豪华品牌

蜉蝣说
2026-05-12 11:08:06
特朗普访华底牌提前泄露:只要能卖大豆、买稀土,对台立场可松口

特朗普访华底牌提前泄露:只要能卖大豆、买稀土,对台立场可松口

谷盟1
2026-05-12 12:04:27
青海17岁女学生溺亡!主动去的桥边,知情人曝猛料,恐不止是意外

青海17岁女学生溺亡!主动去的桥边,知情人曝猛料,恐不止是意外

北纬的咖啡豆
2026-05-12 11:29:42
2026-05-12 20:48:49
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
145959文章数 2653532关注度
往期回顾 全部

科技要闻

宇树发布载人变形机甲,定价390万元起

头条要闻

男子自带挖掘机为社区修路坠崖身亡 社区不认可系工亡

头条要闻

男子自带挖掘机为社区修路坠崖身亡 社区不认可系工亡

体育要闻

总是掉链子的“倒霉蛋”,闯进了欧战决赛

娱乐要闻

白鹿风波升级!掉粉20万评论区沦陷

财经要闻

黄仁勋真是被白宫彻底封杀了

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

艺术
旅游
亲子
手机
教育

艺术要闻

这位画家的油画美人让人惊叹不已!

旅游要闻

上海赴金门旅游正式重启,金门在沪发布4大特色主题线路

亲子要闻

amh值0.95怎么调理?吃什么可以让卵泡长得好又大又圆?

手机要闻

华为鸿蒙HarmonyOS 6.1.1 (24)开发者Beta版开启推送

教育要闻

绵阳科技城新区、游仙区、江油发布2026年义务教育招生公告(附划片范围、招生计划)

无障碍浏览 进入关怀版