网易首页 > 网易号 > 正文 申请入驻

通义千问深夜“王炸”更新!Qwen3升级版全面超越Kimi-K2,Agent能力亮眼

0
分享至

国内的AI大模型竞赛,再次被按下了加速键!

AI圈的小伙伴们可能还记得,几天前Kimi-K2的开源还在被津津乐道。然而,开源的王座,热度还没持续几天,就迎来了新的挑战者。

7月22日凌晨,阿里巴巴通义千问团队突然发布了旗舰模型Qwen3的重磅更新,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为Qwen3-235B-A22B-Instruct-2507-FP8。

新版本模型在多项核心能力上实现了惊人飞跃,不仅全面超越了Kimi-K2等顶级开源模型,甚至领先Claude-Opus4-Non-thinking等顶级闭源模型。

性能“爆表”,这次升级有多猛?

根据官方发布的数据,新模型的通用能力获得了全方位强化,在多个权威测评中表现极其亮眼:

包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面,在GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多测评中表现出色,超过Kimi-K2、DeepSeek-V3等顶级开源模型以及Claude-Opus4-Non-thinking等领先闭源模型。

值得一提的是,本次更新的Qwen3模型在Agent能力尤其亮眼:在BFCL(Agent能力)测评中表现卓越。这意味着模型在理解复杂指令、自主规划、调用工具以完成任务的能力上,达到了一个新的高度。“主打Agent”,将是未来AI应用的核心竞争力。


除了硬核的跑分,这次更新还带来了三大“体感”升级:

-在多语言的长尾知识覆盖方面,模型取得显著进步。
-在主观及开放性任务中,模型显著增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本。
-长文本提升到256K,上下文理解能力进一步增强。
告别“混合思维”,分离训练有多强?

这次最核心的变化,是技术路线的革新。

通义千问团队宣布,正式告别此前的“混合思维模式”,迈向全新的“分离训练”时代。他们将用于直接回答的Instruct模型和用于复杂思考的Thinking模型进行独立训练。


简单来说,就是让“快思考”和“慢思考”各司其职,从而在各自的领域都做到极致。

本次发布的 Qwen3-235B-A22B-Instruct-2507-FP8 ,就是“快思考”路线下的最新成果。它主打非思考模式(Non-thinking),追求的是在指令遵循、文本理解和知识问答等任务上,做到更快、更准、更强~

开源圈“卷”出新高度,大招还在后头!

从Kimi-K2到DeepSeek-V3,再到今天的Qwen3新版,国内的开源AI竞赛已经进入白热化阶段。每一次更新都伴随着性能的飞跃和王座的更迭。

更让人激动的是,通义千问团队在发布更新的同时,还留下了一个悬念:

“还有大招,马上就要来了!”

这不禁让人猜想,分离训练的另一端——专注于复杂推理的“Thinking”模型是否也已在路上?

目前,最新的Qwen3模型已在魔搭社区(ModelScope)和HuggingFace全面开源更新。如果你是AI开发者或爱好者,现在就可以去亲身体验这个“开源新王”的威力了

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
真的佩服我们公司的主管!

真的佩服我们公司的主管!

太急张三疯
2026-01-16 06:28:07
1月13日,美军展示了一个照片,几乎等于承认和中方没法打!

1月13日,美军展示了一个照片,几乎等于承认和中方没法打!

安安说
2026-01-15 14:30:22
重返伯纳乌或迎球迷巨大嘘声,马卡头版:伯纳乌的“火灾隐患”

重返伯纳乌或迎球迷巨大嘘声,马卡头版:伯纳乌的“火灾隐患”

懂球帝
2026-01-17 10:22:31
1-1大冷门,英超第4遭英超第19逼平,索博斯洛伊失点酿苦果

1-1大冷门,英超第4遭英超第19逼平,索博斯洛伊失点酿苦果

侧身凌空斩
2026-01-18 01:01:56
吃他汀为何不能喝西柚汁,桔子和橙子可以吃吗?医生讲清楚

吃他汀为何不能喝西柚汁,桔子和橙子可以吃吗?医生讲清楚

重症医生张伟
2026-01-17 06:58:18
女人染上“性瘾”是一种怎样的体验?可能和你想象得不同

女人染上“性瘾”是一种怎样的体验?可能和你想象得不同

纸上的心语
2025-11-23 11:36:00
前TVB男星前女友宣布切除子宫:谢谢自己果断勇敢

前TVB男星前女友宣布切除子宫:谢谢自己果断勇敢

TVB剧评社
2026-01-17 10:13:13
“突然不能动了”!沈阳市第四人民医院医生深夜取栓出鞘!

“突然不能动了”!沈阳市第四人民医院医生深夜取栓出鞘!

周哥一影视
2026-01-17 10:23:29
很多家庭都没意识到,最容易改变家族命运的,其实是女儿!

很多家庭都没意识到,最容易改变家族命运的,其实是女儿!

夜深爱杂谈
2026-01-16 21:08:16
RMC:巴黎激活巴萨小将德罗解约条款只差手续,弗里克很愤怒

RMC:巴黎激活巴萨小将德罗解约条款只差手续,弗里克很愤怒

懂球帝
2026-01-18 01:35:13
罗永浩声明:决定和西贝和解!但是他结尾说的一句话,让网友后怕

罗永浩声明:决定和西贝和解!但是他结尾说的一句话,让网友后怕

晴晴的娱乐日记
2025-09-15 22:22:29
北京连下六道命令拆秦岭别墅,陕西顶了四年不动,749局:我来拆

北京连下六道命令拆秦岭别墅,陕西顶了四年不动,749局:我来拆

小哥很OK
2025-11-24 22:07:07
被猛龙冲垮了!快船锋线老将确实不太适合出现在这样的比赛中?

被猛龙冲垮了!快船锋线老将确实不太适合出现在这样的比赛中?

稻谷与小麦
2026-01-18 00:33:14
对话挖出古剑上交博物馆男子:工作忙挖出10天后才交 博物馆多次提醒注意安全

对话挖出古剑上交博物馆男子:工作忙挖出10天后才交 博物馆多次提醒注意安全

红星新闻
2026-01-17 15:57:21
她不愿意被潜规则,演了近百部戏观众却叫不出她名字,42岁仍单身

她不愿意被潜规则,演了近百部戏观众却叫不出她名字,42岁仍单身

丁丁鲤史纪
2025-12-27 16:10:28
热议U23国足点杀乌兹:土帅玩防守没这么成功过,李昊笑容代表自信

热议U23国足点杀乌兹:土帅玩防守没这么成功过,李昊笑容代表自信

懂球帝
2026-01-17 22:49:01
伊朗得到中国声援,特朗普当即调转枪口:对华加关税,马上执行!

伊朗得到中国声援,特朗普当即调转枪口:对华加关税,马上执行!

头条爆料007
2026-01-14 08:27:40
中国U23男足进亚洲杯四强!门将李昊一战封神,他凭什么这么强?

中国U23男足进亚洲杯四强!门将李昊一战封神,他凭什么这么强?

狸花小咪
2026-01-18 03:14:47
“下死命令了”:中小学配餐全取消,重塑孩子饭碗的 硬仗 打响了!

“下死命令了”:中小学配餐全取消,重塑孩子饭碗的 硬仗 打响了!

文雅笔墨
2026-01-18 01:26:22
风向变了?央媒公开点名闫学晶!文案信息量大,32岁儿子也被连累

风向变了?央媒公开点名闫学晶!文案信息量大,32岁儿子也被连累

林木体育解说
2026-01-17 11:22:08
2026-01-18 05:35:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
140266文章数 2652169关注度
往期回顾 全部

科技要闻

两枚火箭发射失利,具体原因正排查

头条要闻

李昊发挥神勇 U23国足点球战胜乌兹别克斯坦晋级四强

头条要闻

李昊发挥神勇 U23国足点球战胜乌兹别克斯坦晋级四强

体育要闻

三巨头走了俩,联盟笑柄却起飞了

娱乐要闻

马年春晚首次联排场外细节!

财经要闻

保不准,人民币会闪击6.8!

汽车要闻

林肯贾鸣镝:稳中求进,将精细化运营进行到底

态度原创

家居
游戏
时尚
教育
公开课

家居要闻

岁月柔情 现代品质轻奢

这下好了,英伦侦探风也给老钟玩懂了"/> 主站 商城 论坛 自运营 登录 注册 这下好了,英伦侦探风也给老钟玩懂了 廉颇 2026-01-17 返回专栏...

“这个风格”今年冬天又火了!谁穿谁高级

教育要闻

颠鸾倒凤神魂颠倒混天黑地吸小册子下周上线

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版