网易首页 > 网易号 > 正文 申请入驻

通义千问深夜“王炸”更新!Qwen3升级版全面超越Kimi-K2,Agent能力亮眼

0
分享至

国内的AI大模型竞赛,再次被按下了加速键!

AI圈的小伙伴们可能还记得,几天前Kimi-K2的开源还在被津津乐道。然而,开源的王座,热度还没持续几天,就迎来了新的挑战者。

7月22日凌晨,阿里巴巴通义千问团队突然发布了旗舰模型Qwen3的重磅更新,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为Qwen3-235B-A22B-Instruct-2507-FP8。

新版本模型在多项核心能力上实现了惊人飞跃,不仅全面超越了Kimi-K2等顶级开源模型,甚至领先Claude-Opus4-Non-thinking等顶级闭源模型。

性能“爆表”,这次升级有多猛?

根据官方发布的数据,新模型的通用能力获得了全方位强化,在多个权威测评中表现极其亮眼:

包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面,在GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多测评中表现出色,超过Kimi-K2、DeepSeek-V3等顶级开源模型以及Claude-Opus4-Non-thinking等领先闭源模型。

值得一提的是,本次更新的Qwen3模型在Agent能力尤其亮眼:在BFCL(Agent能力)测评中表现卓越。这意味着模型在理解复杂指令、自主规划、调用工具以完成任务的能力上,达到了一个新的高度。“主打Agent”,将是未来AI应用的核心竞争力。


除了硬核的跑分,这次更新还带来了三大“体感”升级:

-在多语言的长尾知识覆盖方面,模型取得显著进步。
-在主观及开放性任务中,模型显著增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本。
-长文本提升到256K,上下文理解能力进一步增强。
告别“混合思维”,分离训练有多强?

这次最核心的变化,是技术路线的革新。

通义千问团队宣布,正式告别此前的“混合思维模式”,迈向全新的“分离训练”时代。他们将用于直接回答的Instruct模型和用于复杂思考的Thinking模型进行独立训练。


简单来说,就是让“快思考”和“慢思考”各司其职,从而在各自的领域都做到极致。

本次发布的 Qwen3-235B-A22B-Instruct-2507-FP8 ,就是“快思考”路线下的最新成果。它主打非思考模式(Non-thinking),追求的是在指令遵循、文本理解和知识问答等任务上,做到更快、更准、更强~

开源圈“卷”出新高度,大招还在后头!

从Kimi-K2到DeepSeek-V3,再到今天的Qwen3新版,国内的开源AI竞赛已经进入白热化阶段。每一次更新都伴随着性能的飞跃和王座的更迭。

更让人激动的是,通义千问团队在发布更新的同时,还留下了一个悬念:

“还有大招,马上就要来了!”

这不禁让人猜想,分离训练的另一端——专注于复杂推理的“Thinking”模型是否也已在路上?

目前,最新的Qwen3模型已在魔搭社区(ModelScope)和HuggingFace全面开源更新。如果你是AI开发者或爱好者,现在就可以去亲身体验这个“开源新王”的威力了

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
波兰总统:作为历史学家,我深知中国为抗战胜利作出巨大牺牲和贡献

波兰总统:作为历史学家,我深知中国为抗战胜利作出巨大牺牲和贡献

观察者网
2025-09-15 23:34:04
好声音没夺冠,果断嫁爱奇艺总裁,今官宣离婚,给所有人上了一课

好声音没夺冠,果断嫁爱奇艺总裁,今官宣离婚,给所有人上了一课

古木之草记
2025-09-13 16:07:14
阿莫林:战绩惨淡引下课风波,继任者赔率榜出炉

阿莫林:战绩惨淡引下课风波,继任者赔率榜出炉

乐道足球
2025-09-15 16:42:54
哈工大深圳想单飞!更名“深圳工业大学”还是效仿地大、矿大模式

哈工大深圳想单飞!更名“深圳工业大学”还是效仿地大、矿大模式

东东趣谈
2025-09-15 16:37:14
李嗣镕:我很期待在中超登场;长得帅没给我造成压力

李嗣镕:我很期待在中超登场;长得帅没给我造成压力

懂球帝
2025-09-15 09:18:07
全球最小的发达国家,快被中国人“买”下了,中国移民占比87%!

全球最小的发达国家,快被中国人“买”下了,中国移民占比87%!

通文知史
2025-09-15 06:40:08
西媒:国际足联不满教练曼萨诺进入西甲裁判指派委员会

西媒:国际足联不满教练曼萨诺进入西甲裁判指派委员会

雷速体育
2025-09-15 17:51:13
26人被查,13人被处分

26人被查,13人被处分

大象新闻
2025-09-15 14:39:12
心梗、脑梗、脑出血突发!记住这3个“黄金求救法”,能救命!

心梗、脑梗、脑出血突发!记住这3个“黄金求救法”,能救命!

孟大夫之家1
2025-08-26 20:00:38
轰31+10!中国男篮又一20岁2米新星崛起:连夺MVP接班崔永熙吗?

轰31+10!中国男篮又一20岁2米新星崛起:连夺MVP接班崔永熙吗?

李喜林篮球绝杀
2025-09-15 16:50:57
高中生扶大妈遭讹15万,12年后大妈孙子考上清大,他在门口跪地求饶

高中生扶大妈遭讹15万,12年后大妈孙子考上清大,他在门口跪地求饶

罪案洞察者
2025-09-12 13:55:25
张学良10张经典照片,从9岁到100岁,看完他的一生!

张学良10张经典照片,从9岁到100岁,看完他的一生!

你我都是历史
2025-08-12 11:22:28
现实中出轨的人很多吗?网友:这种事不分男女穷富美丑,天性而已

现实中出轨的人很多吗?网友:这种事不分男女穷富美丑,天性而已

解读热点事件
2025-09-11 00:05:09
罗予彤贷款买上海百平房,2年没戏拍压力大到头发都白了

罗予彤贷款买上海百平房,2年没戏拍压力大到头发都白了

橙星文娱
2025-09-14 15:28:27
湖南63岁大爷,收留16岁女子,3年后产下一子,10年后,大爷却后悔了

湖南63岁大爷,收留16岁女子,3年后产下一子,10年后,大爷却后悔了

坦然风云
2025-07-15 20:29:34
1942年,工兵黄士伟埋地雷阻击日军时,突发大胆想法立下奇功!

1942年,工兵黄士伟埋地雷阻击日军时,突发大胆想法立下奇功!

抽象派大师
2025-09-15 06:23:31
77年洪学智被急召回京当选要职,邓华眼含热泪:我昨天才提出建议

77年洪学智被急召回京当选要职,邓华眼含热泪:我昨天才提出建议

南书房
2025-09-14 21:00:13
江苏31岁女子相亲见面3次男子望而却步  女子:每次都是花我的钱

江苏31岁女子相亲见面3次男子望而却步 女子:每次都是花我的钱

阿SIR观察
2025-09-15 10:39:57
张国伟主动投案,河南一周内三名正厅级干部通报被查

张国伟主动投案,河南一周内三名正厅级干部通报被查

澎湃新闻
2025-09-15 11:34:27
“全美进入紧急状态”,特朗普发出威胁

“全美进入紧急状态”,特朗普发出威胁

扬子晚报
2025-09-15 14:47:04
2025-09-16 01:04:49
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
135014文章数 2650743关注度
往期回顾 全部

科技要闻

官方:英伟达违反反垄断法 将施进一步调查

头条要闻

中美就TikTok等经贸问题在西班牙马德里举行会谈

头条要闻

中美就TikTok等经贸问题在西班牙马德里举行会谈

体育要闻

诺维茨基退役十年后,德国篮球走向巅峰

娱乐要闻

60岁张曼玉定居法国:瘦成皮包骨?

财经要闻

华与华秒怂 罗永浩称已接到对方道歉

汽车要闻

后轮转向和5C 2026款梦想家把想到的都给了

态度原创

家居
手机
游戏
公开课
军事航空

家居要闻

典雅大气 舒适中带童趣

手机要闻

魅族 22 发布!超窄边框+白色面板,「煤油」们会满意吗?

海外网友热议BLG击败TES:BLG将用更换打野的方式,赢得世界冠军

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

三人伪装"外卖员""钓鱼佬"窃取军事秘密 详情公布

无障碍浏览 进入关怀版