网易首页 > 网易号 > 正文 申请入驻

凌晨,Qwen又更新了,3090就能跑,3B激活媲美GPT-4o

0
分享至



机器之心报道

编辑:张倩

继前段时间密集发布了三款 AI 大模型后,Qwen 凌晨又更新了 —— 原本的 Qwen3-30B-A3B 有了一个新版本:Qwen3-30B-A3B-Instruct-2507

这个新版本是一个非思考模式(non-thinking mode)的新模型。它的亮点在于,仅激活 30 亿(3B)参数,就能展现出与业界顶尖闭源模型,如谷歌的 Gemini 2.5-Flash(非思考模式)和 OpenAI 的 GPT-4o 相媲美的超强实力,这标志着在模型效率和性能优化上的一次重大突破。

下图展示了该模型的性能数据,可以看出,与更新前的版本相比,新版本在多项测试中都实现了跨越式提升,比如 AIME25 从之前的 21.6 提升到了 61.3,Arena-Hard v2 成绩从 24.8 提升到了 69.0。



下图展示了新版本和 DeepSeek-V3-0324 等模型的性能对比结果,可以看到,在很多基准测试中,新版本模型可以基本追平甚至超过 DeepSeek-V3-0324。



这让人感叹模型计算效率的提升速度。



具体来说,Qwen3-30B-A3B-Instruct-2507 在诸多方面实现了关键提升:

  • 通用能力大幅提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多方面;
  • 在多语言的长尾知识覆盖方面,模型进步显著
  • 在主观和开放任务中,新模型与进一步紧密对齐了用户偏好,可以生成更高质量的文本,为用户提供更有帮助的回答;
  • 长文本理解能力提升至 256K



现在模型已经在魔搭社区和 HuggingFace 等平台开源。QwenChat 上也可以直接体验。

体验链接:http://chat.qwen.ai/

该模型发布后也很快得到了社区的支持,有了更多的使用渠道,甚至还有了量化版本。这就是开源的力量。





它的出现,让大家在消费级 GPU 上运行 AI 模型有了新的选择。



有人晒出了这个新版本在自己的 Mac 电脑、搭载 RTX 3090 的 PC 等设备上的运行体验。







如果你也想运行这个模型,可以参考这个配置要求:



值得注意的是,这次的新版本模型是一个非推理模型。著名开发者 Simon Willison 将该模型与他之前测试过的「推理」 模型(如 GLM-4.5 Air)进行了对比。他得出的核心结论是:对于生成「开箱即用」的复杂代码这类任务,模型是否具备「推理」能力可能是一个至关重要的因素。



Qwen 团队的这次更新依然在深夜进行,这让其他同行再次感觉被卷到了。不过,每天醒来都能看到 AI 的能力又上了一个新台阶,这本身就是一件激动人心的事。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
死里逃生—200名躲藏在拉法隧道内的哈马斯恐怖分子将被驱逐出境

死里逃生—200名躲藏在拉法隧道内的哈马斯恐怖分子将被驱逐出境

老王说正义
2025-11-13 00:04:03
全运会四强出炉,樊振东VS王楚钦,陈梦正面对决王曼昱,万众瞩目

全运会四强出炉,樊振东VS王楚钦,陈梦正面对决王曼昱,万众瞩目

球盲百小易
2025-11-14 01:25:12
该入选国家队,却未能入选,不该入选的却入选了国家队

该入选国家队,却未能入选,不该入选的却入选了国家队

大眼瞄世界
2025-11-14 08:21:34
教育局回应“成都学校能否自主错峰放春秋假?”:允许学校自行调休,安排免费托管

教育局回应“成都学校能否自主错峰放春秋假?”:允许学校自行调休,安排免费托管

爱看头条
2025-11-13 23:55:03
美媒:印度每40天就有一艘国产舰艇列装

美媒:印度每40天就有一艘国产舰艇列装

参考消息
2025-11-12 21:54:08
老人搭伙坚持AA制,60岁大妈:那是你的一家4口,与我无关

老人搭伙坚持AA制,60岁大妈:那是你的一家4口,与我无关

莎莉说情感
2025-11-13 17:35:03
一旦台海爆发冲突,最难的不是台湾,而是距大陆仅50公里的东引岛

一旦台海爆发冲突,最难的不是台湾,而是距大陆仅50公里的东引岛

放开他让wo来
2025-11-08 22:41:14
男子地铁站大便后续:身份曝出已社死,车企遭牵连!站点成打卡地

男子地铁站大便后续:身份曝出已社死,车企遭牵连!站点成打卡地

鋭娱之乐
2025-11-13 17:44:23
葡主帅为C罗红牌辩护:没有暴力,只是想摆脱防守,他运气太差

葡主帅为C罗红牌辩护:没有暴力,只是想摆脱防守,他运气太差

岁月轻纱
2025-11-14 08:31:36
世界杯夺冠热门诞生:7战全胜+0丢球,图赫尔神了

世界杯夺冠热门诞生:7战全胜+0丢球,图赫尔神了

篮球国度
2025-11-14 09:32:10
杜文龙警告:美军坠机是演戏,南海水下地图才是目的

杜文龙警告:美军坠机是演戏,南海水下地图才是目的

闻识
2025-11-13 18:31:09
官方披露:夏某受境外组织派遣,以“提供医疗援助”等名义为掩护,深入我西南山区,暗中搜集军事管理区数据

官方披露:夏某受境外组织派遣,以“提供医疗援助”等名义为掩护,深入我西南山区,暗中搜集军事管理区数据

鲁中晨报
2025-11-13 15:59:03
花680万元通过链家买房遇争议 中介偷录与买家通话发卖家 房管局:存在服务瑕疵 链家回应

花680万元通过链家买房遇争议 中介偷录与买家通话发卖家 房管局:存在服务瑕疵 链家回应

红星新闻
2025-11-13 13:02:28
在美最擅长的领域打败美国,美媒:中国核航母正安装反应堆安全壳

在美最擅长的领域打败美国,美媒:中国核航母正安装反应堆安全壳

啸鹰评
2025-11-13 16:53:21
1971年国宝九龙杯离奇失窃,周总理只用一招,巧妙让外宾主动归还

1971年国宝九龙杯离奇失窃,周总理只用一招,巧妙让外宾主动归还

丞丞故事汇
2025-11-13 11:30:22
王曼昱战胜王艺迪晋级全运会女单半决赛,下一场对决陈梦

王曼昱战胜王艺迪晋级全运会女单半决赛,下一场对决陈梦

澎湃新闻
2025-11-13 20:16:27
女子副驾发现口红,丈夫辩称同事女友遗留,她默默在坐垫插针回应

女子副驾发现口红,丈夫辩称同事女友遗留,她默默在坐垫插针回应

晓艾故事汇
2025-10-31 17:17:50
一夜负债200亿?电动车巨头轰然倒塌:终于活成贾跃亭信徒?

一夜负债200亿?电动车巨头轰然倒塌:终于活成贾跃亭信徒?

削桐作琴
2025-11-13 16:50:53
河南女排主帅:原本目标只是保8争6,但朱婷让我们产生了质变

河南女排主帅:原本目标只是保8争6,但朱婷让我们产生了质变

丁丁鲤史纪
2025-11-13 12:49:36
亚历山大:库里的伟大不在于只进一个三分,我也不想只夺一冠

亚历山大:库里的伟大不在于只进一个三分,我也不想只夺一冠

懂球帝
2025-11-13 10:39:07
2025-11-14 09:47:01
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
11712文章数 142505关注度
往期回顾 全部

科技要闻

火箭成功回收 贝索斯终于追上马斯克一小步

头条要闻

日本驻澳大使:日本非常愿意继续与中方对话 以免误解

头条要闻

日本驻澳大使:日本非常愿意继续与中方对话 以免误解

体育要闻

跟豪门传了十年绯闻,他却偏要“择一队终老”

娱乐要闻

王鹤棣孟子义真要搭?

财经要闻

10月各线城市商品住宅销售价格环比下降

汽车要闻

具备高阶辅助驾驶功能 欧拉5预售价10.98万起

态度原创

游戏
教育
数码
家居
艺术

《吸血鬼幸存者》VR版发布 率先登陆Meta Store

教育要闻

这道三年级思维训练题难倒了很多孩子,求爸、妈、儿各多少岁

数码要闻

AMD FSR Redstone 实装,《COD:黑色行动 7》支持 FSR 光线再生

家居要闻

莫奈时间 重构先锋概念

艺术要闻

伟人写给宋庆龄的信:狂草艺术的巅峰之作

无障碍浏览 进入关怀版