网易首页 > 网易号 > 正文 申请入驻

阿里深夜开源Qwen2.5-VL新版本,视觉推理通杀,32B比72B更聪明

0
分享至

机器之心报道

机器之心编辑部

就在 DeepSeek V3「小版本更新」后的几个小时,阿里通义千问团队也开源了新模型。

择日不如撞日,Qwen2.5-VL-32B-Instruct就这么来了。

相比此前的 Qwen2.5-VL 系列模型,32B 模型有如下改进:

  • 回复更符合人类主观偏好:调整了输出风格,使回答更加详细、格式更规范,并更符合人类偏好。
  • 数学推理能力:复杂数学问题求解的准确性显著提升。
  • 图像细粒度理解与推理:在图像解析、内容识别以及视觉逻辑推导等任务中表现出更强的准确性和细粒度分析能力。

对于所有用户来说,在 Qwen Chat 上直接选中 Qwen2.5-VL-32B,即可体验:https://chat.qwen.ai/

32B 版本的出现,解决了「72B 对 VLM 来说太大」和「7B 不够强大」的问题。如这位网友所说,32B 可能是多模态 AI Agent 部署实践中的最佳选择:

不过团队也介绍了,Qwen2.5-VL-32B 在强化学习框架下优化了主观体验和数学推理能力,但主要还是基于「快速思考」模式。

下一步,通义千问团队将聚焦于长且有效的推理过程,以突破视觉模型在处理高度复杂、多步骤视觉推理任务中的边界。

32B 可以比 72B 更聪明

先来看看性能测试结果。

与近期的 Mistral-Small-3.1-24B、Gemma-3-27B-IT 等模型相比,Qwen2.5-VL-32B-Instruct 展现出了明显的优势,甚至超越了更大规模的 72B 模型。

如上图所示,在 MMMU、MMMU-Pro 和 MathVista 等多模态任务中,Qwen2.5-VL-32B-Instruct 均表现突出。

特别是在注重主观用户体验评估的 MM-MT-Bench 基准测试中,32B 模型相较于前代 Qwen2-VL-72B-Instruct 实现了显著进步。

视觉能力的进步,已经让用户们感受到了震撼:

除了在视觉能力上优秀,Qwen2.5-VL-32B-Instruct 在纯文本能力上也达到了同规模的最优表现。

实例展示

或许很多人还好奇,32B 版本的升级怎么体现呢?

关于「回复更符合人类主观偏好」、「数学推理能力」、「图像细粒度理解与推理」这三个维度,我们通过几个官方 Demo 来体会一番。

第一个问题,是关于「细粒度图像理解与推理」:我开着一辆卡车在这条路上行驶,现在是 12 点,我能在 13 点之前到达 110 公里外的地方吗?

显然,从人类的角度去快速判断,在限速 100 的前提下,卡车无法在 1 小时内抵达 110 公里之外的地方。

Qwen2.5-VL-32B-Instruct 给出的答案也是「否」,但分析过程更加严谨,叙述方式也是娓娓道来,我们可以做个参考:

第二个问题是「数学推理」:如图,直线 AB、CD 交于点 O,OD 平分∠AOE,∠BOC=50.0,则∠EOB=()

答案是「80」:

第三个题目的数学推理显然更上难度了:

模型给出的答案特别清晰,解题思路拆解得很详细:

在下面这个图片内容识别任务中,模型的分析过程也非常细致严谨:

关于 Qwen2.5-VL-32B-Instruct 的更多信息,可参考官方博客。

博客链接:https://qwenlm.github.io/zh/blog/qwen2.5-vl-32b/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刚收到中国10万桶燃料,越南转身就作出裁定,对华产品加税27.83%

刚收到中国10万桶燃料,越南转身就作出裁定,对华产品加税27.83%

涵豆说娱
2026-04-06 15:14:43
毛主席有个奇怪的原则,一生从不碰这三种东西,它们都是什么?

毛主席有个奇怪的原则,一生从不碰这三种东西,它们都是什么?

历史点行
2026-04-05 17:49:27
比伊朗问题,更让西方操心的是,中方复制霍尔木兹海峡模式?

比伊朗问题,更让西方操心的是,中方复制霍尔木兹海峡模式?

一叶禅林
2026-04-07 05:40:16
妻子摔倒丈夫冷眼旁观后续:已离婚,带走4个娃,大女儿处境堪忧

妻子摔倒丈夫冷眼旁观后续:已离婚,带走4个娃,大女儿处境堪忧

潮鹿逐梦
2026-04-04 23:44:39
《清明上班图》刷爆全网!网友:上班如上坟

《清明上班图》刷爆全网!网友:上班如上坟

营销头版
2026-04-06 13:05:54
安徽女童失踪后续,监控无故障却断片,线索增加,可疑人浮出水面

安徽女童失踪后续,监控无故障却断片,线索增加,可疑人浮出水面

奇思妙想草叶君
2026-04-06 23:35:26
山东99-86战胜广东 球员评价:6人优秀,2人及格,4人低迷

山东99-86战胜广东 球员评价:6人优秀,2人及格,4人低迷

篮球资讯达人
2026-04-07 00:48:22
财政改革静悄悄!地方花钱不再束手束脚,民生悄然转向!

财政改革静悄悄!地方花钱不再束手束脚,民生悄然转向!

慕名而来只为你
2026-04-06 19:04:35
不对劲!女子被上海交警扣住,还惊动了外省警方

不对劲!女子被上海交警扣住,还惊动了外省警方

看看新闻Knews
2026-04-06 21:55:06
碾压姆贝莫!曼联密谈 1.3 亿巨星,被称新 C 罗

碾压姆贝莫!曼联密谈 1.3 亿巨星,被称新 C 罗

奶盖熊本熊
2026-04-07 04:30:59
火箭取得本季最长连胜!火记:6连胜是最佳表现 关键时刻终于赢球

火箭取得本季最长连胜!火记:6连胜是最佳表现 关键时刻终于赢球

Emily说个球
2026-04-06 14:10:41
郑丽文明启程访陆,台专家:两岸应团结推进统一,共建一个受世界尊敬的国家

郑丽文明启程访陆,台专家:两岸应团结推进统一,共建一个受世界尊敬的国家

海峡导报社
2026-04-06 08:17:04
35岁傅彪儿子,住豪宅生活奢华,单身满头白发,走上了“不归路”

35岁傅彪儿子,住豪宅生活奢华,单身满头白发,走上了“不归路”

林轻吟
2026-04-02 19:51:37
我国首位女航天员刘洋,结婚8年未生子,临行前给丈夫留下2条遗言

我国首位女航天员刘洋,结婚8年未生子,临行前给丈夫留下2条遗言

霁寒飘雪
2026-04-01 07:40:42
”经济学家吴晓求教授说:“老百姓都没收入了,还在刺激消费!这种做法是错误的!

”经济学家吴晓求教授说:“老百姓都没收入了,还在刺激消费!这种做法是错误的!

张晓磊
2025-11-07 11:34:05
留给美国时间不多了,伊朗战争打完后,世界就只剩一个超级大国了

留给美国时间不多了,伊朗战争打完后,世界就只剩一个超级大国了

触摸史迹
2026-04-02 14:39:03
李亚鹏,直接躺赢了!很快,李亚鹏的嫣然天使将收到两笔捐款!

李亚鹏,直接躺赢了!很快,李亚鹏的嫣然天使将收到两笔捐款!

乐悠悠娱乐
2026-04-06 10:38:21
美伊停火谈判突发!黄金从4600美元反弹,却被美联储“高利率更久”死死压制

美伊停火谈判突发!黄金从4600美元反弹,却被美联储“高利率更久”死死压制

汇通网
2026-04-06 14:16:06
百年骗局终结!国内县城击穿全球市场,1800万降到169元,巨头破产

百年骗局终结!国内县城击穿全球市场,1800万降到169元,巨头破产

蜉蝣说
2026-03-31 14:40:10
109万桶!委内瑞拉石油出口创4年新高,中国采购却突降至零!

109万桶!委内瑞拉石油出口创4年新高,中国采购却突降至零!

聚焦真实瞬间
2026-04-06 16:49:42
2026-04-07 07:08:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12681文章数 142615关注度
往期回顾 全部

科技要闻

折叠屏iPhone要来了,富士康已在试产!

头条要闻

特朗普再发威胁:7日20时是“最后期限”

头条要闻

特朗普再发威胁:7日20时是“最后期限”

体育要闻

官方:中国女足球员邵子钦加盟本菲卡

娱乐要闻

唐嫣罗晋新加坡遛娃,6岁女儿身高抢镜

财经要闻

史诗级暴跌"一周年" A股接下来如何走?

汽车要闻

阿维塔06T快上市了 旅行车还能这么玩?

态度原创

亲子
手机
数码
艺术
公开课

亲子要闻

一定要告诉孩子什么是教养,

手机要闻

曝苹果首款折叠屏iPhone已试产,今年秋季新机发布!

数码要闻

玄派玄机16 2026笔记本上架:锐龙AI Max+ 395,128GB + 2TB

艺术要闻

这所小学的校牌竟然全由学生手写,已持续十年

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版