网易首页 > 网易号 > 正文 申请入驻

阿里千问杀进全球前五 国产多模态大模型要改写格局?

0
分享至

6月2日阿里发布千问3.7-Plus多模态大模型,在全球视觉大模型榜单Vision Arena拿下全球前五、中国第一的成绩。绝大多数人都在讨论榜单排名,可我注意到一个很少被提及的细节:这是第一个把“看想写做验”完整闭环的国产多模态智能体。

大模型的竞争,已经从比参数拼跑分,转向了能不能真的干活。当智能体能自己看完图片写完代码跑通测试,整个行业的游戏规则会发生什么变化?


Vision Arena榜单截图 · 显示阿里Qwen3.7-Plus位列全球第五、中国第一

跑分之外,大模型正在完成角色转换

这半年来,国内大模型发布会一场接一场,大家的关注点始终绕不开“参数规模”“跑分排名”这些纸面数据。但千问3.7-Plus这次的发布,跳出了这个惯性赛道。

它的核心卖点不是又堆了多少参数,而是第一次在消费级模型层面,把多模态输入、深度推理、自主编程、工具调用、结果验证完整整合进了一个工作流。换句话说,以前的大模型是“你问我答”,现在它能自己从头到尾完成一件事。

比如给它一张现成的股票APP界面截图,它能看懂每个控件的位置、功能,自己生成完整的代码,调用工具获取测试数据,还能自己完成10项核心测试,一比一复刻出一模一样的应用。整个过程不需要人类中途干预。


多维度评测得分柱状图 · 展示Qwen3.7-Plus与其他模型的评测对比数据

这种变化的本质,不是性能加了几分,而是大模型从“聊天工具”变成了“干活助手”。

大模型产业的下一个竞争拐点,不是谁的参数多,而是谁能真的替人完成复杂长程任务。

从数据上看,这次千问3.7-Plus的提升也完全符合这个方向:评估通用Agent能力的Skillbench评测中,相比上一代模型分数提升了10.2分;数学推理Apex评测中,性能达到了上代模型的近3倍;纯视觉推理BabyVision评测中,得分从37.4涨到了64.7,直接超过了Gemini3.1-Pro。

这些数据不是给行业看的噱头,是实打实支撑“自主完成任务”的基础。

视觉能力升级,藏着智能体落地的关键密码

很多人会问,为什么多模态智能体一定要先升级视觉能力?答案其实很简单:真实世界绝大部分信息,都是通过视觉输入的。

要让AI去复刻一个APP,它得先看懂界面上每个按钮是什么;要让AI去分析工厂的机械图纸,它得先看懂图上的线条和标注;要让AI帮你做一张参考设计图的网页,它得先看懂参考图的布局和配色。

看不懂视觉信息的智能体,永远只能待在文本聊天的盒子里,碰不到真实世界的任务。

千问3.7-Plus这次给视觉能力做了系统性升级,不止是能识别图片里的物体,更关键的是增强了视觉推理能力。接入搜索增强之后,哪怕是一张工厂里模糊的专业机械图,它都能把设备的功能、参数剖析得准确清晰。


APP复刻对比图 · 左侧原APP与右侧Qwen3.7-Plus复刻APP界面

集成CI代码解释器之后,它能自己找不同、解华容道、走迷宫,这些看似小游戏的任务,其实都是在训练视觉推理+工具调用的闭环能力。

更值得注意的是,它还增强了视频和驾驶场景的理解能力,能理清视频里事件的时序关系,看懂真实驾驶场景里交通参与者的空间关系。这其实是在给自动驾驶、具身智能这些未来应用铺路。

平台化落地,国产大模型开始拼生态卡位

这次发布还有一个容易被忽略的信息:Qwen3.7-Plus发布当天就上线了阿里云百炼,对外直接提供API服务。而且阿里云百炼还兼容OpenAI的接口规范,开发者只需要改三行配置,就能把原来基于OpenAI的代码直接迁移过来。

这不是一个简单的上线动作,背后是国产大模型不一样的落地逻辑。

以前很多大模型发布,更像是“技术秀”,发布之后要等几个月才能真正用得上,普通开发者根本碰不到。但现在不一样了,模型发布即上线,开发者当天就能调用API开发自己的应用。

  • 对普通开发者来说,不用再等排期,直接就能用上最新的多模态智能体能力
  • 对已经用了OpenAI接口的开发者来说,迁移成本几乎为零,切换门槛极低
  • 对企业来说,能直接在阿里云的生态里完成从模型调用到应用构建的全流程

这种动作的本质,是在抢生态卡位。当大模型的技术差距逐渐缩小,能率先把能力开放给开发者,让开发者快速做出应用,就能率先建立起自己的生态飞轮。

技术是1,生态是后面的0,没有开放的平台,再好的技术也只是实验室里的样品。

千问这两年的迭代节奏其实很有意思:从Qwen3.5到Qwen3.6再到现在的Qwen3.7,每一次升级都不是只堆参数,而是一边提升核心能力,一边完善开放平台的能力。现在看来,这个节奏正在开始兑现成果。

国产大模型的突围,走了一条不一样的路

回头看这两年国产大模型的发展,其实走了一条和海外不完全一样的路径。海外巨头早年先拼参数规模,后来才慢慢转向智能体和多模态落地。而国产大模型从一开始就盯着“落地”“干活”这些实际需求。

千问这次冲进全球视觉大模型前五,其实只是一个结果。真正值得关注的是,它把多模态混合智能体的完整闭环,从实验室搬到了开发者面前,让所有人都能用。

以前我们总说,国产大模型跟海外顶尖模型还有差距。但这个差距正在快速缩小,而且我们的缩小方式,不是跟着别人屁股后面堆参数,而是针对实际落地需求,走出了自己的升级路线。

当越来越多国产大模型能真的帮开发者和企业解决实际问题,整个产业的主动权,就会慢慢回到我们自己手里。

现在千问已经把多模态智能体的门槛拉到了人人可用的程度,接下来就看开发者们能基于这个能力,长出什么样意想不到的应用了。你觉得第一个被多模态智能体改变的行业会是哪一个?

#AI妙生图##与ChatGPT的有趣对话##千问#

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
百姓躺平摆烂,食税群体怎么办?

百姓躺平摆烂,食税群体怎么办?

律法刑道
2026-06-03 09:30:48
痛心!广西失联18岁女孩李思绮去世,月薪3000,晚上11点才下班

痛心!广西失联18岁女孩李思绮去世,月薪3000,晚上11点才下班

小鋭有话说
2026-06-03 11:19:08
四川巴中一小学为教师定制1500元一套的西装,官方通报:存在决策程序失当、经费使用不规范等问题,校长马某某停职

四川巴中一小学为教师定制1500元一套的西装,官方通报:存在决策程序失当、经费使用不规范等问题,校长马某某停职

扬子晚报
2026-06-03 07:22:58
伊朗革命卫队称袭击美国第五舰队总部

伊朗革命卫队称袭击美国第五舰队总部

界面新闻
2026-06-03 07:52:50
霍尔木兹大消息,美军宣布:“林肯”号航母参与封锁,战机空袭开往伊朗哈尔克岛油轮,致机舱起火!国际油价上涨,特朗普:尽快达成协议

霍尔木兹大消息,美军宣布:“林肯”号航母参与封锁,战机空袭开往伊朗哈尔克岛油轮,致机舱起火!国际油价上涨,特朗普:尽快达成协议

每日经济新闻
2026-06-03 07:49:10
乌称遭俄大规模空袭至少10人死亡、约100人受伤!普京:这是他们自己的选择;泽连斯基曾多次警告称可能遭大规模袭击

乌称遭俄大规模空袭至少10人死亡、约100人受伤!普京:这是他们自己的选择;泽连斯基曾多次警告称可能遭大规模袭击

每日经济新闻
2026-06-03 09:49:32
百万网红直播间以纯牛肉之名卖合成牛肉卷,承诺“假一赔万”,被起诉后又称赔偿过高,最终双方同意调解,若调解不成,法院将择期宣判

百万网红直播间以纯牛肉之名卖合成牛肉卷,承诺“假一赔万”,被起诉后又称赔偿过高,最终双方同意调解,若调解不成,法院将择期宣判

扬子晚报
2026-06-02 22:40:00
美军在波斯湾袭击一艘油轮

美军在波斯湾袭击一艘油轮

新华社
2026-06-03 06:09:03
贵州女子16岁被家人送到湖南嫁给大18岁男子,逃离后与他人生子被判重婚

贵州女子16岁被家人送到湖南嫁给大18岁男子,逃离后与他人生子被判重婚

封面新闻
2026-06-03 11:14:33
这4个行业,已经发不出工资了!真的很严重了

这4个行业,已经发不出工资了!真的很严重了

世界圈
2026-06-03 10:19:49
19岁连子欣选美夺冠,珠圆玉润打破白幼瘦审美观

19岁连子欣选美夺冠,珠圆玉润打破白幼瘦审美观

最美的笔触
2026-06-03 09:30:58
割四赔五后续:麦客撤了,麦烂了,农户跪了,这锅谁背?

割四赔五后续:麦客撤了,麦烂了,农户跪了,这锅谁背?

番外行
2026-06-02 14:19:47
Shams:库里与李宁10年合同总价超4亿美元,他曾拒绝更丰厚报价

Shams:库里与李宁10年合同总价超4亿美元,他曾拒绝更丰厚报价

懂球帝
2026-06-03 09:53:28
马斯克搞了个全语言自动翻译,X上的全球网友乱成了一锅粥

马斯克搞了个全语言自动翻译,X上的全球网友乱成了一锅粥

BB姬
2026-06-02 22:35:44
原来她发呆都这么可爱

原来她发呆都这么可爱

贵圈真乱
2026-06-03 10:14:39
带孩子逛山姆是托举后续:遭网曝后道歉,全家被牵连,丈夫要算账

带孩子逛山姆是托举后续:遭网曝后道歉,全家被牵连,丈夫要算账

奇思妙想草叶君
2026-06-03 02:25:44
刷屏!北京大学饶毅教授直言:中国学术不端比例世界空前

刷屏!北京大学饶毅教授直言:中国学术不端比例世界空前

TOP大学来了
2026-06-02 19:24:41
肇庆男童深山走失13天奇迹生还!靠野果生存,获救紧搂救援者

肇庆男童深山走失13天奇迹生还!靠野果生存,获救紧搂救援者

奇思妙想草叶君
2026-06-02 19:15:06
24小时已过,普京政府准时断供,航油不卖中国,欧盟启动应急方案

24小时已过,普京政府准时断供,航油不卖中国,欧盟启动应急方案

影孖看世界
2026-06-02 23:07:47
央视再曝新毒物!长期用会致癌,已流窜至全国,不少婴儿孕妇中招

央视再曝新毒物!长期用会致癌,已流窜至全国,不少婴儿孕妇中招

做一个合格的吃瓜群众
2026-06-02 14:36:43
2026-06-03 14:04:49
侃故事的阿庆
侃故事的阿庆
几分钟看完一部影视剧,诙谐幽默的娓娓道来
1121文章数 8615关注度
往期回顾 全部

科技要闻

员工抗议键鼠追踪,Meta让步:可暂停30分钟

头条要闻

受贿数额特别巨大 内蒙古自治区政府原主席王莉霞被诉

头条要闻

受贿数额特别巨大 内蒙古自治区政府原主席王莉霞被诉

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

著名演员魏宗万去世!曾演活司马懿

财经要闻

左手通胀右手衰退,欧美当下的困局

汽车要闻

瑞虎8 PLUS/PRO非凡冠军上市 限时10.19万元起售

态度原创

游戏
家居
亲子
本地
公开课

X战警在《漫威金刚狼》里不存在!失眠组官方回应

家居要闻

江畔轻奢 观云大宅

亲子要闻

孩子长高选什么赖氨酸好?2026推荐度高的氨基丁品牌测评,科学激活发育潜能

本地新闻

用剪纸的方式,打开江苏扬州

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版