网易首页 > 网易号 > 正文 申请入驻

阿里发布Qwen3.7-Plus:屏幕理解跑赢GPT-5.4,11小时独立开发App,“看、想、写、做”打通了!

0
分享至

MiniMax M3模型昨日刚炸场,阿里千问又发布了一个强到可怕的新“怪物”。

6月2日,阿里云通义千问团队在X平台正式宣布发布Qwen3.7-Plus。这是一个多模态Agent模型,官方表述是“将视觉与语言统一为一体化智能体基座”。

团队用一句话来概括了它的产品定位:“一个模型,能看、能想、能写代码、能行动。”


用Qwen3.7-Plus做App、复刻股票应用不在话下。千问官方博客披露,基于Qwen3.7-Plus构建的Hybrid-Agent系统,曾连续稳定运行11小时以上,自动完成一款英语单词学习App的完整研发闭环。Hybrid-Agent系统还自主完成了macOS原生Stocks股市应用的高保真复刻。而模型屏幕理解得分79,也超过GPT-5.4和Gemini-3.1 Pro。

而千问这次发布的时间点颇为微妙。就在前一天,MiniMax刚刚推出新一代旗舰开源模型M3,宣称同时实现顶尖编程能力、1M超长上下文与原生多模态。两家在同一周内密集发布,国内大模型开源竞赛愈发白热化。

Qwen3.7-Plus的定价为:输入$0.4/百万token,输出$1.6/百万token。


“看、想、写、做”打通了:一个模型看屏幕、写代码、操作App

Qwen3.7-Plus的核心看点,是把视觉理解和任务执行真正连在了一起。

官方博客描述,这个模型能"感知真实世界场景、读取屏幕并操作GUI、基于视觉参考生成代码、端到端导航移动应用",并在单一智能体循环中无缝融合GUI与CLI交互。

这里有两个关键词:GUI和CLI。GUI就是图形界面,比如网页按钮、手机App菜单、桌面软件窗口。CLI就是命令行,比如工程师用来安装依赖、运行测试、部署服务的黑色窗口。

简单说:它不只是"看懂图片",而是能看懂你的手机屏幕或电脑界面,然后自己点击、输入、跳转,把任务做完。

比如,它可以读取屏幕,理解手机App或网页界面里哪个按钮该点;也可以看一张设计图,然后生成SVG、网页或前端原型;还可以在命令行里跑代码、看报错、再改代码。


连续跑11小时,开发一个英语单词学习App

关于Qwen3.7-Plus具体能做什么:官方给了几个很产品化的演示。

Qwen官方博客称,基于Qwen3.7-Plus构建的Hybrid-Agent系统,连续稳定运行11小时以上,自动完成一款英语单词学习App的研发闭环。

细节包括:生成代码超过10000行,触发Agent调用超过1000次,覆盖需求文档生成、代码自动编写、自动化安装部署、测试用例创建、GUI自动化测试、多场景并行测试、产品说明自动更新和版本迭代。

这个案例的关键点不在于“写了多少代码”,而在于链路够长。一个真实软件任务往往不是一次生成代码就结束,还要安装、运行、测试、改Bug、再验证。官方演示想强调的正是这种长流程能力。



复刻炒股APP,还接入真实行情API

另一个官方案例是,直接做一个炒股APP。

Qwen官方博客称,Hybrid-Agent系统自主完成了macOS原生Stocks股市应用的高保真复刻。流程包括:交互原生应用并理解UI布局和功能细节,基于交互记录生成SwiftUI源码,接入LongBridge真实行情API获取实时市场数据,自动编译构建并启动复刻应用。

模型自主执行了10项功能验证测试,内容包括实时行情加载、股票选择与切换、多周期视图切换、搜索过滤和详细数据面板展示等,且全部通过。

这个演示更直观:模型不是只生成一个静态页面,而是要理解行情App的结构、数据源和交互逻辑,再把它做成一个可以运行的桌面应用。



看图写代码:图像/视频转SVG,也能生成网页原型

Qwen官方博客称,Qwen3.7-Plus可以将图像、视频、UI截图和设计参考转化为可执行代码,覆盖SVG复现到完整网页生成。

在图像/视频转SVG任务中,模型需要识别几何结构、颜色、布局、层级关系和动态变化,再用代码表达出来。对于图标、插画、动效、图形设计和信息可视化,这类能力的产品价值在于:把“看见的参考图”变成“可编辑的代码资产”。

在网页设计任务中,模型不仅要复现页面风格,还要组织布局、写前端代码、处理交互逻辑,并把多模态素材整合进最终页面。

同时,Qwen3.7-Plus可以作为视觉Agent,把视觉理解和工具使用结合起来,解决找不同、补图块、华容道、走迷宫、拼拼图等任务。

这里的流程不是“看一眼给答案”。模型会先理解图像结构和约束,再把视觉问题转成可计算的问题表示,然后自主编写并执行代码进行求解、搜索或验证。

跑分怎么看:屏幕理解跑赢GPT-5.4,但不是所有项目都第一

在多模态基准测试上,Qwen3.7-Plus有几个数字值得关注:

屏幕理解和移动端操控:ScreenSpot Pro得分79.0,高于GPT-5.4(67.4)和Gemini 3.1 Pro(68.1);AndroidWorld得分81.0,同样超过Gemini 3.1 Pro(70.7)和Opus-4.6 Max(62.0)。

数学视觉推理:MathVision得分90.3,接近GPT-5.4的91.0,超过Gemini 3.1 Pro的87.4。

搜索增强视觉问答:SimpleVQA得分81.7,WorldVQA得分61.1,在这一赛道上与Opus-4.6 Max基本持平。

图表识别:CharXiv(RQ)得分85.9,为所有参与对比模型中最高。





纯文本能力方面,官方表示Qwen3.7-Plus"整体接近Max级别模型"。

在Terminal Bench 2.0上得分70.3,超过Opus-4.6 Max(65.4)、K2.6 Thinking(66.7)和DeepSeek-V4-Pro Max(67.9)。

在Deep-Planning(复杂多步规划)上得分62.3,同样领先同级别模型。

不过也有弱项。

在SWE-Verified(真实软件工程任务)上得分77.7,低于Opus-4.6 Max(80.8)和DeepSeek-V4-Pro Max(80.6);在HLE(极难推理)上得分34.7,低于GPT-5.4(40.0)。



网友怎么看?

Qwen官方账号@Alibaba_Qwen于6月2日凌晨1:54发布公告,配合Demo视频展示了多模态混合Agent的操作过程。截至发文,该推文阅读量已达20万。

X网友表示,Qwen3.7-Plus模型不仅要面对各种屏幕,还要操作各类工具,并应对杂乱的工作流程。


还有网友表示,Qwen这次的打法很清晰,就是往Agent和GUI操控上押注,这个方向现在是对的。


多个网友表示,Qwen将“看、想、写、做”集成于一个模型,实在太方便了。简直是“集成了一套员工系统!”




相关评论中,不少技术用户关注的重点集中在两个方向:

一是ScreenSpot Pro的79分——这被不少人认为是"GUI Agent能否真正商用"的关键门槛指标,Qwen3.7-Plus目前是参测模型中的最高分;

二是Kernel Bench L3的98%——这个指标衡量的是模型优化GPU计算核心的能力,98%意味着几乎所有问题都能产出超越PyTorch默认编译器的方案。有用户指出,这个方向以前几乎是专业工程师的"禁区"。

与MiniMax M3的横向对比

两款模型几乎同期发布,定位有所不同。

MiniMax M3主打开源,技术报告和模型权重承诺在10天内公开,核心差异化是1M超长上下文(M3在1M上下文下每token计算量只有上代的1/20)和极强的长线程Agent能力(147次benchmark提交、1959次工具调用完成FP8矩阵乘优化)。

MiniMax团队让M3独立复现一篇ICLR 2025获奖论文。该任务需要看懂图文、曲线、数据和公式,也需要长上下文装入论文、代码和实验日志,还需要编程和Agent能力完成复现。M3自主运行接近12小时,最终跑通核心实验。



Qwen3.7-Plus目前仅提供API调用,不开源权重,核心差异化是多模态与GUI操作能力的深度整合,以及对主流开发框架的即插即用兼容性。

两者在编程Agent能力上存在直接竞争,但侧重点不同:M3更强调长上下文下的自主科研和代码优化能力,Qwen3.7-Plus更强调视觉感知与界面操作的端到端闭环。

相关链接:

https://x.com/Alibaba_Qwen/status/2061506641120641494

https://qwen.ai/blog?id=qwen3.7-plus

https://chat.qwen.ai/?models=qwen3.7-plus

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
28岁女歌星整容成瘾!缺钱整容自己动手:脸上注射香油和水泥!

28岁女歌星整容成瘾!缺钱整容自己动手:脸上注射香油和水泥!

莫地方
2026-05-22 01:45:03
马办风波有望平息?胡志强发声:马英九身边这人能解决!

马办风波有望平息?胡志强发声:马英九身边这人能解决!

天气观察站
2026-06-01 20:08:20
9岁儿童吃针筒糖误吸配件窒息死亡 食品公司被判承担60%赔偿责任

9岁儿童吃针筒糖误吸配件窒息死亡 食品公司被判承担60%赔偿责任

闪电新闻
2026-06-02 15:44:59
48岁男子每天坚持不吃晚饭,半年后体检,血糖和体重情况出乎意料

48岁男子每天坚持不吃晚饭,半年后体检,血糖和体重情况出乎意料

医学原创故事会
2026-05-24 23:59:03
冲着颜值和肉体,看完了这部Starz美剧

冲着颜值和肉体,看完了这部Starz美剧

i书与房
2026-06-02 11:39:07
父母不在了,这两种亲戚无需再走动:不是冷漠,是彻底清醒

父母不在了,这两种亲戚无需再走动:不是冷漠,是彻底清醒

心理观察局
2026-05-28 06:49:09
人口告别世界第一?二孩催生无效后,国家终于向住房方面动真格了

人口告别世界第一?二孩催生无效后,国家终于向住房方面动真格了

潮鹿逐梦
2026-06-01 22:43:07
研究表明:性生活次数不达标,不管男女容易早衰且癌症风险增高!

研究表明:性生活次数不达标,不管男女容易早衰且癌症风险增高!

黯泉
2026-05-03 20:25:37
探底回升 明天关注一点

探底回升 明天关注一点

趋势巡航
2026-06-02 14:51:47
美国人发现,美国近三十年来最大外交失误,可能就是阻止中国统一

美国人发现,美国近三十年来最大外交失误,可能就是阻止中国统一

流史岁月
2026-05-31 12:00:13
一盘木耳毒死7人?医生警告:木耳尽量别这样吃,比砒霜还毒

一盘木耳毒死7人?医生警告:木耳尽量别这样吃,比砒霜还毒

医学科普汇
2026-05-27 16:52:29
公司宣布破产,每人拿了7w的补偿金,就在大家收拾准备走人时,结果老板说:有个新公司谁愿意去?工资翻倍,但必须自愿放弃赔偿

公司宣布破产,每人拿了7w的补偿金,就在大家收拾准备走人时,结果老板说:有个新公司谁愿意去?工资翻倍,但必须自愿放弃赔偿

不二大叔
2026-05-31 21:25:29
我敢打赌99%的男人会选白衣服女孩做老婆,看腿型就知道

我敢打赌99%的男人会选白衣服女孩做老婆,看腿型就知道

周哥一影视
2026-06-02 09:27:09
央视三胎宣传片惹争议,脱离现实强行把孕妇塑造成超人式幸福?

央视三胎宣传片惹争议,脱离现实强行把孕妇塑造成超人式幸福?

番外行
2026-05-24 09:14:38
乌称遭俄73枚导弹656架无人机袭击 俄证实大规模空袭乌克兰

乌称遭俄73枚导弹656架无人机袭击 俄证实大规模空袭乌克兰

闪电新闻
2026-06-02 15:17:12
我爸和外人跑了20年,我买房银行却说:你爸一直在你汇款

我爸和外人跑了20年,我买房银行却说:你爸一直在你汇款

周哥一影视
2026-06-02 14:46:58
尼泊尔总理语出惊人,称尼泊尔多处侵占印度土地,引发轩然大波

尼泊尔总理语出惊人,称尼泊尔多处侵占印度土地,引发轩然大波

半身Naked
2026-06-01 18:10:23
日本杀人犯逃亡后整容,因太帅了走红,大量女粉丝为其应援求情

日本杀人犯逃亡后整容,因太帅了走红,大量女粉丝为其应援求情

莫地方
2026-05-12 00:45:03
5年最高3.01亿!太便宜了!

5年最高3.01亿!太便宜了!

篮球大图
2026-06-02 10:41:05
真相揭秘!原来俞飞鸿唯一公开过的男友,竟然是我们熟悉的他

真相揭秘!原来俞飞鸿唯一公开过的男友,竟然是我们熟悉的他

她时尚丫
2026-05-07 23:01:06
2026-06-02 16:39:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
146990文章数 2653759关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

郑丽文正在访美称愿意与特朗普会面 外交部表态

头条要闻

郑丽文正在访美称愿意与特朗普会面 外交部表态

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君婚礼曝光 深情热吻甜蜜

财经要闻

锂电“资源墙”高筑 全球性长期博弈开始

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

房产
家居
旅游
公开课
军事航空

房产要闻

5200巨量投资曝光!未来五年,海南格局大变!

家居要闻

流线型轮廓 包容多元身形

旅游要闻

安徽六安:“非遗+”赋能全域旅游

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗媒体新发布最高领袖照片

无障碍浏览 进入关怀版