智通财经APP获悉,6月2日,阿里巴巴(09988)旗下千问正式发布Qwen3.7-Plus,将视觉与语言统一为一体化智能体基座的多模态模型。在Qwen3.7强大文本能力的基础上,Qwen3.7-Plus全面升级了视觉-语言能力,同时保持了在编码、工具使用和生产力工作流方面的完整智能体能力。
据介绍,Qwen3.7-Plus的核心特色在于其作为多模态交互混合智能体的能力。它能够感知真实世界场景、读取屏幕并操作GUI、基于视觉参考生成代码、端到端导航移动应用,以及基于网络知识回答视觉问题——在单一智能体循环中无缝融合GUI与CLI交互。作为全能型编码智能体与生产力助手,它以全模态输入处理从前端原型到复杂软件工程、再到多步工作流自动化的全方位任务。它具备跨框架泛化能力,无论通过Claude Code、OpenClaw、Qwen Code还是其他框架部署,均能保持稳定表现。
基于Qwen3.7-Plus构建的Hybrid-Agent智能体系统,将大模型的代码生成能力与GUI自动化执行深度融合,实现了从需求分析到版本迭代的APP全链路开发。Agent持续稳定运行11+小时,全程自动完成了一款英语单词学习APP的完整研发闭环。累计生成代码超过10,000+行,触发Agent调用超过1,000+次,覆盖软件开发全生命周期的核心环节:需求文档生成、代码自动编写、自动化安装部署、测试用例创建、GUI自动化测试、多场景并行化测试、产品说明自动更新、自动版本迭代演进。
此外,Qwen3.7-Plus还支持多模态推理(可解析地铁线路图等复杂视觉信息)、搜索增强视觉问答、图像/视频转SVG矢量代码、视觉驱动的网页设计等功能,并在浏览器Agent场景中可自动完成ECS云服务器采购、运维链路闭环等任务。模型在BabyVision、MathVision、ScreenSpot Pro、AndroidWorld等多项高难度基准上表现强劲。目前Qwen3.7-Plus已在阿里云百炼平台上线,支持OpenAI兼容API与Anthropic协议调用。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.