【CNMO科技消息】2月4日,CNMO注意到,阿里巴巴官方宣布,正式开源专为编程智能体打造的Qwen3-Coder-Next模型。
![]()
Qwen3-Coder-Next采用极致高效的MoE架构,总参数达80B,但每次推理仅激活3B参数,大幅降低了显存与算力需求。该模型专为智能体设计,聚焦于长时程、多工具、可交互的真实编程任务。
在训练过程中,Qwen3-Coder-Next不依赖参数规模扩张,而是着重扩展智能体训练信号。通过大规模可验证编程任务与可执行环境训练,模型能够直接从环境反馈中学习,掌握长时程推理、熟练使用工具以及从执行错误中有效恢复等核心能力。训练过程涵盖持续预训练、监督微调、领域专家训练和专家知识蒸馏等多个环节,确保模型在多个领域具备精细化专家能力。
![]()
实测表现方面,Qwen3-Coder-Next在多个主流编程智能体基准上展现出强劲竞争力。在SWE-Bench Verified上,使用SWE-Agent框架时,该模型达到70%以上的问题解决率,在多语言设置及更具挑战的SWE-Bench-Pro基准上依然保持竞争力。尽管激活参数规模较小,但该模型在多项智能体评测中仍能匹敌或超过若干更大的开源模型。
![]()
此外,Qwen3-Coder-Next部署门槛低,实用体验佳。开发者可将其灵活集成至本地IDE插件、命令行智能体或企业内网环境等多种场景,实现自动修复与代码生成、自然语言操作终端等功能。目前,Qwen3-Coder-Next(Base)与Qwen3-Coder-Next(Instruct)两个版本已正式开源,全面支持研究、评测及商业应用,开发者可通过GitHub、魔搭、Hugging Face获取模型,也可进入阿里云百炼进行API调用。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.