就在刚刚,阿里 Qwen 3 系列模型继续上新——Qwen3-Coder-480B-A35B-Instruct。
它到底能干啥?
1️⃣ 混合专家 MoE 架构(480B 总参数,激活 35B)
2️⃣ 原生支持 256K 上下文,借助 YaRN 技术,可扩展至 1M token
3️⃣ 代码生成 + 工具使用 + 多轮交互能力
4️⃣ 在 Agentic Coding、Agentic Browser-Use、Agentic Tool-Use 上实现开源 SOTA 表现
5️⃣ 部分场景下,性能可比肩 Claude Sonnet 4
据悉,借助 Qwen3-Coder,刚入行的程序员一天就能完成资深程序员一周的工作,生成一个品牌官网最快只需 5 分钟。
除了模型,阿里 Qwen 团队还推出并开源了一个用于编程的 CLI 工具:Qwen Code。
1️⃣ 基于 Gemini CLI 改造
2️⃣ 深度适配 prompt 结构 + 工具调用协议
3️⃣ 支持对接 OpenAI SDK、Claude Code、Cline 等主流工具链
它是怎么学会写代码的?
1️⃣ 训练数据规模高达 7.5 万亿 tokens,70% 都是代码
2️⃣ 上下文窗口拓展到百万级,能够更好地理解整个项目结构,哪怕是 GitHub 大型 repo 也能吃得下
3️⃣ 使用 Qwen2.5-Coder 清洗、改写低质数据,提升整体数据质量。
引入强化学习 RL 后,它还能在多轮交互、工具调用、任务反馈中学会自己解决问题,在 SWE-Bench 这种真实世界工程测试中,直接做到开源模型 SOTA。
开发者可直接访问阿里云百炼平台 API(https://bailian.console.aliyun.com),配置完 API Key,即可在 Claude Code 直接上手体验。而普通用户也可在 Qwen Chat 网页版免费体验。
你别说,在经典烟囱爆破模拟、3D 地球建模、模拟太阳系运转的 demo 里,Qwen3-Coder-480B-A35B-Instruct 无论是在多步骤控制的动态逻辑,还是在物理引擎调用与代码可视化能力上,都表现得可圈可点。
在某种意义上,「AI 同事」这件事离我们越来越近了。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.