网易首页 > 网易号 > 正文 申请入驻

赛道Hyper | 阿里开源编程模型Qwen3-Coder-Flash

0
分享至

作者:周源/华尔街见闻

8月1日,阿里通义千问推出编程模型Qwen3-Coder-Flash,属于Causal Language Models(CLMs:因果语言模型),仅支持非思考模式,不会在输出中生成区块,为Pretraining & Post-training,即预训练和后训练阶段,即从“通用知识学习”过渡到“特定任务适配”。

该模型以Agent能力为核心,在代理式编程、浏览器使用、工具调用等场景表现突出;但性能略逊于GPT-4.1、Claude Sonnet-4等领先闭源模型。

Qwen3-Coder-Flash是阿里云通义千问发布的开源智能编程引擎Qwen3-Coder家族中的一款。

Qwen3-Coder性能出众,能正面对决美国Anthropic公司开发的Claude 4 Sonnet,支持256K上下文,最高可扩展至1M,适用于仓库级代码理解;通过强化学习技术,实现多轮交互与自主决策,大幅提升代码执行成功率。开发者可通过阿里云百炼平台直接体验或调用API使用。

该家族首发旗舰版本是Qwen3-Coder-480B-A35B-Instruct模型,有480B的参数量,激活量35B,基于MoE架构。

同时,该模型在Agentic Coding(代理式编程)、Agentic Browser-Use(浏览器智能操作)及Foundational Coding Tasks(基础编码任务)中刷新SOTA(State of the Art)纪录,并同步开源完整工具链,包括Qwen Code命令行工具、Claude Code集成、VS Code插件及阿里云平台API支持。

Qwen3-Coder-Flash,其中“Qwen”是通义千问模型的英文简称,代表该模型是阿里通义千问系列模型中的一员;“3”是版本信息,“Coder”意思是“编码器”或“编程者”,即专注于编程领域的模型,主要用于解决编程相关问题,具备代码生成、代码理解、代码优化等编程能力。

“Flash”估计寓意着该模型具有高效、快速的特点,能快速处理编程任务,为开发者提供高效的编程支持。

实际上,Qwen3-Coder-Flash全称是Qwen3-Coder-30B-A3B-Instruct,参数量30B,激活量3B。

代理式编程(Agentic Coding)能力的突破,是Qwen3-Coder-Flash最受关注的亮点。

与传统开源模型只能进行片段式代码生成不同,该模型能理解多步骤业务逻辑,比如电商支付系统中从订单创建到账期结算的全流程,自主拆解任务并生成可串联的代码模块。

本质上这是模型对上下文记忆的强化:通过超百个专家并行处理机制,将分散的业务规则、数据结构、异常处理逻辑整合为连贯的执行链条。

在浏览器交互(Agentic Browser-Use)场景中,其优势体现在对动态网页的理解深度。

当面对需要JavaScript渲染的异步加载内容时,该模型能识别DOM结构变化规律,自动生成带延迟判断的抓取脚本,而非像传统工具那样机械执行固定步骤。

这在处理电商平台的实时价格监控、社交媒体的动态评论爬取等场景时,模型的成功率显著高于依赖固定模板的开源工具。

工具调用环节的进步则体现在流程闭环。

以Git与Jenkins联动为例,该模型不仅能生成提交代码的指令,还能根据Jenkins返回的构建失败日志,自动定位冲突文件并生成解决脚本。这就减少了开发者在工具间切换的频次,本质上是将散落在开发流程中的“断点”连接成线。

但将其与闭源模型对比,差距依然存在。

GPT-4.1在处理金融级风控规则时,能自主引入巴塞尔协议相关规范做代码校验,而Qwen3-Coder-Flash仍需依赖开发者明确输入监管要求;Claude Sonnet-4在浏览器操作中,可识别验证码图片的语义信息(如点击所有包含红绿灯的图片),Qwen3-Coder-Flash则仅能处理文本型验证逻辑。

这种差距并非简单的参数规模差异,更反映在训练数据中对行业知识的深度编码能力上。

与闭源模型相比,Qwen3-Coder-Flash的性能差距,除了技术原因,很大程度上也因为闭源模型很多时候是商业化的核心利器,比开源模型的性能通常会更强。

作为因果语言模型,Qwen3-Coder-Flash总参数量 30.5B,激活参数3.3B,采用48层结构,含128个专家,每次运算调用8个协同工作。

这类似人类团队中“专项小组”的工作模式:处理数据库操作时调用擅长SQL(结构化查询语言:Structured Query Language)优化的专家,处理前端交互时则激活DOM(文档对象模型:Document Object Model)解析专家。

这种动态调度使模型在10万行级代码库分析中,内存占用比同参数规模的单一模型有较为明显的减少,对算力有限的中小企业尤为关键。

这能发挥各专家领域优势,如处理数学计算代码调用擅长数值运算的专家,处理自然语言相关代码调动擅长文本理解的专家。

该模型原生支持262144个(26.21万)tokens上下文长度,经YaRN(Yet Another RoPE Extention)技术可扩展至100万个tokens(约50-70万字);更长上下文助其更好理解代码内在联系,提升分析和生成准确性。

为让更多开发者和企业使用该模型,阿里通义千问将其在魔搭社区及Hugging Face开源,提供PyTorch和TensorFlow版本,满足不同使用习惯和需求。

Qwen3-Coder-Flash采用Apache 2.0协议,允许商业使用,仅需保留原作者信息及修改声明。

与Llama系列非商业许可相比,降低企业应用门槛,利于模型在更多场景应用优化。中小企业负责人称此策略让他们能低成本享受先进技术,提升竞争力。

Qwen3-Coder-Flash的出现,本质上是开源阵营对闭源模型的一种补充:没有盲目追求参数规模,而是聚焦开发者实际痛点:工具链整合、长上下文支持、商业友好协议,这些都是GPT-4.1等闭源模型因商业定位而难以满足的需求。

总体而言,Qwen3-Coder-Flash为开源编程领域提供可量化性能参考,但其实际价值需经更多场景检验,后续迭代和用户反馈将决定其长期位置。随着技术发展,该模型及整个领域将呈现更丰富的态势。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
孟良崮战役:粟裕三大特质助其全歼张灵甫74师

孟良崮战役:粟裕三大特质助其全歼张灵甫74师

历来纵横
2025-11-16 17:20:05
左手之战实力碾压!王楚钦4-1完胜袁励岑,问鼎全运会男单铜牌

左手之战实力碾压!王楚钦4-1完胜袁励岑,问鼎全运会男单铜牌

钉钉陌上花开
2025-11-16 13:24:09
36岁富豪开兰博基尼发生车祸,当场死亡!大量现金散落在高速路上

36岁富豪开兰博基尼发生车祸,当场死亡!大量现金散落在高速路上

最江阴
2025-11-16 00:11:00
不瞒了!马筱梅挺大肚直播,食欲大增超爱吃肉,张兰:别太辛苦

不瞒了!马筱梅挺大肚直播,食欲大增超爱吃肉,张兰:别太辛苦

小海娱计
2025-11-14 14:08:43
史上规模最大的成人游戏节上线Steam!年度游戏评选中

史上规模最大的成人游戏节上线Steam!年度游戏评选中

游民星空
2025-11-15 11:05:00
日本佳子公主被曝当众不穿内衣,遭批过于暴露,日网友炸锅了:有辱国格!

日本佳子公主被曝当众不穿内衣,遭批过于暴露,日网友炸锅了:有辱国格!

日本物语
2025-10-13 21:16:00
为什么国务院和中央军委可以决定征召36周岁至45周岁男性服役?

为什么国务院和中央军委可以决定征召36周岁至45周岁男性服役?

混沌录
2025-10-20 19:44:05
25球赛季准金靴!山东泰山却要拱手送给上海申花?引发外界热议

25球赛季准金靴!山东泰山却要拱手送给上海申花?引发外界热议

罗掌柜体育
2025-11-16 17:34:51
科索沃队史首次杀入世欧预附加赛,并保有末轮直通世界杯的可能

科索沃队史首次杀入世欧预附加赛,并保有末轮直通世界杯的可能

懂球帝
2025-11-16 12:12:22
日本为什么不怕中国?俄罗斯专家一席话点醒国人​

日本为什么不怕中国?俄罗斯专家一席话点醒国人​

近史谈
2025-11-06 21:16:03
神兽为何变成了淫兽?

神兽为何变成了淫兽?

最爱历史
2025-11-16 19:41:07
樊振东距离乒乓球男单GOAT还有多远?战绩超越前辈马龙并非不可能

樊振东距离乒乓球男单GOAT还有多远?战绩超越前辈马龙并非不可能

杨华评论
2025-11-16 19:33:55
刚刚确认:寒潮警报!-4℃!最冷在这天早晨!好消息是……

刚刚确认:寒潮警报!-4℃!最冷在这天早晨!好消息是……

浙江天气
2025-11-16 11:29:43
某音网红聂小雨,迷人的黄金三围,网友:我不行了!

某音网红聂小雨,迷人的黄金三围,网友:我不行了!

健身迷
2025-11-15 10:21:29
细思极恐!为什么年轻人易得肠癌?元凶食物你可能天天在吃!

细思极恐!为什么年轻人易得肠癌?元凶食物你可能天天在吃!

徐德文科学频道
2025-11-16 20:30:41
争议!中国排协晒八强照,却独缺四队,朱婷李盈莹在列

争议!中国排协晒八强照,却独缺四队,朱婷李盈莹在列

跑者排球视角
2025-11-16 23:20:02
红果杀疯了!24小时7000万热度!播放破亿甜剧!这两组CP直接封神

红果杀疯了!24小时7000万热度!播放破亿甜剧!这两组CP直接封神

TVB的四小花
2025-11-15 12:01:19
日系车败退中国:2.9L油耗击碎“省油神话”,00后为何不再买账?

日系车败退中国:2.9L油耗击碎“省油神话”,00后为何不再买账?

财经保探长
2025-09-11 22:20:43
5-4!塞尔比四连鞭斩获争冠先机,冠中冠邀请赛冠军归属存悬念!

5-4!塞尔比四连鞭斩获争冠先机,冠中冠邀请赛冠军归属存悬念!

世界体坛观察家
2025-11-17 00:27:29
亚朵大战全季,传统五星级酒店输麻了

亚朵大战全季,传统五星级酒店输麻了

IC实验室
2025-11-13 15:50:52
2025-11-17 02:39:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
137603文章数 2651471关注度
往期回顾 全部

科技要闻

雷军,怒了!刚刚连发多条微博

头条要闻

中国公民需谨慎前往日本 四大原因披露

头条要闻

中国公民需谨慎前往日本 四大原因披露

体育要闻

最佳新秀候选!2028美国男篮有他一个位置

娱乐要闻

CEO爆料肖战《藏海传》狂赚几十亿!

财经要闻

房源暗中调价 央企举报广州国资房企

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

时尚
健康
家居
手机
数码

秋天怎么穿出时尚感?避开老气的着装方式,美得自然又大方

血液科专家揭秘白血病七大误区

家居要闻

现代简逸 寻找生活的光

手机要闻

古尔曼:苹果iPhone正经历史上最大变革,iPhone 18/Pro分开发布

数码要闻

华为鸿蒙HarmonyOS 6.0.0.112版本首曝,支持电脑投平板

无障碍浏览 进入关怀版