网易首页 > 网易号 > 正文 申请入驻

赛道Hyper | 阿里开源编程模型Qwen3-Coder-Flash

0
分享至

作者:周源/华尔街见闻

8月1日,阿里通义千问推出编程模型Qwen3-Coder-Flash,属于Causal Language Models(CLMs:因果语言模型),仅支持非思考模式,不会在输出中生成区块,为Pretraining & Post-training,即预训练和后训练阶段,即从“通用知识学习”过渡到“特定任务适配”。

该模型以Agent能力为核心,在代理式编程、浏览器使用、工具调用等场景表现突出;但性能略逊于GPT-4.1、Claude Sonnet-4等领先闭源模型。

Qwen3-Coder-Flash是阿里云通义千问发布的开源智能编程引擎Qwen3-Coder家族中的一款。

Qwen3-Coder性能出众,能正面对决美国Anthropic公司开发的Claude 4 Sonnet,支持256K上下文,最高可扩展至1M,适用于仓库级代码理解;通过强化学习技术,实现多轮交互与自主决策,大幅提升代码执行成功率。开发者可通过阿里云百炼平台直接体验或调用API使用。

该家族首发旗舰版本是Qwen3-Coder-480B-A35B-Instruct模型,有480B的参数量,激活量35B,基于MoE架构。

同时,该模型在Agentic Coding(代理式编程)、Agentic Browser-Use(浏览器智能操作)及Foundational Coding Tasks(基础编码任务)中刷新SOTA(State of the Art)纪录,并同步开源完整工具链,包括Qwen Code命令行工具、Claude Code集成、VS Code插件及阿里云平台API支持。

Qwen3-Coder-Flash,其中“Qwen”是通义千问模型的英文简称,代表该模型是阿里通义千问系列模型中的一员;“3”是版本信息,“Coder”意思是“编码器”或“编程者”,即专注于编程领域的模型,主要用于解决编程相关问题,具备代码生成、代码理解、代码优化等编程能力。

“Flash”估计寓意着该模型具有高效、快速的特点,能快速处理编程任务,为开发者提供高效的编程支持。

实际上,Qwen3-Coder-Flash全称是Qwen3-Coder-30B-A3B-Instruct,参数量30B,激活量3B。

代理式编程(Agentic Coding)能力的突破,是Qwen3-Coder-Flash最受关注的亮点。

与传统开源模型只能进行片段式代码生成不同,该模型能理解多步骤业务逻辑,比如电商支付系统中从订单创建到账期结算的全流程,自主拆解任务并生成可串联的代码模块。

本质上这是模型对上下文记忆的强化:通过超百个专家并行处理机制,将分散的业务规则、数据结构、异常处理逻辑整合为连贯的执行链条。

在浏览器交互(Agentic Browser-Use)场景中,其优势体现在对动态网页的理解深度。

当面对需要JavaScript渲染的异步加载内容时,该模型能识别DOM结构变化规律,自动生成带延迟判断的抓取脚本,而非像传统工具那样机械执行固定步骤。

这在处理电商平台的实时价格监控、社交媒体的动态评论爬取等场景时,模型的成功率显著高于依赖固定模板的开源工具。

工具调用环节的进步则体现在流程闭环。

以Git与Jenkins联动为例,该模型不仅能生成提交代码的指令,还能根据Jenkins返回的构建失败日志,自动定位冲突文件并生成解决脚本。这就减少了开发者在工具间切换的频次,本质上是将散落在开发流程中的“断点”连接成线。

但将其与闭源模型对比,差距依然存在。

GPT-4.1在处理金融级风控规则时,能自主引入巴塞尔协议相关规范做代码校验,而Qwen3-Coder-Flash仍需依赖开发者明确输入监管要求;Claude Sonnet-4在浏览器操作中,可识别验证码图片的语义信息(如点击所有包含红绿灯的图片),Qwen3-Coder-Flash则仅能处理文本型验证逻辑。

这种差距并非简单的参数规模差异,更反映在训练数据中对行业知识的深度编码能力上。

与闭源模型相比,Qwen3-Coder-Flash的性能差距,除了技术原因,很大程度上也因为闭源模型很多时候是商业化的核心利器,比开源模型的性能通常会更强。

作为因果语言模型,Qwen3-Coder-Flash总参数量 30.5B,激活参数3.3B,采用48层结构,含128个专家,每次运算调用8个协同工作。

这类似人类团队中“专项小组”的工作模式:处理数据库操作时调用擅长SQL(结构化查询语言:Structured Query Language)优化的专家,处理前端交互时则激活DOM(文档对象模型:Document Object Model)解析专家。

这种动态调度使模型在10万行级代码库分析中,内存占用比同参数规模的单一模型有较为明显的减少,对算力有限的中小企业尤为关键。

这能发挥各专家领域优势,如处理数学计算代码调用擅长数值运算的专家,处理自然语言相关代码调动擅长文本理解的专家。

该模型原生支持262144个(26.21万)tokens上下文长度,经YaRN(Yet Another RoPE Extention)技术可扩展至100万个tokens(约50-70万字);更长上下文助其更好理解代码内在联系,提升分析和生成准确性。

为让更多开发者和企业使用该模型,阿里通义千问将其在魔搭社区及Hugging Face开源,提供PyTorch和TensorFlow版本,满足不同使用习惯和需求。

Qwen3-Coder-Flash采用Apache 2.0协议,允许商业使用,仅需保留原作者信息及修改声明。

与Llama系列非商业许可相比,降低企业应用门槛,利于模型在更多场景应用优化。中小企业负责人称此策略让他们能低成本享受先进技术,提升竞争力。

Qwen3-Coder-Flash的出现,本质上是开源阵营对闭源模型的一种补充:没有盲目追求参数规模,而是聚焦开发者实际痛点:工具链整合、长上下文支持、商业友好协议,这些都是GPT-4.1等闭源模型因商业定位而难以满足的需求。

总体而言,Qwen3-Coder-Flash为开源编程领域提供可量化性能参考,但其实际价值需经更多场景检验,后续迭代和用户反馈将决定其长期位置。随着技术发展,该模型及整个领域将呈现更丰富的态势。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
风向彻底变了!西方媒体集体改口:中国,无需再向世界证明什么

风向彻底变了!西方媒体集体改口:中国,无需再向世界证明什么

大卫聊科技
2026-03-25 12:22:18
上海一男子每天3包烟,持续几十年!医生:全身没一根血管是好的

上海一男子每天3包烟,持续几十年!医生:全身没一根血管是好的

上观新闻
2026-03-24 13:32:07
白宫坚称美伊仍在谈判,威胁伊朗“切勿误判”;伊朗外长:美国谈论“谈判”无异于承认“失败”,伊朗放声开新战线

白宫坚称美伊仍在谈判,威胁伊朗“切勿误判”;伊朗外长:美国谈论“谈判”无异于承认“失败”,伊朗放声开新战线

每日经济新闻
2026-03-26 17:08:49
追悼会前,张雪峰婚姻状况被扒,现任身份不一般,恐影响遗产分配

追悼会前,张雪峰婚姻状况被扒,现任身份不一般,恐影响遗产分配

喜欢历史的阿繁
2026-03-26 14:40:54
巴萨旧将:当时赫莱布知道自己要离队,他往功能饮料里兑酒喝

巴萨旧将:当时赫莱布知道自己要离队,他往功能饮料里兑酒喝

懂球帝
2026-03-26 06:43:09
已删除!钟丽缇发文道歉:在孩子教育问题上有疏忽

已删除!钟丽缇发文道歉:在孩子教育问题上有疏忽

半岛晨报
2026-03-24 15:30:03
人过五十才懂:和子女最好的相处,不是给钱出力,而是守住这条线

人过五十才懂:和子女最好的相处,不是给钱出力,而是守住这条线

荷兰豆爱健康
2026-03-23 01:42:20
疯了!有新联赛硬刚NBA!想抢詹姆斯约基奇!

疯了!有新联赛硬刚NBA!想抢詹姆斯约基奇!

柚子说球
2026-03-26 22:00:29
学医后才知道,保护心血管最好的运动,不是慢跑快走,而是这个

学医后才知道,保护心血管最好的运动,不是慢跑快走,而是这个

医学科普汇
2026-03-23 21:55:03
紫薇老公也是2cm

紫薇老公也是2cm

毒舌扒姨太
2026-03-24 22:44:57
美媒:万斯将出面

美媒:万斯将出面

极目新闻
2026-03-26 09:51:54
以色列已经告诉世界:日本若敢拥有核武器,美国并不会第一个翻脸

以色列已经告诉世界:日本若敢拥有核武器,美国并不会第一个翻脸

八斗小先生
2025-12-26 09:33:27
无人机真是中国领先吗?为何战场上被打下的,全都是中国无人机

无人机真是中国领先吗?为何战场上被打下的,全都是中国无人机

安安说
2026-03-19 13:00:22
重磅!新加坡国立大学原副校长,全职加盟清华大学

重磅!新加坡国立大学原副校长,全职加盟清华大学

TOP大学来了
2026-03-26 17:43:56
全国多地学校宣布:取消早读!家长:孩子每天多睡近一小时,早上吃饭也不慌了

全国多地学校宣布:取消早读!家长:孩子每天多睡近一小时,早上吃饭也不慌了

山西晚报
2026-03-26 17:30:54
德转列世预赛附加赛球队身价排行:意大利8.39亿欧居首

德转列世预赛附加赛球队身价排行:意大利8.39亿欧居首

懂球帝
2026-03-26 15:59:41
1965年,毛主席点名让彭德怀复出,背后有人拼命阻挠,这人后来判了18年

1965年,毛主席点名让彭德怀复出,背后有人拼命阻挠,这人后来判了18年

史海孤雁
2026-03-25 18:31:11
只剩6天!医保全国统一,41-61岁抓紧办这几件事,否则就晚了!

只剩6天!医保全国统一,41-61岁抓紧办这几件事,否则就晚了!

另子维爱读史
2026-03-25 22:09:07
“油价飙升至200美元”?特朗普团队被爆评估极端情景,白宫紧急否认

“油价飙升至200美元”?特朗普团队被爆评估极端情景,白宫紧急否认

第一财经资讯
2026-03-26 18:58:56
国足VS库拉索:留洋小将坐镇中场,韦世豪王钰栋领衔,张玉宁冲锋

国足VS库拉索:留洋小将坐镇中场,韦世豪王钰栋领衔,张玉宁冲锋

零度眼看球
2026-03-26 07:23:48
2026-03-27 04:40:49
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
143603文章数 2653030关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

亲子
房产
艺术
游戏
本地

亲子要闻

试工育儿嫂被查出传染病,宝妈崩溃!家政服务“健康关”如何保障?

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

艺术要闻

北京大兴机场和青岛胶东机场“撞脸”,长得像就是抄袭?

PS1大IP游戏藏私货!成人手绘与盗版马里奥ROM塞满

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

无障碍浏览 进入关怀版