网易首页 > 网易号 > 正文 申请入驻

造福or替代程序员?实测阿里新模型

0
分享至


题图|视觉中国

坦白说,过去几年,作为一名开发者,我感觉自己越来越像一个高薪的“代码搬运工”。

我的日常,是在StackOverflow的问答、GitHub的开源项目和公司陈旧的代码库之间,进行无休止地“搬运”。

Ctrl+C,Ctrl+V,然后花上数小时修复那些琐碎的bug,搭建那些千篇一律的脚手架。这不仅枯燥,更是对创造力的一种缓慢扼杀——我们本该是创造未来的建筑师,但“复制粘贴”却占据了工作的绝大部分。

我们都用过Copilot类的工具,它们很棒,能帮你补全下一行代码,甚至一小段函数。但它们始终是“副手”,无法理解你真正的意图,更别提独立承担一项完整的任务。你依然是那个殚精竭虑的“主驾驶”。

但如果,AI不再只是一个帮你补全代码的“副驾驶”,而是能理解整个任务、独当一面的“全栈工程师”呢?

就在今天,我体验到了阿里刚刚开源的Qwen3-Coder。说实话,一开始我只是抱着“又一个国产模型”的心态去尝试。但经过一天的深度体验后,这个HuggingfaceCEO点赞的Qwen3-Coder 新模型彻底震撼到我了。

它的意义,不仅仅是评测表单中的超越GPT-4.1,比肩全球最强Claude4的全球第一梯队强劲性能,更重要的是,是它让我亲眼看到了终结“搬砖”日常的曙光。

这,可能就是那场我们期待已久的、真正的生产力革命。


上手即封神,我的Qwen3-Coder“初体验”

先说说我跟几个程序员朋友最直观的共同感受。

速度很快,没有思考过程,体验比Gemini还好。虽然写出来的代码偶尔有一点点小问题,但跟它说下现象就能自己纠正好了。而且随着对能力的探索,token使用量大幅增加。

它已经是一个完整版的生产力工具了。

你可以通过三种方式与这位新来的“AI开发者”协作:在QwenChat网页端和它免费畅聊;通过阿里云百炼的API将其能力注入万物;或者,如果你偏好本地部署的话,也可以直接从HuggingFace或魔搭社区下载模型,让它在你的本地为你工作,数据绝对安全。

我选择了最直接的网页端,开始了我这一天的“疯狂测试”。


1.开胃菜:会动的“天气预报卡”

我给它的第一个指令很简单:“创建一个带动画效果的天气预报卡,能根据不同天气(晴天、雨天、多云)显示不同的动画。”

过去,这种任务AI通常能生成个静态框架,但动画和交互逻辑总是一团糟。

然而Qwen3-Coder几乎是瞬间就给出了结果——一个漂亮的卡片,上面不仅有城市和温度,点击不同的天气按钮,背景真的会流畅地切换成阳光、雨滴和云朵的动画。代码一次性跑通,零bug。

这感觉就像,你让助理帮你画个草图,他直接给了你一个可以交互的精美原型。


2.硬菜:一个完整的科技新闻官网首页

接下来,我提升了难度,用了我最喜欢测AI代码工具的案例:“给我创建一个科技新闻媒体产品的官网首页,要有导航栏、HeroSection、媒体介绍、会员定价表格和页脚。”

这是检验AI设计品味和布局能力的“照妖镜”。还记得几个月前,AI生成的页面还停留在上世纪90年代的审美吗?布局混乱,配色辣眼。

但Qwen3-Coder的出品,让我惊掉了下巴。

一个设计现代、响应式布局、UI/UX考究的完整页面呈现在我眼前。它甚至贴心地加入了微交互动画。

如果我不说,你绝对会以为这是出自一位资深前端设计师之手。而如今,一个开源模型就能轻松做到,而且是免费的。

时代真的变了。


3.炫技时刻:可视化“神经网络”

“用p5.js创建一个可视化的神经网络,节点和连接要有脉冲和发光的动画效果。”这个任务考验的是它整合多语言(HTML/CSS/JS/p5.js)和实现复杂逻辑与动画的能力。

很快,一个带控制面板的交互式神经网络模拟器诞生了。你可以重置网络、开始/暂停动画,甚至调节动画速度。代码逻辑清晰,艺术与技术的结合堪称完美。

它不仅理解了“神经网络”这个技术概念,还理解了“脉冲”和“发光”这种感性的艺术表达。


4.生产力测试:秒建“CSV数据看板”

最后,我扔给它一份包含姓名、邮件、性别的模拟CSV数据,要求它“构建一个单页Web应用,能解析用户上传的CSV文件,并动态生成多种图表(条形图、折线图等)来可视化数据。”

这几乎是每个数据分析师和后端开发者的日常工作。Qwen3-Coder几乎在瞬间就构建了一个功能完备的数据看板。它不仅正确解析了我提供的数据,还生成了条形图和对比图,整个仪表盘的设计模块化且交互性十足。

一天测试下来,我的结论显而易见:它不再是‘生成代码’,而是在‘交付产品’。Qwen3-Coder已经进入了功能、设计和用户体验的层面。


为什么Qwen3-Coder能这么强?

Qwen3-Coder的真正革命性在于,它已经从一个“代码补全器(Copilot)”进化为了一个“自主开发者(Agent)”。

它思考的不再是“下一行代码该写什么”,而是“为了完成这个任务,我需要分几步,调用哪些工具,如何验证结果”。

这背后,是三大核心技术支柱的支撑:

1.架构选择:混合专家(MoE)带来的规模与效率

Qwen3-Coder是千问系列首个采用混合专家(MoE)架构的代码模型。其最强版本总参数规模高达4800亿(480B),但在每次推理时,仅激活其中的350亿(35B)参数。

这种架构的优势是显而易见的。

它允许模型拥有巨大的知识容量和参数规模,从而在处理复杂问题时具备更强的泛化能力和更高的天花板。同时,通过稀疏激活的机制,它又将单次推理的计算成本控制在了一个相对合理的范围内。

这是一种在模型能力和推理效率之间取得精妙平衡的先进架构,也是Qwen3-Coder能够实现顶级性能的关键基础。

2.能力核心:为Agent能力打造的强化学习(RL)设施

Qwen3-Coder卓越的Agent能力并非偶然。阿里Qwen团队认为,编程任务“天然适合执行驱动的强化学习”,因为代码的正确性可以通过实际运行结果来直接验证。

基于此,他们构建了一个能够并行运行2万个独立环境的大规模强化学习基础设施。在这个设施中,模型可以模拟真实的软件工程流程:接收任务、规划解决方案、调用外部工具(如代码执行器、测试框架)、获取环境反馈(成功、失败、错误信息),并根据反馈进行迭代和改进。

通过在这种大规模、高并发的真实编码环境中进行海量训练,Qwen3-Coder成功地学会了如何解决复杂、多步骤的“长视距”任务。这直接使其代码执行成功率和工具使用效率得到显著提升,也解释了为何它在处理需要自主规划和工具调用的Agent任务时,表现得比许多竞争对手更加出色和高效。

3.上下文长度:处理大规模代码库的基石

软件工程往往涉及对庞大代码库的理解。Qwen3-Coder在这方面具备了物理层面的优势:它原生支持256K tokens的上下文窗口,并通过技术手段可扩展至1M tokens。

这意味着模型可以在一次交互中处理数百万字符的代码和文档。它能够完整地通观大型项目,阅读整个代码库、需求文档甚至多个文件的变更历史,从而实现对项目全局的理解和跨文件的代码生成。

这种处理“仓库级”代码的能力,是解决复杂系统级问题、进行代码重构和深入理解遗留系统的先决条件,也是许多上下文窗口较小的模型所不具备的。

新王登基,阿里再次展现自己AI的强大能力

是的,是时候谈谈最激动人心的部分了。

Qwen3-Coder不仅在体验上令人惊艳,在评测数据上,它更是直接向美国最顶尖的模型发起了挑战,并且成功站上了全球第一梯队——超预GPT4.1,与Claude 4并驾齐驱。

1.正面硬刚,数据说话

·对决GPT-4.1:

在衡量代码模型解决真实世界软件问题的权威榜单SWE-Bench、以及其他多项Agent编码基准测试中,Qwen3-Coder的得分实现了对GPT-4.1的明确超越。

这意味着,在处理复杂、真实的编程任务时,这个来自中国的开源模型,比OpenAI最强的闭源模型之一更有效。

·比肩Claude4:

Claude一直是AgenticCoding领域的标杆。

然而,Qwen3-Coder在多个编程智能体任务上,已经可以和Claude4平起平坐。更关键的是,在Agent的核心能力——工具调用上,实测数据显示其调用的工具数量甚至“比Claude多几倍”。

这意味着在解决同一个复杂问题时,Qwen3-Coder的自主规划和问题分解能力更强,解决问题的手段更多样。


2.成本的“降维打击”

如果说性能上的超越已经足够震撼,那么成本上的优势则是“致命一击”。

Claude4很强,但它也很“贵”。而Qwen3-Coder呢?

·API价格:以约200K输入为例,Qwen3-Coder的API输入价格约为Claude4的1/2,输出价格接近1/3。综合成本优势巨大。

·终极杀招:完全免费:别忘了,它是一个开源模型,遵循Apache-2.0许可。只要你愿意,你可以一分钱不花地在本地拥有这个世界顶级的编程大脑,并可免费商用。

“免费”与“最强”,这两个本不该同时出现的词,被阿里硬生生地捏合在了一起。这对昂贵的闭源API服务来说,无异于一场降维打击。

3.战略的胜利:开源即是王道

在OpenAI等竞争对手日益封闭的今天,阿里选择了一条截然相反的道路——将自己最顶尖、最具生产力的产品,无偿分享给全世界。

这背后,是期待通过定义下一代开发工具的标准,来构建一个繁荣的全球开发者生态。

当全世界的开发者都开始基于Qwen构建应用、插件和工具时,它就成了这个时代的“Android”或“Linux”,成为了不可或逾越的“新基建”。

而阿里云作为基础,自然将受益这个token消耗快速增长的时代。

Qwen3-Coder,让我看到中国推理流量爆发的潜力

Qwen3-Coder的发布,影响的绝不仅仅是技术圈的排名,是我们每一个人。

对于开发者来说,我想说,请忘掉那些关于“AI 取代程序员”的陈旧焦虑吧。Qwen3-Coder 的出现,不是为了取代谁,而是为了武装谁。它把一个资深开发团队的综合能力,压缩进一个任何人都可以调用的工具里,然后交到你的手上。

你将从一个敲击键盘的“代码工人”,升级为一名运筹帷幄的“创意指挥家”。你负责提出构想、定义架构、指挥AI执行,而那些繁重、重复的实现细节,将由你的AI伙伴高效完成。你的价值,将更多地体现在创造力、审美和系统性思考上。

对于普通人来说,一个激动人心的“氛围编程(VibeCoding)”时代正在到来。

你不需要懂

或for循环,你只需要用最自然的大白话描述你的想法——“我想要一个记录宝宝成长的网站,粉色主题,能上传照片和视频”——AI就能为你构建出应用的雏形。创造的门槛,从未如此之低。

今天我们看到的是编程领域的革命,明天,当这些强大的Agent被应用于更多领域时,制药、新材料、金融建模、科学研究……所有行业的生产力都将被重新定义。

Qwen3-Coder的发布,为全球AI发展设定了一个全新的、更高的基准线。最强的力量,第一次以最开放的形式,普惠给了每一个人。

AI 革命的入场券,从未如此便宜,也从未如此强大。

我想,它一定会催生一个“超级个体”的时代。无论你是一个开发者、一个产品经理,还是一个只有绝妙创意的普通人,你都可以借助这种前所未有的强大工具,以惊人的效率,将脑海中的想法变为现实。

对了,经过这一天的尝试,Qwen3-Coder让我看到了中国推理流量,像美国过去半年一样暴增的潜力。

也就在今天的晚间,阿里云官网挂出了更低的定价,比目前最主流编程模型Claude Sonnet4下降了很多。

我想现在,你最该做的,就是立刻去魔搭社区或Hugging Face下载它,或者打开它的网页。去试试看,用一句话,创造一个属于你的世界。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com

本文来自虎嗅,原文链接:https://www.huxiu.com/article/4611051.html?f=wyxwapp

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
没想到,高市早苗涉华言论风波没完,矢野浩二因一个举动口碑暴涨

没想到,高市早苗涉华言论风波没完,矢野浩二因一个举动口碑暴涨

负面黑洞
2025-11-19 15:04:06
连刷6集,Netflix新剧杀疯了

连刷6集,Netflix新剧杀疯了

来看美剧
2025-11-19 17:35:08
官媒确认!邓超再创佳绩,全家移民消息提前曝光

官媒确认!邓超再创佳绩,全家移民消息提前曝光

老琴才是我的外号
2025-11-18 17:33:27
2-0头名晋级!他们重返世界杯,这一刻等了51年,排名比国足高5位

2-0头名晋级!他们重返世界杯,这一刻等了51年,排名比国足高5位

侃球熊弟
2025-11-19 11:30:06
潜伏在我国高层的四大间谍,被安插在军政两界,导致我国损失惨重

潜伏在我国高层的四大间谍,被安插在军政两界,导致我国损失惨重

阅识
2025-10-28 15:23:15
官宣!深圳顶尖大学合作+2!选址确定!

官宣!深圳顶尖大学合作+2!选址确定!

深圳本地宝
2025-11-19 22:50:43
中日军方隔空对阵,日本电磁炮上场,解放军落弹区扩大,美军溜了

中日军方隔空对阵,日本电磁炮上场,解放军落弹区扩大,美军溜了

Ck的蜜糖
2025-11-20 00:50:13
8-0,塞内加尔踢疯,33岁马内戴帽,24岁拜仁悍将雅克松梅开二度

8-0,塞内加尔踢疯,33岁马内戴帽,24岁拜仁悍将雅克松梅开二度

凌空倒钩
2025-11-19 07:03:19
乌军大捷,俄没钱的时候战争就会停止

乌军大捷,俄没钱的时候战争就会停止

难得君
2025-11-16 16:47:26
已官宣:庄宇珊月底去意大利!或帮助球队保级,复制石川的轨迹

已官宣:庄宇珊月底去意大利!或帮助球队保级,复制石川的轨迹

金毛爱女排
2025-11-20 00:00:03
全世界找不出第二个国家,能把所有邻国都得罪遍,还都是领土问题

全世界找不出第二个国家,能把所有邻国都得罪遍,还都是领土问题

扶苏聊历史
2025-11-18 17:47:25
高市早苗最担心的4个局面,前3个已出现,最后一个,联合国见

高市早苗最担心的4个局面,前3个已出现,最后一个,联合国见

云鹏叙事
2025-11-19 10:53:46
警惕!这种“毒碗”已经上黑榜了,检查一下,家里有的赶紧扔了吧

警惕!这种“毒碗”已经上黑榜了,检查一下,家里有的赶紧扔了吧

削桐作琴
2025-10-24 15:45:22
太遗憾!2米26的张子宇, 又一次无缘WCBA

太遗憾!2米26的张子宇, 又一次无缘WCBA

体育哲人
2025-11-19 23:17:52
官宣前兆?久保建英即将登陆英超,皇家社会终于放行!

官宣前兆?久保建英即将登陆英超,皇家社会终于放行!

奶盖熊本熊
2025-11-20 01:28:41
普贤菩萨曾言:无名指超过食指的人,这一生注定有6件事躲不过

普贤菩萨曾言:无名指超过食指的人,这一生注定有6件事躲不过

卡西莫多的故事
2025-11-13 09:54:48
好莱坞性感“黑珍珠”:身材火爆天生尤物,为艺术献身全裸出镜

好莱坞性感“黑珍珠”:身材火爆天生尤物,为艺术献身全裸出镜

南宗历史
2025-11-19 19:39:49
又暴雷!48小时卷走129亿,200万会员血本无归,“传销巨头”凉了

又暴雷!48小时卷走129亿,200万会员血本无归,“传销巨头”凉了

墨印斋
2025-11-11 16:31:34
明日寒衣节,牢记:1要洗,2不晒,3不回,4要吃,传统习俗要重视

明日寒衣节,牢记:1要洗,2不晒,3不回,4要吃,传统习俗要重视

小茉莉美食记
2025-11-19 01:35:03
筑牢法治之基,汇聚法治力量

筑牢法治之基,汇聚法治力量

人民网
2025-11-19 07:07:16
2025-11-20 03:03:00
虎嗅APP incentive-icons
虎嗅APP
个性化商业资讯与观点交流平台
25301文章数 687098关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

日方要求解释为何未告知磋商后会有媒体拍摄 中方回应

头条要闻

日方要求解释为何未告知磋商后会有媒体拍摄 中方回应

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

史林子出轨对方前妻放锤!

财经要闻

重磅!中金公司拟收购东兴与信达证券

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

游戏
亲子
数码
公开课
军事航空

我的小众XP,在“玩法正确”面前一无是处?

亲子要闻

3岁女娃坑爹日常,吸粉超500w:东北人的家庭氛围,究竟有多搞笑?

数码要闻

猫头鹰黑化版散热器风扇来袭

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

量大管饱 中国军网在海外发布备战视频

无障碍浏览 进入关怀版