网易首页 > 网易号 > 正文 申请入驻

用一块二手显卡通过5小时编程考题,Qwen3.5-35B-A3B做到了

0
分享至

快速阅读:Qwen3.5-35B-A3B是阿里Qwen团队最新发布的MoE架构模型,单张RTX 3090即可流畅运行,速度超过100 token/s,并在真实编程测试中展现出接近中高级开发者水准的能力,在本地开源模型圈引起广泛讨论。

该图片可能由AI生成

凌晨,一个人盯着屏幕,看着AI在5分钟内重建了一个完整的金融数据仪表板。他没有睡意。

这个人叫jslominski,一位有多年招聘经验的移动开发者。他有一套用了多年的面试题,“前AI时代”大概需要5小时完成,他用这道题测过很多候选人。现在,Qwen3.5-35B-A3B在他家里一台单卡RTX 3090的Linux服务器上,用了大约10分钟,通过了。

不是勉强过,是“strong pass”。

这个模型的架构有点反直觉。它叫35B,但每次前向推理实际激活的只有3B参数。MoE(Mixture of Experts)的意思是:模型有35B的知识储量,但每次回答问题时只调用其中一小部分专家网络。结果就是,你得到了一个大模型的知识深度,却只付出了小模型的计算成本。

MXFP4量化版本在3090上只占约22GB显存,速度超过100 token/s,131k上下文窗口,一张二手价700美元左右的消费级显卡就能跑。

这个组合,放在一年前根本不可想象。

有网友拿RTX 5090跑出了185 token/s。有人在M4 Max MacBook Pro上测出35 token/s的生成速度和800 token/s的prompt处理速度。有人用双RTX 3090跑122B的更大版本,仍然维持50 token/s。

各种硬件配置的数据在帖子下面涌现,大家抢着贴benchmark,气氛有点像发现了新大陆。

值得注意的细节:这个模型对推理参数非常敏感。有网友提到,按Qwen官方推荐的参数设置(temperature=0.6, top_p=0.95, top_k=20)运行时,tool calling效果和乱设参数时相比是“天壤之别”。还有人发现KV cache量化在长上下文下可能导致细微错误,需要谨慎。

工具调用(tool calling)的稳定性是这类测试里最容易翻车的地方。有人遇到模型陷入读取同一文件的循环无法自拔,有人报告tool schema传递时被本地服务器损坏。有观点认为,问题往往不在模型本身,而在于本地推理框架如何序列化和传递tool schema,云端API和本地部署的差异就藏在这里。

还有个实用建议反复被提及:agentic pipeline里的工具数量要尽量精简。有人把工具从11个减到5个,同等硬件下响应时间从5分钟降到1分钟。给模型30个工具“以防万一有用”,结果模型一半的token都花在决定不用哪个工具上了。

有人说,这是他自Mistral 7B发布以来最兴奋的一次开源模型体验。那个评价有点分量——Mistral 7B是2023年开源LLM圈的一个真正的分水岭。

当然,它不是GPT-5,也不是Claude Opus 4。更长的agentic session里是否会漂移、工具调用在50次循环之后是否还能保持连贯,目前还没有充分的数据。

简评:

凌晨三点,一个人在卧室里拥有了一个中高级程序员的全部产出能力,而代价是一张二手显卡的电费。 这件事的意义不在于技术参数,在于权力地图的悄然重绘。云端API意味着依赖、审计、定价权旁落;本地部署意味着离线可用、数据不出门、规则你说了算。当“调用AI”从“付费服务”变成“自有资产”,真正的游戏才刚刚开始。

www.reddit.com/r/LocalLLaMA/comments/1rdxfdu/qwen3535ba3b_is_a_gamechanger_for_agentic_coding

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
吉林一女子救下毒蛇,赖着不走12年,怪事不断,至今无法解释

吉林一女子救下毒蛇,赖着不走12年,怪事不断,至今无法解释

灿烂夏天
2025-02-23 23:30:44
多地政府主要领导密集调整

多地政府主要领导密集调整

上观新闻
2026-02-26 21:18:28
出了一点成绩就开始作死了?日本男篮可没有在亚洲轻敌的本钱啊

出了一点成绩就开始作死了?日本男篮可没有在亚洲轻敌的本钱啊

小僫搞笑解说
2026-02-27 08:54:21
全球首家“AI妓院”正式运营:服务流程全曝光

全球首家“AI妓院”正式运营:服务流程全曝光

深度报
2026-02-24 23:19:31
周杰伦和hebe的老瓜,藏着多少细节

周杰伦和hebe的老瓜,藏着多少细节

可乐谈情感
2026-02-27 08:45:23
1999年,迟浩田设局抓捕一位少将,对方被捕后挑衅:我爸知道吗?

1999年,迟浩田设局抓捕一位少将,对方被捕后挑衅:我爸知道吗?

叹为观止易
2026-02-20 13:32:06
听说,俄罗斯连长期居留的外国人也要强制兵役了?

听说,俄罗斯连长期居留的外国人也要强制兵役了?

黑噪音
2026-02-26 22:51:38
斯诺克8强出炉附赛程,周跃龙vs希金斯!大概率以下4人晋级半决赛

斯诺克8强出炉附赛程,周跃龙vs希金斯!大概率以下4人晋级半决赛

小火箭爱体育
2026-02-27 08:04:57
胡辣汤为什么走不出河南?

胡辣汤为什么走不出河南?

高广银
2026-02-27 06:04:47
下课仅 1 个月!阿莫林下家曝光,曼联球迷看完沉默了

下课仅 1 个月!阿莫林下家曝光,曼联球迷看完沉默了

奶盖熊本熊
2026-02-27 06:51:18
哈登重伤!骑士爆冷惜败,施罗德26分,阿伦27+11,一战看穿3件事

哈登重伤!骑士爆冷惜败,施罗德26分,阿伦27+11,一战看穿3件事

篮球扫地僧
2026-02-26 17:53:36
中日局势大变!一天之内,双方相继出大招,高市以身犯险硬刚到底

中日局势大变!一天之内,双方相继出大招,高市以身犯险硬刚到底

阿芒娱乐说
2026-02-27 02:38:02
小米推出米家燃气灶3猛火版5200W(天然气),899元

小米推出米家燃气灶3猛火版5200W(天然气),899元

IT之家
2026-02-27 10:28:08
闫学晶被曝新动态,求赵本山拉一把被拒,老赵当年就看出来了

闫学晶被曝新动态,求赵本山拉一把被拒,老赵当年就看出来了

非常先生看娱乐
2026-02-06 17:35:21
德国总理带队参观宇树科技 多名德企高管现场与机器人握手互动:别弄坏了,很贵的!|科技观察

德国总理带队参观宇树科技 多名德企高管现场与机器人握手互动:别弄坏了,很贵的!|科技观察

封面新闻
2026-02-27 11:21:03
81年江苏农妇捡到红色印章上交国家,日本人惊呼:百年难题解开了

81年江苏农妇捡到红色印章上交国家,日本人惊呼:百年难题解开了

春秋砚
2026-02-25 10:45:04
领克误关大灯引发事故,一句“暂时还不会哟”把网友整笑

领克误关大灯引发事故,一句“暂时还不会哟”把网友整笑

映射生活的身影
2026-02-26 23:57:02
服务区红包被捡走续:监控视频曝光,舆论反扑失主,强烈要求自证

服务区红包被捡走续:监控视频曝光,舆论反扑失主,强烈要求自证

千言娱乐记
2026-02-26 22:03:00
成功淘汰卫冕冠军 张帅强势晋级WTA梅里达站八强

成功淘汰卫冕冠军 张帅强势晋级WTA梅里达站八强

体坛周报
2026-02-27 12:22:13
日本真是一个淫乱变态的国家啊!不以为耻,反以为荣。 2月21日晚

日本真是一个淫乱变态的国家啊!不以为耻,反以为荣。 2月21日晚

网络易不易
2026-02-26 12:43:38
2026-02-27 13:23:00
侃故事的阿庆
侃故事的阿庆
几分钟看完一部影视剧,诙谐幽默的娓娓道来
529文章数 7748关注度
往期回顾 全部

科技要闻

英伟达业绩亮眼仍跌5% 两大因素成核心隐忧

头条要闻

86岁畅销书作家杨本芬就“抄袭”道歉 曾获谷雨文学奖

头条要闻

86岁畅销书作家杨本芬就“抄袭”道歉 曾获谷雨文学奖

体育要闻

一场必须要赢的比赛,男篮何止击败了裁判

娱乐要闻

继网暴谷爱凌后 美国欲没收其全部收入

财经要闻

魅族手机,终成弃子?

汽车要闻

宝马X5传承版发布:给经典G05的一场体面谢幕?

态度原创

家居
游戏
亲子
房产
健康

家居要闻

素色肌理 品意式格调

《生化危机:安魂曲》已现速通记录 2小时39分钟!

亲子要闻

不要让“大舌头”的标签,伤害孩子的自信

房产要闻

巨亏160亿后,这家房企巨头,转战海南做贸易!

转头就晕的耳石症,能开车上班吗?

无障碍浏览 进入关怀版