网易首页 > 网易号 > 正文 申请入驻

只用1/3算力,用35B模型干掉120B的日常主力

0
分享至

快速导读:有人把Qwen 3.5-35B-A3B设为主力模型,替换掉了GPT-OSS-120B。这不是参数的胜利,是架构逻辑的一次重写——更少的激活参数,更快的推理速度,跑在一张5090加一张3090上,100k上下文,128 tok/s。本地部署的性价比天花板,可能刚刚被重新定义。

该图片可能由AI生成

一个能说明问题的测试:把一张填好答案的填字游戏图片扔给模型,要求它用视觉识别字母,再用逻辑推理还原空格的位置。

Qwen3.5-27B做到了,用了8分钟30秒,跑在42 tok/s。

Qwen3.5-35B-A3B也做到了,用了2分35秒,跑在128 tok/s。

两个模型都答对了。但一个让人等到快放弃,另一个让人觉得这台机器终于活过来了。

这就是MoE架构正在做的事:35B的总参数量,每次推理只激活3B。不是在硬件上堆算力,而是在模型设计上做了一次减法——只调用手头的牌,不把整副牌都翻出来看。GPT-OSS-120B激活了5.1B参数,按这个逻辑算,差距比数字本身表现出的要小得多。

有人同时跑了27B和35B的非思考模式,做的是多语言文本处理任务——不是英文摘要,是其他语言的语言结构理解。结论是:35B的非思考模式碾压了27B的非思考模式。27B在这类任务上表现“非常差”,原话。

思考模式(Thinking Mode)这件事在社区里一直有争议。有人觉得模型一直在“但等等……但等等……”地内耗,是噪音。有人觉得那是核心。真实情况更接近后者——但触发条件要对。视觉任务和复杂推理打开思考,日常对话和文本处理关掉,二者不冲突。官方为不同场景给出了四组参数配置,覆盖了通用思考、精准编程、指令任务和推理任务,不同场景用不同的temperature和presence\_penalty,不是一刀切。很多人踩的坑,其实是漏掉了`presence_penalty=1.5`这个参数——模型开始无限循环,不是架构问题,是参数没配对。

还有人把它跑在CPU上:256GB DDR5-6000加9950X3D,8 tok/s,模型占用约20GB内存。对于自动化任务来说,这个速度够用,还不占GPU。

如果你现在用的是云端API,每个月在为token量付费,同时担心自己的代码、数据、业务逻辑以某种方式流入不透明的训练管道——这个配置组合已经把“本地部署够不够用”这个问题的答案推得更远了一些。

剩下的问题是:你的业务里,有多少任务的质量要求,其实一直没你想象的那么高?

简评:

以前本地跑模型是“省钱但将就”,现在是“不知道要将就什么了”。MoE架构最有意思的地方不在于它激活了多少参数,而在于它证明了一件事:规模不是唯一的维度。一个会挑牌打的35B,正在击败一个把所有牌都摊开的老模型。

ref: reddit.com/r/LocalLLaMA/comments/1rh43za/qwen_3535ba3b_is_beyond_expectations_its_replaced

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
超20000名旅客滞留!“迪拜机场已经没有航班了”,阿联酋宣布:承担所有旅客滞留费用

超20000名旅客滞留!“迪拜机场已经没有航班了”,阿联酋宣布:承担所有旅客滞留费用

江西工人报
2026-03-01 22:27:25
快讯!伊朗大捷!

快讯!伊朗大捷!

达文西看世界
2026-03-01 16:46:09
美以空袭伊朗,阿拉伯国家联盟发声:“阿拉伯-以色列冲突升级为全面地区战争的时刻”

美以空袭伊朗,阿拉伯国家联盟发声:“阿拉伯-以色列冲突升级为全面地区战争的时刻”

环球网资讯
2026-03-01 11:00:18
哈梅内伊死后,有伊朗人分析:现在还没到庆祝的时候

哈梅内伊死后,有伊朗人分析:现在还没到庆祝的时候

小萝卜丝
2026-03-01 09:56:11
3月3日元宵节,牢记:1不留,2不洗,3不穿,4不空!马年大吉

3月3日元宵节,牢记:1不留,2不洗,3不穿,4不空!马年大吉

阿龙美食记
2026-03-01 16:17:49
“大力神”军机坠毁 已致15人死亡 天空下钞票雨 民众疯抢!

“大力神”军机坠毁 已致15人死亡 天空下钞票雨 民众疯抢!

每日经济新闻
2026-02-28 14:37:58
美军公布伤亡情况

美军公布伤亡情况

环球时报国际
2026-03-02 00:10:13
伊朗称袭击致美军伤亡560人

伊朗称袭击致美军伤亡560人

财联社
2026-03-02 00:54:12
今年,北京已无离职潮

今年,北京已无离职潮

微微热评
2026-03-01 18:45:40
伊朗外长:新任最高领袖将在“一或两天”内被选出

伊朗外长:新任最高领袖将在“一或两天”内被选出

财联社
2026-03-01 23:33:52
回顾:浙江幼师幼儿园潜伏22年,警察曝光真实身份,家长后怕不已

回顾:浙江幼师幼儿园潜伏22年,警察曝光真实身份,家长后怕不已

谈史论天地
2026-03-01 09:49:38
重大进展!伊朗作出“前所未有”承诺:同意永远不拥有可制造核武器的核材料,将实现“零积累、零库存”,并接受全面核查!特朗普最新表态

重大进展!伊朗作出“前所未有”承诺:同意永远不拥有可制造核武器的核材料,将实现“零积累、零库存”,并接受全面核查!特朗普最新表态

每日经济新闻
2026-02-28 10:40:45
美以刺杀伊朗最高领袖和总统失败

美以刺杀伊朗最高领袖和总统失败

财联社
2026-02-28 18:48:32
真的天塌!拔乳牙竟把孩子2颗恒牙拔掉,盐城一口腔医生整出事故

真的天塌!拔乳牙竟把孩子2颗恒牙拔掉,盐城一口腔医生整出事故

火山詩话
2026-03-01 18:08:52
又一个国家采取军事行动! 瑞典在厄勒海峡上空拦截了俄罗斯无人机

又一个国家采取军事行动! 瑞典在厄勒海峡上空拦截了俄罗斯无人机

一种观点
2026-02-28 08:44:21
伊朗“斩首”疑云:美以为何总能做到“百万军中取上将首级”?

伊朗“斩首”疑云:美以为何总能做到“百万军中取上将首级”?

国是直通车
2026-03-01 17:53:07
特朗普称美方“基本摧毁”伊朗海军总部

特朗普称美方“基本摧毁”伊朗海军总部

财联社
2026-03-02 01:29:13
云淡风轻!网传特朗普指挥袭击伊朗前几分钟,还在家中参加派对

云淡风轻!网传特朗普指挥袭击伊朗前几分钟,还在家中参加派对

小萝卜丝
2026-03-01 13:10:35
网友预测明天早上10点半 deepseek 发布V4 模型,首次没给英伟达权限,选择与华为合作

网友预测明天早上10点半 deepseek 发布V4 模型,首次没给英伟达权限,选择与华为合作

风向观察
2026-03-01 17:11:32
两个人的律所干翻千人大所!靠Claude在两小时拆穿对方三处漏洞

两个人的律所干翻千人大所!靠Claude在两小时拆穿对方三处漏洞

三言四拍
2026-03-01 20:58:56
2026-03-02 03:40:49
我不叫阿哏
我不叫阿哏
分享有趣、有用的故事!
323文章数 6469关注度
往期回顾 全部

科技要闻

荣耀发布机器人手机、折叠屏、人形机器人

头条要闻

特朗普警告伊朗“不要报复” 伊朗外长回应

头条要闻

特朗普警告伊朗“不要报复” 伊朗外长回应

体育要闻

火箭输给热火:乌度卡又输斯波教练

娱乐要闻

黄景瑜 李雪健坐镇!38集犯罪大剧来袭

财经要闻

中东局势升级 如何影响A股、黄金和原油

汽车要闻

理想汽车2月交付26421辆 历史累计交付超159万辆

态度原创

教育
手机
健康
游戏
公开课

教育要闻

初中阶段的分化,从习惯悄悄开始

手机要闻

现场直击!荣耀Robot Phone机器人手机长啥样

转头就晕的耳石症,能开车上班吗?

以《生化危机》命名?Capcom解答对RE引擎的误读

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版