网易首页 > 网易号 > 正文 申请入驻

智谱GLM-5.1上线:20万上下文窗口+零调用费

0
分享至


3月27日,智谱突然放出GLM-5.1。不是发布会,没有预热,官网一行更新日志,Coding Plan用户(Max/Pro/Lite三档)直接解锁调用权限。这距离GLM-5正式发布才过去不到两个月,版本号跳得比Chrome还勤快。

20万token上下文窗口,输入输出全免费。这两个数字放在当前市场什么概念?Claude 3.7 Sonnet的20万窗口要按量付费,GPT-4o的同级别上下文是12.8万。智谱这次把成本直接压到零,相当于在别人的收费停车场门口挂了个"免费停车"的牌子。

配置方法已经流出。Claude Code用户需要手动改settings.json,把环境变量指向GLM-5.1;OpenClaw用户更麻烦些,要在providers.zai.models数组里追加配置对象,再改默认模型指向。IT之家把步骤拆解到了命令行级别,Mac用户记得vim后加":wq"保存——这种细节说明文档是工程师自己写的,没经过市场部润色。

为什么版本号从5跳到5.1,却值得专门发一版?

看配置参数就懂了。GLM-5.1的contextWindow维持在204800(20万token),maxTokens(最大输出长度)131072,和GLM-5完全一致。但reasoning字段保持true,说明推理能力没缩水。真正的升级藏在调用策略里:Coding Plan用户之前用GLM-5可能有隐性配额或速率限制,5.1版本明确"所有档位均可调用",等于把权限边界彻底打开。

有个细节很有意思。配置示例里GLM-5.1的cost对象,input/output/cacheRead/cacheWrite四项全部标0。这不是"暂未定价"的占位符,而是实打实的免费策略。对比OpenAI的o1-pro每百万输入token收15美元,智谱这招相当于在代码生成赛道直接掀桌。

但免费也有代价。目前GLM-5.1只开放给Coding Plan订阅用户,不是全民公测。这个Plan的定价体系里,Lite档最便宜,Max档最贵,三档共享同一套模型权限。换句话说,智谱在用模型能力做订阅分层,而不是按调用量计费——这和主流云厂商的商业模式完全相反。

Claude Code和OpenClaw的适配,暴露了智谱的野心

两个配置路径值得玩味。Claude Code是Anthropic官方推出的CLI工具,OpenClaw是开源的Claude替代客户端。智谱同时支持两者,意味着不想被锁死在任何单一生态里。更微妙的是环境变量命名:ANTHROPIC_DEFAULT_SONNET_MODEL、ANTHROPIC_DEFAULT_OPUS_MODEL,直接复用了Anthropic的模型等级体系。GLM-5.1对标的是Claude的Sonnet/Opus档位,而不是自家的数字序列。

这种"借壳上市"的策略很聪明。开发者不用重新学习模型能力图谱,看到"Opus级别"就知道是旗舰性能。但风险也在这里:如果GLM-5.1的实际表现配不上Sonnet/Opus的期待,口碑反噬会比独立命名更猛烈。

OpenClaw的配置更暴露技术细节。contextWindow 204800是硬编码的静态值,不是动态伸缩。这意味着长文本处理时,系统会一次性加载20万token的上下文窗口,哪怕实际对话只有2000token。对本地内存和带宽都是考验,但换来了确定性——不会出现"聊着聊着窗口被截断"的意外。

零成本背后的算盘: Coding Plan到底在卖什么?

所有模型调用免费,那Coding Plan的订阅费买什么?目前能看到的是速率保障、优先排队、以及可能的专属功能解锁。这和GitHub Copilot的商业模式类似:模型推理成本被摊进月费,用户感知不到单次调用的价格波动。

但智谱走得更远。GLM-5.1的免费不是限时促销,是写入配置文件的永久cost: 0。这意味着一旦用户习惯养成,后续提价的空间被锁死。除非——除非5.1只是过渡版本,真正的收费模型叫GLM-5.5或者GLM-6。

一个反常识的数据点:GLM-5.1的maxTokens 131072,换算成中文大约是9万字输出。足够一次性生成完整的技术文档、中型项目的代码骨架、或者长篇报告。之前的模型往往在2-4万字处截断,需要用户手动"继续生成"。这个提升对自动化工作流的意义,比跑分高5%实在得多。

配置教程里的"Mac用户记得:wq",说明了什么?

IT之家的文档里混着vim操作提示,这种颗粒度的说明通常来自社区贡献或官方技术支持的直接搬运。侧面印证GLM-5.1的发布节奏确实仓促,没来得及做包装级的用户引导。好处是信息保真,坏处是门槛过高——非技术背景的订阅用户可能根本找不到settings.json在哪。

这也解释了为什么限定Coding Plan用户。能自己改JSON配置的人,大概率是目标客群里的高活跃用户,反馈质量和容忍度都更高。等这批人跑通流程、产出案例,再开放给更广泛的用户层,是更稳妥的 rollout 策略。

目前社区里已经有人在测试GLM-5.1的长文本稳定性。20万窗口处理代码库时,能否保持上下文一致性,是比跑分更关键的验收标准。有用户反馈说,在处理超过15万token的遗留项目时,模型对跨文件依赖关系的理解"比GLM-5少了些幻觉",但具体数据还在收集中。

智谱没公布GLM-5.1的技术白皮书,也没有基准测试分数。这种"先上线、后解释"的做法,在国产大模型里越来越常见。好处是抢占用户心智,坏处是专业开发者会持币观望——毕竟谁也不想基于一个黑箱做架构决策。

但免费本身就是最强的信号。当竞争对手还在按token计费时,智谱选择用订阅制换生态位。这个赌局的关键在于:Coding Plan的用户增长,能否覆盖模型推理的边际成本?以及,当用户习惯了20万窗口+零调用费,还能不能接受回退到付费模式?

GLM-5.1的配置文件里,model ID写的是"glm-5.1",但name字段是"GLM-5.1"。大小写不一致这种细节,通常不会出现在成熟产品的发布流程里。是赶工痕迹,还是故意为之?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
真相来了!浓眉亲承:因为锡安我才去了湖人,如果选莫兰特绝不走

真相来了!浓眉亲承:因为锡安我才去了湖人,如果选莫兰特绝不走

夜白侃球
2026-04-10 14:41:02
樊振东不是自愿弃赛的!3大隐情曝光,王皓回应引猜测,热议不断

樊振东不是自愿弃赛的!3大隐情曝光,王皓回应引猜测,热议不断

荣亭小吏
2026-04-10 15:03:48
绿营将“追杀”郑丽文,爆料称高层交代不放过一人,直到达成目的

绿营将“追杀”郑丽文,爆料称高层交代不放过一人,直到达成目的

谛听骨语本尊
2026-04-10 18:30:15
完整导弹生产线转让中国,三次相助引美俄羡慕

完整导弹生产线转让中国,三次相助引美俄羡慕

郭长包工头
2026-04-09 16:28:43
设计院的工资已经恐怖如斯?

设计院的工资已经恐怖如斯?

黯泉
2026-04-10 18:46:11
人山人海!常州接住了泼天流量…

人山人海!常州接住了泼天流量…

常州大喇叭
2026-04-11 15:45:05
随着长春亚泰2-1,深圳青年人3-0,中甲最新积分榜出炉

随着长春亚泰2-1,深圳青年人3-0,中甲最新积分榜出炉

凌空倒钩
2026-04-11 17:52:00
Type-C 接口最大的问题,是看起来已经「统一」了

Type-C 接口最大的问题,是看起来已经「统一」了

少数派sspai
2026-04-10 12:11:49
人都死了,才罚7.6万?越看越不对劲

人都死了,才罚7.6万?越看越不对劲

走读新生
2026-04-09 15:37:03
刺激!深圳有人年初买房已经赚了100万!

刺激!深圳有人年初买房已经赚了100万!

楼市灭霸
2026-04-10 13:27:25
我们并没有用40年走完发达国家200年的路

我们并没有用40年走完发达国家200年的路

文青大叔说
2026-03-13 08:13:38
4月10日俄乌最新:万斯再开黄腔

4月10日俄乌最新:万斯再开黄腔

西楼饮月
2026-04-10 16:09:59
日本降级对华关系,称中方欠日本两笔账,中方回了一句大白话

日本降级对华关系,称中方欠日本两笔账,中方回了一句大白话

一口娱乐
2026-04-11 18:27:31
到高中,你会发现:去了普通高中,基本就跟985、211没什么关系了

到高中,你会发现:去了普通高中,基本就跟985、211没什么关系了

好爸育儿
2026-02-03 17:51:04
武警部队原副政委蒋金锵将军逝世,享年91岁

武警部队原副政委蒋金锵将军逝世,享年91岁

澎湃新闻
2026-04-11 15:26:26
为了对抗中国车企的极致效率,丰田不再为“看不见的完美”买单

为了对抗中国车企的极致效率,丰田不再为“看不见的完美”买单

澎湃新闻
2026-04-10 19:34:06
4-0!西汉姆联赢下保级生死战+主场5轮不败 正式将热刺送入降级区

4-0!西汉姆联赢下保级生死战+主场5轮不败 正式将热刺送入降级区

我爱英超
2026-04-11 06:18:56
70岁后,这两个地方别去,不是迷信,是实在话

70岁后,这两个地方别去,不是迷信,是实在话

宝哥精彩赛事
2026-04-11 18:04:46
“桎梏”不要再读 zhì kù,或 zhì gào,丢不起那个人!

“桎梏”不要再读 zhì kù,或 zhì gào,丢不起那个人!

未央看点
2026-04-10 00:09:02
奉劝退休金高的老年人:回农村养老时,尽量装穷把退休金说少一点

奉劝退休金高的老年人:回农村养老时,尽量装穷把退休金说少一点

小马达情感故事
2026-04-11 19:25:03
2026-04-11 20:39:00
全栈遛狗员
全栈遛狗员
白天跟需求对线,晚上在小区遛狗。
1189文章数 45关注度
往期回顾 全部

科技要闻

半夜被燃烧瓶砸醒,OpenAI CEO发文反思

头条要闻

美国否认同意解冻伊朗资产 巴官员:美方急了 伊朗不急

头条要闻

美国否认同意解冻伊朗资产 巴官员:美方急了 伊朗不急

体育要闻

换帅之后,他们从降级区冲到升级区

娱乐要闻

浪姐7淘汰 该走的没走,不该走的走了

财经要闻

从日本翻身看:这次谁能扛住高油价?

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

健康
艺术
游戏
时尚
军事航空

干细胞抗衰4大误区,90%的人都中招

艺术要闻

从1984到2024,9届全国美展油画最高奖作品

翻车!索尼PS5限定手柄丑到被群嘲 玩家:别毁童年经典

普通人穿衣其实很简单!构造腰线、一衣多穿,大方舒适又自然

军事要闻

伊朗议长带四名遇难儿童照片赴美伊谈判

无障碍浏览 进入关怀版