网易首页 > 网易号 > 正文 申请入驻

这款国产模型在海外悄悄爆火,全球程序员又多了一位中国伙伴

0
分享至


智东西
作者 陈骏达
编辑 漠影

这款国产编程模型,正在海外悄悄爆火!

国庆前夕,国产开源AI迎来一波集中发布,体验中国制造的开源模型,成了一众海外开发者们今年独特的“国庆七天乐”。

在X平台、Reddit和YouTube上,智谱于9月30日发布的GLM-4.6凭借其编程性能和价格优势,已经成为开发者社区热议的焦点。

“GLM-4.6是我用过最棒的编程模型”“这是我用过最具性价比的编程助手”,不少一线开发者在亲身体验后给出高度评价。还有多位海外AI领域的知名创业者、KOL专门发文推荐。以GLM-4.6为关键词在YouTube搜索,已经能找到十几条深度测评视频,从开发体验到部署教程全都覆盖了。

作为智谱GLM系列模型的最新成员,GLM-4.6不仅在多项基准测试上超过了DeepSeek-V3.2-Exp等国产开源模型,还在编程领域实现了媲美Claude Sonnet 4的性能,然而价格仅为后者的1/7

从发布之初的广受关注到如今在海外社区的持续发酵,GLM-4.6正上演着一场技术领域的“墙内开花墙外香”,成为中国AI走向世界舞台的又一成功案例。

一、GLM-4.6编程被玩疯了,海外AI博主化身“自来水”

一款模型究竟好不好用,一线开发者们最有发言权。在海外,已有不少开发者对GLM-4.6进行了广泛测试,并分享了真实案例。

多条GLM-4.6的测评帖在海外社媒的阅读量达到数十万次,这些帖子的互动量也较为可观,显示出开发者们对这款新模型的关注。

X平台上最大的Vibe Coding社区发起者Wes Winder分享,GLM-4.6在网页设计方面的表现几乎和Claude Sonnet系列模型相仿。


AI编程软件公司Finalpoint的联合创始人Jeremy Mack在模型发布当天就上手实测,他实测中所有的案例都是他一次生成的,未经修改。


Jeremy Mack认为,GLM-4.6和Claude Sonnet、GPT-5等模型相比,在设计上不会固执己见,采取了极简主义的风格,功能完备,在经典的小球弹跳测试题上做得恰到好处。

要在生产环境中发挥效用,GLM-4.6还需与现有的CLI、IDE工具实现较好的协同效应。Hugging Face产品主管Victor M分享道,他使用opencode+GLM4.6的组合编程了一整天,体验基本和Claude Code类似,但前者超级便宜。


Cline的产品营销经理Nick Baumann用Cline上的数百万个差异编辑数据,比较了GLM-4.6与Claude Sonnet 4.5之间的成功率表现。数据显示,GLM-4.6的成功率为94.9%,而Claude Sonnet 4.5的成功率为96.2%。

Baumann特别强调,虽然差异编辑并不是衡量编程模型能力的唯一标准,不过,在3个月前,GLM与Claude的差距还在5-10个百分点左右。


一位苹果的AI工程师Awni Hannun则分享了GLM-4.6在M3 Ultra芯片上的运行速度,该模型的量化版本能在M3 Ultra以每秒17个token以上的速度推理。Hannun还认为,GLM-4.6的基准测试结果,即便和最新发布的Claude Sonnet 4.5相比也很有竞争力。


在编程之外,GLM-4.6的写作与叙事能力成为不少海外用户热议的亮点。有一群AI创意写作爱好者在Reddit上分享了他们的体验,认为GLM-4.6在角色扮演(RP)、叙事创作以及人物塑造方面表现突出。


不少用户提到,GLM-4.6 的最大魅力在于它能进入角色的内心,能真正捕捉场景中的情感细微差别。


而另一位用户则称赞它“能让角色与你争论,而且他们的逻辑往往令人信服”;还有人提到GLM-4.6对角色服装、外貌的描述更具一致性。这种对情感与人物的精准把握,使得GLM-4.6在沉浸式对话和长篇叙事中表现格外出色。


总而言之,在角色扮演、写作等任务上,许多创作者认为GLM-4.6的对话更加真实、富有情感,且在避免“积极性偏见”(即过于迎合用户、回避冲突)方面做得不错,成为许多文字创作者的新宠。

关于GLM-4.6的讨论,不止于X平台与Reddit上的点评,更延伸至YouTube平台,众多AI博主带来了视角多元的深度分析。

拥有接近50万关注的博主Theo分享,他通过Kilo Code测试GLM-4.6模型,要求它展示React新推出的Activity API。这个案例具有一定的挑战性:

Activity API是React最近才新增的功能,模型并没有接受过相关训练;其次,为了完成任务,模型必须具备主动搜索网络信息的能力,以理解并使用这一全新的API。

在实际执行过程中,GLM-4.6生成的初版示例代码出现了小错误,不过当Theo指出后,模型几乎立刻就找出了问题并成功解决。

最终的结果令人印象深刻:程序运行稳定,界面设计也非常精美。虽然整体风格与Theo平时所见略有不同,但GLM-4.6展现出了高效的错误修复能力和优秀的界面设计水平。Theo称这比他平时从Claude获得的结果还要好。


博主Bijan Bowen则发布了一则30分钟的深度测评,全面考察了GLM-4.6在多种任务类型上的表现。该模型不仅在打造网页游戏、物理模拟等编程任务上表现出色,还在角色扮演任务上实现了准确又引人入胜的语气和写作风格。Bijan Bowen直呼:“这可能是我迄今为止测试过的最令人印象深刻的开源模型。”


性价比是YouTube AI博主们对这款模型的另一大印象。YouTube AI博主Fabio Bergmann称,GLM Coding Plan每月3美元的起始价格,与Claude Code动辄数百美元的订阅方案相比,简直“疯狂”。他认为,市面上没有其他模型能以相同的价格提供GLM-4.6所表现出的性能。


二、冲至竞技场开源第一,企业正用token投票

在获得开发者群体认可的同时,GLM-4.6也在多项权威榜单和真实调用数据上展现出优势。

在全球最受关注的大模型对战平台LMArena 上,GLM-4.6表现十分抢眼。发布后3天,GLM-4.6在Text Arena上的综合成绩并列全球第四在开源模型中位居全球第一,同时也是国内模型中并列第一的选手。


更值得注意的是,当排除风格控制因素、聚焦于内容生成真实能力时,GLM-4.6的得分升至全球第二,仅次于谷歌的Gemini 2.5 Pro。


而在所有模型的胜率榜单中,它位列全球第二,展现出在多领域任务上的稳定性能。


在编程能力方面,GLM-4.6于CC-Bench-V1.1评测中超过了多款国产开源模型,其整体胜率已超过Claude Sonnet 4这款编程领域的标杆模型,具备了与国际顶尖闭源模型同台竞技的实力。


此外,在全球知名开发者平台Factory AI的最新评估中,GLM-4.6在Terminal-Bench全部开源模型中排名第一,甚至超越了Claude Code中的Claude Sonnet 4。

Factory作为海外领先的AI Agent与开发自动化平台,其评估结果被全球开发者广泛参考。GLM-4.6是首款在该榜单上登顶的国产开源模型,它还被正式纳入Factory的Droid生态系统,这意味着全球开发者能更“即插即用”地使用这一模型。


在前端设计代码能力的Design Arena测评中,GLM-4.6同样表现出色,仅次于Claude与GPT系列,进一步验证了其在复杂指令理解与界面布局推理方面的成熟度。


除了评测成绩亮眼,GLM-4.6的实际使用热度也在迅速攀升。根据全球多模型聚合平台OpenRouter的最新统计,GLM-4.6已成为开发者调用频率最高的模型之一。

GLM-4.6一度在在平台热度趋势榜上排名第一,模型日榜位列第十一,API的付费调用量位居国内第一。


同时,智谱作为模型厂商,整体调用量排名已升至全球第七。


OpenRouter作为全球最具影响力的AI模型聚合与调用平台之一,其数据源于真实开发者的使用行为,极具代表性和权威性。

平台活跃度与付费情况直接反映了模型在实际开发与应用中的价值。GLM-4.6在OpenRouter上的持续走高,说明它不仅受到个人开发者的青睐,也正赢得越来越多企业级用户的信任与部署。

三、编程持续成为AI竞逐焦点,国产SOTA级模型意义何在?

编程模型,在过去很长一段时间以来一直是各大模型厂商竞逐的焦点。编程这一应用场景之所以特殊,在于它要求模型不仅要理解人类自然语言的模糊性,还要精准地转换为机器可执行的严谨逻辑。

从产品经理的需求描述到可运行的产品原型,从模糊的业务逻辑到健壮的系统架构,这一过程全面考验着模型的逻辑推理、上下文理解和创造性解决问题的能力。

正因如此,一个在编程任务上表现卓越的模型,其价值远不止于提升开发效率,更代表着在核心认知能力上的突破。

然而,适用于编程场景的大模型长期被Claude、GPT等少数海外闭源大模型家族主导。当全球开发者的生产力工具高度集中于少数几家美国大模型厂商时,配套的技术供应链便存在较大风险。此前,Claude、GPT系列模型都曾出现的断供风波,就是最好的印证。

此次,GLM-4.6不仅打造出了一款SOTA级别的开源编程模型,还在国产模型与国产芯片的适配上实现突破。GLM-4.6发布当天,寒武纪与摩尔线程就实现了Day 0适配。

GLM-4.6能在寒武纪的国产芯片上实现FP8+Int4混合量化部署,保持精度不变,但能大幅度降低推理成本。摩尔线程基于vLLM推理框架完成了对GLM-4.6的适配,新一代GPU可在原生FP8精度下稳定运行模型。

更重要的是,上述方案不会仅仅停留在实验室,还即将通过智谱MaaS平台正式面向大众和企业提供服务,让产业真正从中受益,也为打造更为独立自主的国产AI生态做出了贡献。

中国AI模型已在一次次迭代中,摆脱了“廉价替代品”的刻板印象,转而成为全球AI生态中不可或缺的力量。它们或凭借独特优势与海外模型形成强力互补,或在特定场景中完美取代昂贵方案,为用户提供兼具价格优势与性能的选择。

当海外开发者开始主动测试、比较并最终选择中国模型时,这种转变所带来的机遇,远超出单纯的市场份额竞争。

结语:当中国AI赢得全球开发者之心

从今年年初的DeepSeek-R1,到万亿参数大模型Kimi-K2,再到开源SOTA编程模型GLM-4.6,中国大模型厂商们正在一步一步改变全球开发者和企业对中国AI技术的认知。

智谱敏锐地把握住了这一趋势,近期在国际化布局上动作频频:今年启用了更具国际范儿的z.ai域名,与全球开源社区、开发者社区的互动也更加频繁。

这些举措,正逐渐树立国内大模型玩家作为全球AI生态的积极参与者的形象。以智谱为代表的中国企业,已在全球AI舞台上扮演着越来越重要的角色。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
火箭小将找到信心!登场17分钟高效砍12+3 没有失误彰显进步

火箭小将找到信心!登场17分钟高效砍12+3 没有失误彰显进步

惊奇侃球
2025-11-02 11:00:05
皇马4-0造惨案!各项6连胜+7分领跑西甲 姆巴佩双响 维尼修斯失点

皇马4-0造惨案!各项6连胜+7分领跑西甲 姆巴佩双响 维尼修斯失点

侃球熊弟
2025-11-02 05:37:36
机关算尽太聪明!“千亿儿媳”如今彻底成笑话,恶果已经开始显现

机关算尽太聪明!“千亿儿媳”如今彻底成笑话,恶果已经开始显现

二妹扯娱
2025-10-19 10:24:02
加州大学博士警告:一种新型精神病正在将孩子们推向深渊…

加州大学博士警告:一种新型精神病正在将孩子们推向深渊…

阅读第一
2025-11-02 08:33:11
日本知名声优因嫁给印度男子遭疯狂网暴!首次公开丈夫身份,直言在婆家每天吃咖喱…

日本知名声优因嫁给印度男子遭疯狂网暴!首次公开丈夫身份,直言在婆家每天吃咖喱…

东京新青年
2025-11-01 18:05:46
婆婆总把我女儿奶粉送小姑子,我没吱声,悄悄将奶粉换成名牌

婆婆总把我女儿奶粉送小姑子,我没吱声,悄悄将奶粉换成名牌

船长与船1
2025-11-02 08:09:54
南方省份一小区的三网宽带光箱,打开后惊呆了…

南方省份一小区的三网宽带光箱,打开后惊呆了…

通信老柳
2025-10-31 07:58:00
从一品大臣沦落到丧家之犬,盛宣怀仅用了15天

从一品大臣沦落到丧家之犬,盛宣怀仅用了15天

尚曦读史
2025-11-01 22:20:08
刘维伟心疼杨瀚森被网暴;开拓者满意小杨发挥,培养计划是长期的

刘维伟心疼杨瀚森被网暴;开拓者满意小杨发挥,培养计划是长期的

林小湜体育频道
2025-11-02 03:32:49
广东降温后,竟是全球17级风王。

广东降温后,竟是全球17级风王。

天气观察站
2025-11-02 05:39:00
马筱梅首谈大S为张兰正名,派亲妈送俩娃到成都,撕碎S家“体面”

马筱梅首谈大S为张兰正名,派亲妈送俩娃到成都,撕碎S家“体面”

疯说时尚
2025-11-02 11:51:42
戴旭:中国从来没有单独彻底战胜过日本,未来一战永绝后患

戴旭:中国从来没有单独彻底战胜过日本,未来一战永绝后患

boss外传
2025-11-01 12:00:03
中国选手赵鸿刚在世界职业扇耳光大赛中被对手KO倒地

中国选手赵鸿刚在世界职业扇耳光大赛中被对手KO倒地

大眼瞄世界
2025-11-02 00:00:48
跌下神坛的贵族水果,从百元一斤跌到几块钱,人们反而不愿意买了

跌下神坛的贵族水果,从百元一斤跌到几块钱,人们反而不愿意买了

妙招酷
2025-10-29 00:22:47
知名女星官宣结婚已怀孕

知名女星官宣结婚已怀孕

鲁中晨报
2025-11-01 10:35:36
全红婵放弃全运单人角逐系顶层决策,并不仅仅是保护身体那么简单

全红婵放弃全运单人角逐系顶层决策,并不仅仅是保护身体那么简单

杨华评论
2025-11-01 19:30:01
再看《康熙王朝》:才发现为何容妃刷27年马桶,康熙始终不闻不问

再看《康熙王朝》:才发现为何容妃刷27年马桶,康熙始终不闻不问

草莓解说体育
2025-11-01 01:24:54
周末信息如何影响市场?明天是红色星期一?还是黑色星期一?

周末信息如何影响市场?明天是红色星期一?还是黑色星期一?

春江财富
2025-11-02 09:19:09
看文强回忆录才知道陈诚不救吴石的两个原因:他的处境有多危险?

看文强回忆录才知道陈诚不救吴石的两个原因:他的处境有多危险?

半壶老酒半支烟
2025-11-01 18:59:07
辽宁省委书记:推动举办东北城市联赛,为足球从业者搭建平台

辽宁省委书记:推动举办东北城市联赛,为足球从业者搭建平台

懂球帝
2025-11-01 17:28:19
2025-11-02 12:47:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
10684文章数 116892关注度
往期回顾 全部

科技要闻

10月零跑突破7万辆,小鹏、蔚来超4万辆

头条要闻

万斯一句话让印度裔美国人炸锅 遭铺天盖地批评后回应

头条要闻

万斯一句话让印度裔美国人炸锅 遭铺天盖地批评后回应

体育要闻

李大林获2025北马国内男子组冠军

娱乐要闻

离世的他曾是刘德华张学友御用班底

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

神龙汽车推出“发动机终身质保”政策

态度原创

本地
房产
旅游
家居
公开课

本地新闻

全网围观,到底多少人被这个野人大学生笑疯了

房产要闻

中粮(三亚)国贸中心ITC首期自贸港政策沙龙圆满举行

旅游要闻

沪杭文旅再携手!佘山度假区带着“上海之根”的诗意来到杭州西湖畔

家居要闻

吸睛艺术 富有传奇色彩

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版