网易首页 > 网易号 > 正文 申请入驻

大模型实现“8小时工作制” !智谱GLM-5.1大幅提升长程任务能力

0
分享至

《科创板日报》4月10日讯(记者 李明明)智谱发布其迄今最智能的模型。

近日,智谱发布并开源新一代旗舰模型GLM-5.1。据介绍,其是唯一达到8小时级持续工作的开源模型,在最接近真实软件开发的SWE-bench Pro基准测试中,GLM-5.1实现国产模型首次超越Opus 4.6。

OpenRouter显示,伴随此次发布,智谱GLM再度提价10%。

《科创板日报》记者从相关方获悉,与过去一年行业主旋律“降价”截然相反,智谱本次提价,编码场景定价首次追平海外头部厂商Anthropic。这也寓示着国产大模型从价格战、低价换量转向性能溢价。

实测GLM-5.1

关于GLM-5.1的智能水平,智谱团队告诉《科创板日报》记者,GLM-5.1提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。

代码能力是模型智能水平进一步提升的关键。据悉,在业内最具代表性的三个代码评测基准的平均结果中,包括衡量模型专业软件开发工作的SWE-Bench Pro、操作命令行解决问题的Terminal-Bench 2.0、从零构建完整代码仓库的NL2Repo,GLM-5.1取得全球模型第三、国产模型第一、开源模型第一。

这也代表了大模型演进到现在的趋势之一,过去两年,行业用Benchmark衡量模型有多智能。上述智谱团队向《科创板日报》记者判断,下一阶段的衡量标准应该是“能工作多久”,即模型在Long-Horizon Task中的表现,能独立完成多长时间的人类任务。

业内也形成了共识,2025年3月,AI安全研究机构METR提出了一个改变行业认知的指标:任务完成时间线(Task-Completion Time Horizon)——不再衡量模型"多聪明",而是衡量它能独立完成多长时间的人类任务。研究显示,前沿模型的时间线每7个月翻一倍。这条指数曲线被MIT Technology Review称为"AI领域最重要的一张图",Sequoia Capital据此在2026年初宣告"这就是AGI"。

在长程任务中保持稳定输出,模型面对的不只是更大代码量,而是一连串复杂的工程决策点:主动跑benchmark、定位瓶颈、修改方案、再跑测试。这对模型提出更高的要求,需要像人类工程师一样,形成“实验→分析→优化”的完整闭环,而不是写完代码停下来等人打分。

《科创板日报》记者用开发者工具实测了GLM-5.1,测试案例如下:有一个专门考验AI编程能力的测试,任务是让AI做出一个能快速检索海量数据的系统,当时最强的成绩是Claude Opus 4.6创造的。

实测显示,智谱GLM-5.1在持续进行六百多次优化、六千多次操作后,性能还在不断提升,最终速度达到了之前最好成绩的6倍。



据了解,GLM-5.1也刷新了国产开源模型的成绩。

长期以来,全球大模型赛道始终存在一条难以逾越的鸿沟:开源模型与顶尖闭源模型之间存在肉眼可见的能力代差,而中国开源模型更是长期被贴上追赶者的标签,在国际公认的通用能力榜单上,始终与Claude、GPT系列的顶级闭源产品有明显差距。

而在最贴近真实软件开发场景的SWE-bench Pro基准测试中,GLM-5.1实现国产模型对Claude Opus 4.6的首次超越。

智谱GLM再度提价10%

性能提升的同时,智谱在价格层面也与海外厂商看齐,这也是国产模型价格首次对齐海外,模型聚合平台OpenRouter显示,智谱GLM再度提价10%。调价后,GLM-5.1在Coding场景的缓存命中Token价格已接近Anthropic旗下Claude Sonnet 4.6。

这不是智谱第一次涨价,此前,智谱2月12日发布GLM Coding Plan 价格调整函称, GLM Coding Plan市场需求持续强劲增长,用户规模与调用量快速提升。公司决定对GLM Coding Plan套餐价格进行结构性调整,整体涨幅自30%起。

《科创板日报》记者此前独家获悉,海外版GLM-5定价涨幅高于国内:Coding plan订阅价格提高30%-60%,API调用价格提升67%-100%。

此举为国产大模型2026年以来首次大幅提价。

一年前,行业还深陷“价格战”,普遍降价九成以上争夺份额。智谱为何敢于反向操作?

从核心动因看,需求端爆发是直接推手。GLM Coding Plan聚焦开发者代码生成、编程辅助场景,市场需求持续旺盛,用户规模、接口调用量双双快速攀升,平台长期处于高负载运行状态,对算力调度、服务稳定性、响应效率的要求显著提高,需求增速超出原有资源规划与承载能力。

在智谱2025年业绩说明会上,智谱CEO张鹏对《科创板日报》记者介绍,一季度智谱的API调用定价提升83%,即便如此,市场依然呈现出供不应求的情况,调用量增长400%。当前,智谱已成为国内付费Token消耗量最高的厂商之一。

关于涨价,张鹏此前在中关村论坛上回应称,长期依赖低价竞争不利于行业发展,调价旨在将价格拉回正常的商业价值区间。“完成一个长程任务所需要的Token量可能是回答一个简单问题时的十倍甚至百倍,价格调整本质上是价值变化的自然结果。”

据张鹏介绍,智谱已经实现了Token在全球范围内的价值变现。目前,GLM模型已全面部署于Google Vertex AI、AWS Bedrock等全球云服务商,并入驻OpenRouter、Vercel等国际主流模型聚合平台。

智谱MaaS商业化方面,MaaS API平台实现ARR 约17亿元(约2.5亿美金),同比提升60倍。

此外,《科创板日报》记者注意到,2026年开年以来,国内AI行业已从过去的“价格战”转向“价值定价”,一些底层算力与模型服务集体调价,主要包括:

腾讯云:3月11日对自研混元HY2.0系列模型大幅调价, 4月9日再次宣布5月9日起AI算力、容器服务等产品统一上调5%。

阿里云:3月18日宣布4月18日起,AI算力相关产品价格上调5%-34%,智算版存储产品上涨30%。

百度智能云:3月18日发布AI算力、存储等产品调价公告,AI算力相关产品服务上调5%-30%,并行文件存储价格上调约30%。

(科创板日报记者 李明明)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
这三种“长寿菜”活血化瘀,中老年人记得要常吃,提升免疫

这三种“长寿菜”活血化瘀,中老年人记得要常吃,提升免疫

江江食研社
2026-04-09 20:20:29
以色列回应为何猛烈袭击黎巴嫩真主党

以色列回应为何猛烈袭击黎巴嫩真主党

近距离
2026-04-09 11:58:14
Netflix用6集短剧掀桌,流媒体集体慌了

Netflix用6集短剧掀桌,流媒体集体慌了

热搜摘要官
2026-04-09 15:26:31
以军称对德黑兰多个机场发动“大规模空袭”

以军称对德黑兰多个机场发动“大规模空袭”

新华社
2026-04-06 23:23:03
美媒曝光多起疑似涉伊朗战事“内幕交易”

美媒曝光多起疑似涉伊朗战事“内幕交易”

新京报
2026-04-10 16:03:24
国家其实已经暗示得很明白了,只是很多人一直没真正听明白!

国家其实已经暗示得很明白了,只是很多人一直没真正听明白!

Ck的蜜糖
2026-04-10 17:45:46
《西游释厄传》BOSS还原后如此恐怖,但看到蜘蛛精后玩家不淡定了

《西游释厄传》BOSS还原后如此恐怖,但看到蜘蛛精后玩家不淡定了

街机时代
2026-04-09 18:00:03
十个新闻九个假!为啥本次美伊冲突的AI谣言这么多?

十个新闻九个假!为啥本次美伊冲突的AI谣言这么多?

军武次位面
2026-04-10 12:53:21
李亚鹏回应陈光标捐款:标哥真金白银捐了1000万,已经到账,没有限定用途!陈光标:钱怎么有效怎么用,无条件信任他

李亚鹏回应陈光标捐款:标哥真金白银捐了1000万,已经到账,没有限定用途!陈光标:钱怎么有效怎么用,无条件信任他

每日经济新闻
2026-04-10 12:30:03
随着深圳险胜,CBA又乱了!广东跌出四强,深圳第三,广州还有戏

随着深圳险胜,CBA又乱了!广东跌出四强,深圳第三,广州还有戏

多特体育说
2026-04-09 23:14:47
特朗普对伊朗误判不断,5目标均未实现

特朗普对伊朗误判不断,5目标均未实现

新浪财经
2026-04-10 11:40:27
抢在美国之前,中俄都动了!中国送9万吨大米,俄运10万吨原油

抢在美国之前,中俄都动了!中国送9万吨大米,俄运10万吨原油

午夜搭车a
2026-04-09 09:19:26
妮可·基德曼顶3斤假发亮相,Schiaparelli高定秒变淘宝

妮可·基德曼顶3斤假发亮相,Schiaparelli高定秒变淘宝

热搜摘要官
2026-04-10 08:02:47
司机运18吨西瓜,收货方开30个全坏,拒付运费,发货方让拉走抵账

司机运18吨西瓜,收货方开30个全坏,拒付运费,发货方让拉走抵账

一丝不苟的法律人
2026-04-09 14:37:32
爬山最强搭子,没有之一!

爬山最强搭子,没有之一!

新住家居
2026-04-10 07:07:11
樊振东再缺席世乒赛!许昕一句话揭开真相,王皓的确没说错

樊振东再缺席世乒赛!许昕一句话揭开真相,王皓的确没说错

罗纳尔说个球
2026-04-10 11:45:09
全红婵被282人建群专骂三年,泳协怒了,周继红亲自定调。

全红婵被282人建群专骂三年,泳协怒了,周继红亲自定调。

TVB的四小花
2026-04-10 17:18:31
集体跑路!伊朗狂揽400亿,法国带头交钱,美国惨遭全球孤立!

集体跑路!伊朗狂揽400亿,法国带头交钱,美国惨遭全球孤立!

喊山的姑娘
2026-04-10 13:46:44
洲际酒店回应被约谈:接受监督与指导!万豪、希尔顿等也有类似“霸王条款”

洲际酒店回应被约谈:接受监督与指导!万豪、希尔顿等也有类似“霸王条款”

红星资本局
2026-04-09 18:13:10
八千里路云和月:直到张云魁加入游击队,才懂廖丰年惨死的真相

八千里路云和月:直到张云魁加入游击队,才懂廖丰年惨死的真相

怂熊剧场
2026-04-10 06:00:56
2026-04-10 18:47:00
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
706126文章数 1019869关注度
往期回顾 全部

科技要闻

马斯克狂发大火箭也养不起AI 年亏50亿美元

头条要闻

王毅访问朝鲜会否同金正恩会面 外交部回应

头条要闻

王毅访问朝鲜会否同金正恩会面 外交部回应

体育要闻

17岁赚了一百万美元,25岁被CBA裁员

娱乐要闻

黄景瑜王玉雯否认恋情!聚会细节被扒

财经要闻

创业板改革制度落地 增设第4套上市标准

汽车要闻

搭载第二代刀片电池及闪充技术 腾势N8L闪充版预售35万起

态度原创

旅游
健康
亲子
手机
公开课

旅游要闻

永丰街道丨明后两天,花朝有约!仓城汉服游园会,等你赴约

干细胞抗衰4大误区,90%的人都中招

亲子要闻

小样,我还治不了你?

手机要闻

消息称三星上调4月Galaxy S26系列手机产量至300万台

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版