网易首页 > 网易号 > 正文 申请入驻

智谱发布GLM-5.1并再度提价 开源模型首次突破8小时持续工作能力

0
分享至

来源:证券时报e公司

4月8日,智谱正式发布GLM-5.1,并宣布正式开源。

二级市场上,港股开盘后智谱大涨,一度涨近18%,股价触及925港元,截至发稿,涨幅小幅回至13.48%。

GLM-5.1是全球第一个在真实工程任务中验证了8小时持续工作能力的开源模型。有别于当前以分钟级交互为主的模型,GLM-5.1能够在单次任务中持续、自主地工作长达8小时。过程中模型自主规划、执行、测试,碰壁时主动切换策略,出错后自行修复,最终交付完整的工程级成果。

据了解,GLM-5.1是智谱迄今智能度排名居前的旗舰模型,也是目前全球领先的开源模型。GLM-5.1大幅提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,GLM-5.1能够在一次任务中独立、持续地工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。

过去两年,大模型行业用benchmark(基准测试)来衡量模型的智能程度。智谱指出,下一阶段的衡量标准应该是“能工作多久”,即模型在长程任务(Long-Horizon Task)中的表现,能独立完成多长时间的人类任务。

这对模型提出了更深层次的挑战。在长程任务中保持稳定输出,模型面对的不只是更大的代码量,而是一连串复杂的工程决策点:主动跑benchmark(基准测试)、定位瓶颈、修改方案、再跑测试。模型需要像一个真正的工程师一样,形成“实验→分析→优化”的完整闭环,而不是写完一版代码就停下来等人打分。

具体来看,用户在涵盖50个真实机器学习计算负载的KernelBench Level 3优化基准上,让GLM-5.1对每个负载独立进行持续优化。在超过24小时的不间断迭代中,GLM-5.1自主完成了多轮编译—测试—分析—重写循环,最终取得3.6倍的几何平均加速比,显著高于超torch.compile max-autotune模式的1.49倍。以上体现出GLM-5.1展现的长时间工作和自进化能力,其从单纯的“代码生成器”进化为“主动的系统优化器”。

这一结果亦表明,在GPU内核优化这一传统上高度依赖专家经验的领域,AI模型已经展现出从问题分析、方案设计到迭代调优的端到端自主工作能力。在GPU以及更广泛的高性能计算领域,长期制约工程效率的优化瓶颈正在被AI逐步打破。

智谱方面强调,延长模型的“有效工作时长”是提升智能体能力的一个基础维度。在这条路上仍然有显著的技术挑战:如何克服模型面对复杂任务的上下文焦虑、如何在数千次工具调用后保持执行的一致性、如何更早地跳出局部最优,以及更重要的是如何在没有确定数值指标的任务上建立可靠的自我评估机制。

“GLM-5.1是我们在这个方向上迈出的一步,我们会持续推进。”智谱表示。

值得一提的是,智谱正式发布GLM-5.1之际,模型聚合平台OpenRouter显示,智谱GLM再度提价10%,调价后,GLM-5.1在Coding场景的缓存命中Token价格已接近Anthropic旗下Claude Sonnet4.6水平。

据悉,这是国产大模型首次在核心场景实现与海外头部厂商的价格对齐,一年前,国产大模型厂商还在以降价90%以上争夺市场份额。这一转折表明国产大模型不再单纯依靠大幅降价争夺市场,而是以性能溢价锚定国际基准。

据悉,GLM-5.1在编程能力上继续保持领先,在SWE-bench Pro、Terminal-Bench、NL2Repo三大代码评测基准的综合平均分中,取得全球第三、国产第一、开源第一;在最接近真实软件开发的SWE-bench Pro基准测试中更是实现国产模型首次超越Opus 4.6,刷新全球最佳成绩。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
郑丽文率中国国民党访问团拜谒中山陵

郑丽文率中国国民党访问团拜谒中山陵

新京报
2026-04-08 09:08:07
美国副总统万斯在匈牙利指责乌克兰干预匈牙利和美国大选

美国副总统万斯在匈牙利指责乌克兰干预匈牙利和美国大选

山河路口
2026-04-07 23:55:12
骗走50亿!用小鲜肉的血抗衰,被央视曝光的“捞金女王”,真栽了

骗走50亿!用小鲜肉的血抗衰,被央视曝光的“捞金女王”,真栽了

凡知
2026-04-07 21:16:54
国际油价持续拉高 美油涨4%创日内新高

国际油价持续拉高 美油涨4%创日内新高

每日经济新闻
2026-04-07 22:15:05
马杜罗被捕后暴瘦13公斤

马杜罗被捕后暴瘦13公斤

烽火观天下
2026-04-07 12:34:13
越南已被逼入绝境,总理临卸任死磕中国,赌上国运也要换掉米轨

越南已被逼入绝境,总理临卸任死磕中国,赌上国运也要换掉米轨

谛听骨语本尊
2026-04-07 18:33:35
吉林财大食堂“发疯120秒”视频流出:新型巨婴,别出来害人了

吉林财大食堂“发疯120秒”视频流出:新型巨婴,别出来害人了

小椰子专栏
2026-04-08 13:03:26
时速超300!郑丽文体验大陆高铁速度

时速超300!郑丽文体验大陆高铁速度

叮当当科技
2026-04-07 18:47:11
警方通报车辆坠河致5死

警方通报车辆坠河致5死

界面新闻
2026-04-07 18:28:58
大家做好准备,医院、银行已出现4大怪象,值得每个人深思

大家做好准备,医院、银行已出现4大怪象,值得每个人深思

细说职场
2026-04-08 08:51:27
因太漂亮被导演“收入囊中”的4位女星,有一位戏没拍完就怀孕了

因太漂亮被导演“收入囊中”的4位女星,有一位戏没拍完就怀孕了

雅儿姐游世界
2026-04-05 14:48:13
时隔6年,那个曾扬言让中国给全世界道歉,被央视开除的阿丘怎样了

时隔6年,那个曾扬言让中国给全世界道歉,被央视开除的阿丘怎样了

阅微札记
2026-04-07 15:01:54
突发!伊朗革命卫队:克制已结束,全面反击开始!

突发!伊朗革命卫队:克制已结束,全面反击开始!

达文西看世界
2026-04-08 11:00:04
倒闭车企留下的百万烂尾车主,被逼成了修车大神

倒闭车企留下的百万烂尾车主,被逼成了修车大神

酷玩实验室
2026-04-07 16:58:15
清明节,儿子写烧给母亲的祭文,看哭了14亿中国人!

清明节,儿子写烧给母亲的祭文,看哭了14亿中国人!

每日一首古诗词
2026-04-05 06:07:07
令人惊讶!那些喜欢嫖娼的男性,竟在某些方面存在这几个共同特征

令人惊讶!那些喜欢嫖娼的男性,竟在某些方面存在这几个共同特征

皓皓情感说
2026-04-07 23:33:28
没77湖人真炸了!队内互喷+开场2分钟主教练失控暴走

没77湖人真炸了!队内互喷+开场2分钟主教练失控暴走

贵圈真乱
2026-04-08 12:56:12
第99波!伊朗导弹精准斩首,以军官被一锅端,大批美军官被抬走

第99波!伊朗导弹精准斩首,以军官被一锅端,大批美军官被抬走

健身狂人
2026-04-08 03:04:47
伊朗最高领袖发声

伊朗最高领袖发声

第一财经资讯
2026-04-07 09:07:21
全红婵事件再发酵!人民日报13字怒批,体育总局动真格了

全红婵事件再发酵!人民日报13字怒批,体育总局动真格了

老特有话说
2026-04-05 17:59:03
2026-04-08 13:35:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2789803文章数 6490关注度
往期回顾 全部

财经要闻

特朗普同意停火两周 伊朗:接受停火提议

头条要闻

伊朗代表:感谢中俄 坚定站在历史正确的一边

头条要闻

伊朗代表:感谢中俄 坚定站在历史正确的一边

体育要闻

皇马1.5亿巨星浪费超级单刀 丢球摊手抱怨

娱乐要闻

杨颖邓超低调现身观众席 支持陈赫话剧

科技要闻

造出地表最强AI,却死活不给你用!

汽车要闻

5门5座/新复古造型 缤果Pro将于4月14日开启预售

态度原创

时尚
旅游
房产
健康
军事航空

阔腿裤失宠了?今年这几条裤子最时髦!

旅游要闻

秦皇河畔,郁金香用色彩“写”了封春日情书

房产要闻

千亿双国企,定序主城第一大盘!三亚买房逻辑变了!

干细胞抗衰4大误区,90%的人都中招

军事要闻

文化符号当“弹药” 美伊将信息战带入新阶段

无障碍浏览 进入关怀版