网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

智谱发布GLM-5.1高速版API，400 tokens/s刷新全球速度纪录

2026-05-22 15:03:00　来源: 侃故事的阿庆

福建举报

0

分享至

智谱面向部分企业客户推出 GLM-5.1 高速版 API ，其模型输出速度达到 400 tokens/s ，刷新了全球大模型官方接口的端到端速度上限。

在完整保留原有旗舰模型能力的前提下，此高速版通过智谱与 TileRT 团队联合研发的高性能推理引擎进行驱动。此引擎彻底重构了 GPU 的运行调度机制，在编译期将模型静态编排为一个常驻 GPU 的 persistent Engine Kernel 。单卡推理时，计算、异步 IO 与通信被全部拆解为 tile 级微任务并仅启动一次 kernel ，算子间的中间结果通过寄存器和共享缓存直传，消除了传统推理中频繁内核启动与显存读写带来的延迟空泡。

当扩展至多卡尺度时， TileRT 进一步将 specialization 并行思路扩展到整张 8 卡 NVL 拓扑，将原本同构的 GPU 节点特化为承担不同任务的异构 Worker 。在处理 GLM-5.1 的注意层计算时，系统指派 GPU 0 运行稀疏索引 Worker ，专门进行稀疏索引构建与路由决策。同时指派 GPU 1 至 GPU 7 运行 MLA Worker ，负责计算密集阶段并将通信完全下沉至 tile 级任务流水线内部，实现了计算与跨卡通信的深度重叠。

此高速版服务目前已面向智谱 MaaS 平台的部分企业客户开放。未来，此技术还将进一步优化 FP8 推理与超长上下文生产环境，为 AI 编程、实时交互和实时语音等低延迟敏感场景提供更具确定性的性能支持。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

顶流里最快！智谱，你是在「喷」代码吧

量子位 2026-05-22 11:01:28
0 跟贴 0
CVPR 2026 | 从视觉Token内在变化量出发，实现VLM无损加速1.87倍

机器之心Pro 2026-03-16 11:56:33
0 跟贴 0

首个三模式大语言模型：4倍token吞吐量，长文本秒级时代要来了？

机器之心Pro 2026-05-22 14:21:21
0 跟贴 0

大模型API的大众点评来了：7×24小时实测，毫秒级延迟智能路由

量子位 2026-02-02 11:48:44
2 跟贴 2
MoE路由拥有「记忆」：RMS-MoE用检索记忆协同实现更高效专家调度

机器之心Pro 2026-05-09 09:37:42
0 跟贴 0

OpenClaw案例：无需恶意攻击，日常聊天也能「黑化」Agent！

新智元 2026-05-22 13:01:01
0 跟贴 0

其实速度并不是唯一追求

艾尼剪影 2026-05-22 08:56:16
1 跟贴 1
AIM-260真身曝光，多技术提升射程，能否反超霹雳-15 ？

陈虎点兵 2026-05-22 21:39:49
1 跟贴 1

15%全量Attention！「RTPurbo」阿里Qwen3长文本推理5倍压缩方案

机器之心Pro 2025-12-23 12:52:34
0 跟贴 0
36年卷积猜想被解决，华人唯一作者，AI或受益

机器之心Pro 2025-11-26 14:30:39
1 跟贴 1
天下苦CUDA久矣，又一国产方案上桌了

量子位 2026-01-30 21:59:52
6 跟贴 6
19岁，常青藤辍学，这群中国年轻人重构了AI记忆

量子位 2026-04-04 16:21:02
0 跟贴 0
俄英战机"空中拼刺刀" 英称苏27六次横切6米"贴脸"拦截

环球网资讯 2026-05-22 13:12:47
7089 跟贴 7089
奥特曼预言与现实相差几何？12个顶级模型“创业”一年，仅3个存活

钛媒体APP 2026-04-03 17:11:08
0 跟贴 0
HiF-VLA：以motion为中心打造「边想边做」的世界动作模型

机器之心Pro 2026-05-22 10:14:01
0 跟贴 0
河南一景区现“爬不动了吧哈哈哈哈”标语，游客感觉不被尊重，景区：已撤除，本意是缓解爬山压力

极目新闻 2026-05-19 14:48:26
8307 跟贴 8307
F-22战斗机启动引擎，一股青烟喷涌而出

装甲铲史官 2026-01-25 12:20:23
0 跟贴 0
白纸模型助瓷砖严丝合缝

超市王小小 2026-05-21 21:35:19
4 跟贴 4
大模型两年进化：从数错字母到奥数金牌

野生运营 2026-05-22 00:19:29
0 跟贴 0
进阶专题概览——信息、计算与物理的大融合 | 量子场论第十二讲

集智俱乐部 2026-05-20 16:16:19
0 跟贴 0
美军越野车涉水测试，引擎完全淹没照样行驶

装甲铲史官 2026-04-29 11:51:27
832 跟贴 832
设计很原创！静态体验红旗越野！大梁+激光雷达+差速锁+娱乐屏

驾享来电 2026-05-21 18:02:33
3 跟贴 3
记忆被清空后，你还是你吗？

算力游侠 2026-05-21 01:04:09
0 跟贴 0
揭秘双柱罗马柱施工技术，难度远超想象，绝妙工艺令人惊叹！

奇怪小萌新 2026-05-21 13:32:41
1 跟贴 1
证通电子：公司自研多源异构算力调度平台具备对外提供渲染、AI推理等算力出租服务的能力

每日经济新闻 2026-05-22 21:05:13
0 跟贴 0
《极限竞速：地平线6》极速任务攻略：强制匹配与限定车型的破局技巧

宇宙来信发 2026-05-23 00:10:14
0 跟贴 0
红人队德拉克鲁兹速度骤降，从联盟最快跌出前百

晚风知我意21 2026-05-23 00:21:18
0 跟贴 0
你停不下来的焦虑，从学会比较的12岁就开始了

宅家小欢喜 2026-05-23 01:38:51
0 跟贴 0
行车记录仪时速不到60km，监控抓拍时速却达121km，厢货车司机叫屈；交警：记录仪不具备法定测速资质

大风新闻 2026-05-22 17:59:04
1716 跟贴 1716
王楚钦大满贯突破揭秘：技术精进背后的真相

只若初见h 2026-05-21 13:32:26
1 跟贴 1
有毒，千万别摘！南京街头已出现

环球网资讯 2026-05-22 14:47:11
126 跟贴 126
一起来听听经济低迷时，房地产会否再次成为拉动引擎？1

大才新鲜事 2026-05-23 01:01:57
0 跟贴 0
中国迎来“天命时刻”！沈逸：成为全球战略稳定与发展的核心动力

海峡导报社 2026-05-22 17:22:28
78 跟贴 78
法国政府宣布新增7.1亿欧元援助

每日经济新闻 2026-05-22 08:21:36
1791 跟贴 1791
ICML 2026｜智能体的下半场：为什么「答对」已经不够了？

机器之心Pro 2026-05-22 14:09:10
0 跟贴 0
第十六届“春兰杯”开幕，柯洁时隔16个月重返国际赛场

新京报 2026-05-22 20:58:40
73 跟贴 73
硬核啊，用这样的设备操作模型直升机！

长安一片月 2026-05-20 15:03:35
17 跟贴 17
无锡一公园用墓碑铺路，刻有“先父”“贤妻”字样，游客直呼难以接受，公园回应

潇湘晨报 2026-05-22 16:07:14
312 跟贴 312
美退役海军中将接受采访画面引争议：颈部怪异被质疑戴面具

环球网资讯 2026-05-22 13:44:12
124 跟贴 124
赶在美军前面，中国海军三艘航母将全部列装隐身舰载机？

阿龙聊军事 2026-05-23 03:45:22
0 跟贴 0

为何不支持韩红？张雪回应：李亚鹏连房租都交不起赛季末做补偿

为何不支持韩红？张雪回应：李亚鹏连房租都交不起赛季末做补偿

风过乡

2026-05-22 07:09:12

王炸！同济医院武汉新大楼，总建筑面积超7.4万平方米，预计10月竣工投用！

王炸！同济医院武汉新大楼，总建筑面积超7.4万平方米，预计10月竣工投用！

越乔

2026-05-22 22:54:41

强降雨区域转移，湖北安徽河南将成暴雨大暴雨集中地，局地累计雨量或具有一定极端性

强降雨区域转移，湖北安徽河南将成暴雨大暴雨集中地，局地累计雨量或具有一定极端性

极目新闻

2026-05-22 18:30:33

两性关系：男性过了75，不管跟谁处，牢记4句话，余生少心酸

两性关系：男性过了75，不管跟谁处，牢记4句话，余生少心酸

匹夫来搞笑

2026-05-14 00:32:20

跟具俊晔在一起的三年是大S最幸福的三年!这是2026年最恶毒的谎言

跟具俊晔在一起的三年是大S最幸福的三年!这是2026年最恶毒的谎言

八卦王者

2026-05-21 14:53:25

高市早苗盼美撑腰遭拒欲“硬碰硬”

高市早苗盼美撑腰遭拒欲“硬碰硬”

小眼睛小世界

2026-05-23 06:18:38

上海这天，娜扎真空上阵，马思纯大饼脸拉胯，丰腴的黄丽玲好惊艳

上海这天，娜扎真空上阵，马思纯大饼脸拉胯，丰腴的黄丽玲好惊艳

趣味八卦

2026-05-23 05:10:11

被抓、家中金条堆成山，原来王丽坤和车晓是同类人

被抓、家中金条堆成山，原来王丽坤和车晓是同类人

阿伧说事

2026-05-16 15:46:45

快讯／袁惟仁缠病8年逝世家中！享年57岁

快讯／袁惟仁缠病8年逝世家中！享年57岁

ETtoday星光云

2026-02-02 17:25:39

深圳有点麻烦了！阿立兹检查后亲承“我可能完蛋了”！

深圳有点麻烦了！阿立兹检查后亲承“我可能完蛋了”！

篮球资讯达人

2026-05-22 12:01:59

1-3！北京崩盘揪3大战犯！大比分落后直接隐身，垃圾时间却来劲了

1-3！北京崩盘揪3大战犯！大比分落后直接隐身，垃圾时间却来劲了

后仰大风车

2026-05-22 22:46:15

卡拉格：图赫尔真有魄力，20年前英格兰有这种教练就好了

卡拉格：图赫尔真有魄力，20年前英格兰有这种教练就好了

懂球帝

2026-05-22 21:33:32

合同成“废纸”，看云南建投春城荣府项目如何拖垮民企！

合同成“废纸”，看云南建投春城荣府项目如何拖垮民企！

易观彩云之南

2026-05-22 17:40:03

打死都不要“网购”这5种东西，背后全是“坑”，谁买谁后悔

打死都不要“网购”这5种东西，背后全是“坑”，谁买谁后悔

家居设计师苏哥

2026-05-18 11:13:09

曼联昔日王牌彻底死心！主动降薪逃离红魔！宁愿少拿钱也要走

曼联昔日王牌彻底死心！主动降薪逃离红魔！宁愿少拿钱也要走

澜归序

2026-05-23 04:29:41

国家一级女演员陈丽云被逮捕！

许三岁

2026-03-28 09:24:30

3-0跳级夺冠！中国女乒15岁新星再闪耀：陈梦师妹疯狂收割冠军

3-0跳级夺冠！中国女乒15岁新星再闪耀：陈梦师妹疯狂收割冠军

李喜林篮球绝杀

2026-05-22 14:50:12

12小时航程1万公里，全程不加油，特朗普的空军一号，我国能造吗

12小时航程1万公里，全程不加油，特朗普的空军一号，我国能造吗

泠泠说史

2026-05-14 21:50:29

知名品牌宣布：将重返中国内地市场！网友：终于等到你

知名品牌宣布：将重返中国内地市场！网友：终于等到你

新浪财经

2026-05-19 15:31:31

京媒6连问！痛斥丢掉北京篮球的魂，李楠做法引争议，许利民懵了

京媒6连问！痛斥丢掉北京篮球的魂，李楠做法引争议，许利民懵了

陈錈爱体育

2026-05-23 04:34:56

侃故事的阿庆

几分钟看完一部影视剧，诙谐幽默的娓娓道来

682文章数 8509关注度

往期回顾全部

科技要闻

雷军：输给特斯拉不丢人

头条要闻

伊朗前总统内贾德被指是"最大内鬼" 其目前下落不明

头条要闻

伊朗前总统内贾德被指是"最大内鬼" 其目前下落不明

体育要闻

最糟糕裁判？他想要退役当市长

娱乐要闻

周也恋情曝光！对象身份不简单

财经要闻

富途拟被罚18.5亿元老虎长桥也回应了

汽车要闻

11万级直接上四驱银河星耀7限时权益价9.88万起

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

亲子

时尚

游戏

数码

手机

亲子要闻

北京儿童配眼镜攻略，适合学生党的专业选择，避开套路选对店

真顶流批量涌现，强女当道的时代来了

《黑旗重制》确认支持PS5 Pro神技！画质性能要起飞

数码要闻

OPPO Enco Air5s耳机规格公布，5月25日发布

手机要闻

荣耀首款磁吸副屏功能揭秘：15米实时预览拍照续航可连拍5小时

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版