网易首页 > 网易号 > 正文 申请入驻

智谱GLM-4.5-Air量化大模型,本地部署,实测

0
分享至

大家好,我是 Ai 学习的老章

之前对智谱 AI 的关注比较少,最近发布的的 GLM4.6 非常能打

GLM-4.6 的代码生成能力已达到国际领先水平,与 Claude Sonnet 4 模型持平,是国内目前表现最优的编程专用模型,在综合性能评估中位列全球第四,与阿里巴巴旗下 Qwen3-Max-Preview 模型并列中国区榜首,同时摘得全球开源模型桂冠。

国内大模型开源这一块,除了 DeepSeek 和 Qwen,其实智谱也很能打的

之前偶尔关注智谱,是看到美国商务部把它列为实体清单,还有 OpenAI 点名它是全球战略的竞争对手


OpenAI 旗下 Global Affairs 账号近日发布专题博文《Chinese Progress at the Front》,罕见聚焦中国 AI 企业发展动态。文中明确将 2019 年成立的智谱 AI 定义为 "中国大模型领域新锐代表",强调其通过良性竞争构建的技术生态,已成为中国打造自主 AI 体系的核心力量。

但是 GLM-4.6 本地部署还是有点成本太高

原版 714GB、FP8 版本模型文件也 355GB 了

倒是 GLM-4.5-AIR 有了比较靠谱的量化版本——GLM-4.5-Air-AWQ-4bit,它的模型文件只有 64GB 不到(GLM-4.5、GLM-4.5-Air、GLM-4.5-Air-FP8 的模型文件大小分别是 717GB、221GB、113GB)


国内镜像:https://modelscope.cn/models/cpatonn-mirror/GLM-4.5-Air-AWQ/files

GLM-4.5系列模型是为智能代理设计的基础模型,GLM-4.5-Air 采用了更紧凑的设计,总共有1060 亿参数,120 亿活跃参数。在 12 个行业标准基准测试中的全面评估中,GLM-4.5-Air 在保持卓越效率的同时,也取得了具有竞争力的59.8分。


本地部署

下载模型:modelscope download --model cpatonn-mirror/GLM-4.5-Air-AWQ --local_dir ./dir

vllm 启动模型,我用一张 141GB 的 H200 显卡拉起模型,启动脚本如下:


启动很顺利


先来做一个性能测试,速度还行,加大 max-num-seqs 还能把总平均 Token 生成速度拉更高,这也是用vllm启动safetensors,而非选择llama.cpp启动GGUF的好处。


简单看下代码和现实世界理解能力:用大模型生成人体器官结构图

GLM-4.5-air

ChatGPT
GLM-4.6DeepSeek-V3.2

看官方测评数据和市面上的评价,GLM-4.5-Air 总体看性价比还是很高的,比肩而立 DeepSeek-R1 了,运行成本却低 N 多档次



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国可能痛击日本

中国可能痛击日本

杨兴文
2026-02-19 16:21:00
中共中央致电祝贺朝鲜劳动党第九次代表大会召开

中共中央致电祝贺朝鲜劳动党第九次代表大会召开

国际在线
2026-02-20 11:19:09
历史上最成功的陪嫁丫鬟,小姐成了嫔妃,她却当上了皇后

历史上最成功的陪嫁丫鬟,小姐成了嫔妃,她却当上了皇后

秋姐居
2026-02-10 09:25:02
太吓人了!大年初六到元宵节,重庆到广州的火车票,几乎全部售罄

太吓人了!大年初六到元宵节,重庆到广州的火车票,几乎全部售罄

火山詩话
2026-02-19 09:06:13
保洁母亲苦寻女儿七年,女儿一家集体“潜逃”?网友:快跑别掺和

保洁母亲苦寻女儿七年,女儿一家集体“潜逃”?网友:快跑别掺和

另子维爱读史
2026-02-02 18:24:16
韩网友提问:在铁证面前,中国人为什么还不承认汉字起源于韩国?

韩网友提问:在铁证面前,中国人为什么还不承认汉字起源于韩国?

芳芳历史烩
2026-01-20 20:53:46
中国向全世界披露:美国4400颗卫星,包围中国空间站,这是要做啥

中国向全世界披露:美国4400颗卫星,包围中国空间站,这是要做啥

素衣读史
2026-01-17 18:35:57
炸了!1 亿镑新基恩跪求加盟曼联,弗格森时代荣光要回来了?

炸了!1 亿镑新基恩跪求加盟曼联,弗格森时代荣光要回来了?

奶盖熊本熊
2026-02-20 09:12:27
宁忠岩:今天滑疯了!没想到滑这么快,四年终于走到了山顶

宁忠岩:今天滑疯了!没想到滑这么快,四年终于走到了山顶

奥拜尔
2026-02-20 01:42:05
花样滑冰女单:美国华裔刘美贤夺金,坂本花织银牌,张瑞阳第19

花样滑冰女单:美国华裔刘美贤夺金,坂本花织银牌,张瑞阳第19

懂球帝
2026-02-20 06:38:04
点赞中超冠军,海港为中超争光:让对手创耻辱纪录,主帅即将下课

点赞中超冠军,海港为中超争光:让对手创耻辱纪录,主帅即将下课

建哥说体育
2026-02-20 08:00:00
《飞驰人生3》断崖式第一!春节档破30亿

《飞驰人生3》断崖式第一!春节档破30亿

大象新闻
2026-02-20 08:12:06
2909亿身价有何用?97岁的李嘉诚无力回天,两个60岁儿子已成心病

2909亿身价有何用?97岁的李嘉诚无力回天,两个60岁儿子已成心病

大鱼简科
2026-02-19 22:04:47
6.88万续航近500公里!连续5个月销量破万,这车让海豚星愿怎么打

6.88万续航近500公里!连续5个月销量破万,这车让海豚星愿怎么打

蓝色海边
2026-02-17 22:02:52
上海收购“老破小”,市场要变天了?

上海收购“老破小”,市场要变天了?

巢客HOME
2026-02-19 10:25:03
有幸去了趟越南,实话实说,越南人的生活,简直让我叹为观止!

有幸去了趟越南,实话实说,越南人的生活,简直让我叹为观止!

王二哥老搞笑
2026-02-06 15:54:51
2025年,一女子开着奔驰经过村庄时,突然被一大妈用石头疯狂砸车

2025年,一女子开着奔驰经过村庄时,突然被一大妈用石头疯狂砸车

有书
2026-02-19 20:10:03
3月开始中国或将迎来四大降价潮:除房价以外,这5类也要降价了

3月开始中国或将迎来四大降价潮:除房价以外,这5类也要降价了

说故事的阿袭
2026-02-19 10:35:24
特朗普称将解密外星生命相关文件

特朗普称将解密外星生命相关文件

界面新闻
2026-02-20 09:22:51
湖北烟花店爆炸12人遇难:楼烧成空壳,遇难者包括走亲戚的3口人

湖北烟花店爆炸12人遇难:楼烧成空壳,遇难者包括走亲戚的3口人

眼光很亮
2026-02-20 03:49:47
2026-02-20 13:39:00
机器学习与Python社区 incentive-icons
机器学习与Python社区
机器学习算法与Python
3248文章数 11088关注度
往期回顾 全部

科技要闻

莫迪举手欢呼 两大AI掌门人却握拳尴尬对峙

头条要闻

72岁成龙第11次上春晚 称一句"鸡毛换糖"练习了很多遍

头条要闻

72岁成龙第11次上春晚 称一句"鸡毛换糖"练习了很多遍

体育要闻

宁忠岩4年从第7到摘金,刷新奥运纪录

娱乐要闻

苏翊鸣夺金朱易示爱,两人默契引热议

财经要闻

太疯狂!“顾客不问价直接出手”

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

本地
教育
艺术
手机
亲子

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

教育要闻

2026年高考十大热门专业前瞻分析(下):五大经典专业深度解读

艺术要闻

李白若在世,诺贝尔文学奖会是他的囊中物吗?

手机要闻

欧洲Q4市场分析:苹果第一,三星第二,荣耀大亮

亲子要闻

今天我们来吃各种各样的火柴棒棒糖

无障碍浏览 进入关怀版