网易首页 > 网易号 > 正文 申请入驻

智谱GLM-4.5-Air量化大模型,本地部署,实测

0
分享至

大家好,我是 Ai 学习的老章

之前对智谱 AI 的关注比较少,最近发布的的 GLM4.6 非常能打

GLM-4.6 的代码生成能力已达到国际领先水平,与 Claude Sonnet 4 模型持平,是国内目前表现最优的编程专用模型,在综合性能评估中位列全球第四,与阿里巴巴旗下 Qwen3-Max-Preview 模型并列中国区榜首,同时摘得全球开源模型桂冠。

国内大模型开源这一块,除了 DeepSeek 和 Qwen,其实智谱也很能打的

之前偶尔关注智谱,是看到美国商务部把它列为实体清单,还有 OpenAI 点名它是全球战略的竞争对手


OpenAI 旗下 Global Affairs 账号近日发布专题博文《Chinese Progress at the Front》,罕见聚焦中国 AI 企业发展动态。文中明确将 2019 年成立的智谱 AI 定义为 "中国大模型领域新锐代表",强调其通过良性竞争构建的技术生态,已成为中国打造自主 AI 体系的核心力量。

但是 GLM-4.6 本地部署还是有点成本太高

原版 714GB、FP8 版本模型文件也 355GB 了

倒是 GLM-4.5-AIR 有了比较靠谱的量化版本——GLM-4.5-Air-AWQ-4bit,它的模型文件只有 64GB 不到(GLM-4.5、GLM-4.5-Air、GLM-4.5-Air-FP8 的模型文件大小分别是 717GB、221GB、113GB)


国内镜像:https://modelscope.cn/models/cpatonn-mirror/GLM-4.5-Air-AWQ/files

GLM-4.5系列模型是为智能代理设计的基础模型,GLM-4.5-Air 采用了更紧凑的设计,总共有1060 亿参数,120 亿活跃参数。在 12 个行业标准基准测试中的全面评估中,GLM-4.5-Air 在保持卓越效率的同时,也取得了具有竞争力的59.8分。


本地部署

下载模型:modelscope download --model cpatonn-mirror/GLM-4.5-Air-AWQ --local_dir ./dir

vllm 启动模型,我用一张 141GB 的 H200 显卡拉起模型,启动脚本如下:


启动很顺利


先来做一个性能测试,速度还行,加大 max-num-seqs 还能把总平均 Token 生成速度拉更高,这也是用vllm启动safetensors,而非选择llama.cpp启动GGUF的好处。


简单看下代码和现实世界理解能力:用大模型生成人体器官结构图

GLM-4.5-air

ChatGPT
GLM-4.6DeepSeek-V3.2

看官方测评数据和市面上的评价,GLM-4.5-Air 总体看性价比还是很高的,比肩而立 DeepSeek-R1 了,运行成本却低 N 多档次



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日产宣布横滨总部大楼售出 以970亿日元转让中国汽车零组件大厂

日产宣布横滨总部大楼售出 以970亿日元转让中国汽车零组件大厂

卡奇拉的派
2025-11-09 19:00:48
茅台跌破1650!60%酒企卖价低于进价,白酒的黄金时代真的落幕了

茅台跌破1650!60%酒企卖价低于进价,白酒的黄金时代真的落幕了

亿通电子游戏
2025-11-11 15:19:12
菲律宾受灾,台海局势紧张,中国救援彰显大国风范

菲律宾受灾,台海局势紧张,中国救援彰显大国风范

笔墨V
2025-11-11 13:14:14
瑟尔斯基宣布控制住红军城局势,歼敌3万多人,425团表现出色

瑟尔斯基宣布控制住红军城局势,歼敌3万多人,425团表现出色

环球热点快评
2025-11-10 08:41:36
歼36第二架原型机,照片全网刷屏!这次改动藏了多少玄机?

歼36第二架原型机,照片全网刷屏!这次改动藏了多少玄机?

空天时代视频
2025-11-11 13:46:10
曾琦早期上电视节目被扒,主持核心和下乡会诊,面对镜头笑容满面

曾琦早期上电视节目被扒,主持核心和下乡会诊,面对镜头笑容满面

你食不食油饼
2025-11-09 11:58:02
全球通缉令生效,沈伯洋喊话大陆,台当局得意之际郑丽文出手

全球通缉令生效,沈伯洋喊话大陆,台当局得意之际郑丽文出手

一个有灵魂的作者
2025-11-11 10:05:13
中国男人捧红的“羽绒服贵族”,成功截胡加拿大鹅

中国男人捧红的“羽绒服贵族”,成功截胡加拿大鹅

金错刀
2025-11-10 16:18:13
福建高院公开宣判被告人许金花、刘江故意杀人、故意伤害、虐待上诉一案

福建高院公开宣判被告人许金花、刘江故意杀人、故意伤害、虐待上诉一案

福建高院
2025-11-11 15:19:30
许利民:我表扬了周琦没有顾及我的面子去懈怠比赛

许利民:我表扬了周琦没有顾及我的面子去懈怠比赛

懂球帝
2025-11-11 09:22:07
全运会跳水三大天才齐聚!陈芋汐夺冠后,才发现她们的人生已不同

全运会跳水三大天才齐聚!陈芋汐夺冠后,才发现她们的人生已不同

体育小柚
2025-11-11 16:42:11
央行:实施好适度宽松的货币政策,保持社会融资条件相对宽松

央行:实施好适度宽松的货币政策,保持社会融资条件相对宽松

界面新闻
2025-11-11 17:03:58
这是吴石将军牺牲时的真实照片,绳子绕颈,害怕他临刑时大喊口号

这是吴石将军牺牲时的真实照片,绳子绕颈,害怕他临刑时大喊口号

大国纪录
2025-10-30 09:56:59
市场监管总局:双十一严格禁止先提价后打折,禁止大数据杀熟等违法行为

市场监管总局:双十一严格禁止先提价后打折,禁止大数据杀熟等违法行为

界面新闻
2025-11-11 14:34:47
非全日制会计博士学费78万元一期?上海交大回应称:时长为4到6年,联培项目或可报销

非全日制会计博士学费78万元一期?上海交大回应称:时长为4到6年,联培项目或可报销

闪电新闻
2025-11-11 14:03:06
张家口一小区车库沉降多处墙体开裂,所涉楼栋仍有部分业主未搬离,业主:有人上门劝说搬离半年补贴一万元,我们的诉求是退房

张家口一小区车库沉降多处墙体开裂,所涉楼栋仍有部分业主未搬离,业主:有人上门劝说搬离半年补贴一万元,我们的诉求是退房

极目新闻
2025-11-10 23:15:59
他们,害怕“双11”

他们,害怕“双11”

中国新闻周刊
2025-11-10 07:37:03
清晨5点的澳洲Bondi海滩!网友吵翻:像邪教现场

清晨5点的澳洲Bondi海滩!网友吵翻:像邪教现场

澳洲红领巾
2025-11-11 11:25:29
向太曝光刘德华夫妇隐私!晒出与朱丽倩聊天记录,刘德华爱称曝光

向太曝光刘德华夫妇隐私!晒出与朱丽倩聊天记录,刘德华爱称曝光

八星人
2025-11-10 15:32:29
竟然有很多人支持曾医生

竟然有很多人支持曾医生

蜻蜓世音
2025-11-11 14:11:08
2025-11-11 18:39:00
机器学习与Python社区 incentive-icons
机器学习与Python社区
机器学习算法与Python
3193文章数 11068关注度
往期回顾 全部

科技要闻

苹果新品惨败,产线拆光、二代搁浅!

头条要闻

欧委会迫使欧盟成员排除中兴、华为设备 外交部回应

头条要闻

欧委会迫使欧盟成员排除中兴、华为设备 外交部回应

体育要闻

一个14岁的小男孩,决定了谁能晋级世界杯

娱乐要闻

古二曝秦雯多次炫耀袭警经历

财经要闻

南昌三瑞智能IPO:委外代工模式存疑

汽车要闻

盈利"大考",汽车智能化企业的中场战事

态度原创

亲子
时尚
本地
手机
公开课

亲子要闻

宝宝巴士,不是第一次“翻车”了

火遍全网的这件外套太好穿,我总结了几个实用搭配公式

本地新闻

云游安徽 | 凌滩玉魄淬千年,诗意钢城马鞍山

手机要闻

鸿蒙6加速完善生态:华为Mate 80出厂预装

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版