网易首页 > 网易号 > 正文 申请入驻

智谱新模型也用DeepSeek的MLA,苹果M5就能跑

0
分享至

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

智谱AI上市后,再发新成果。

开源轻量级大语言模型GLM-4.7-Flash,直接替代前代GLM-4.5-Flash,API免费开放调用。



这是一个30B总参数、仅3B激活参数的混合专家(MoE)架构模型,官方给它的定位是“本地编程与智能体助手”。

在SWE-bench Verified代码修复测试中,GLM-4.7-Flash拿下59.2分,“人类最后的考试”等评测中也显著超越同规模的Qwen3-30B和GPT-OSS-20B。



作为去年12月发布的旗舰模型GLM-4.7的轻量化版本,GLM-4.7-Flash继承了GLM-4系列在编码和推理上的核心能力,同时针对效率做了专门优化。

除了编程,官方还推荐将这个模型用于创意写作、翻译、长上下文任务,甚至角色扮演场景。

30B参数只激活3B,MLA架构首次上线

GLM-4.7-Flash沿用了该系列的”混合思考模型”的设计。

总参数量300亿,但实际推理时仅激活约30亿参数,使模型在保持能力的同时大幅降低计算开销。

上下文窗口支持到200K,既可以云端API调用,也支持本地部署。

目前官方还没有给出技术报告,更多细节还要从配置文件自己挖掘。



有开发者注意到一个重要细节:GLM团队这次首次采用了MLA(Multi-head Latent Attention)架构。这一架构此前由DeepSeek-v2率先使用并验证有效,如今智谱也跟进了。

从具体结构来看,GLM-4.7-Flash的深度与GLM-4.5 Air和Qwen3-30B-A3B接近,但专家数量有所不同——它采用64个专家而非128个,激活时只调用5个(算上共享专家)。



目前发布不到12小时,HuggingFace、vLLM等主流平台就提供了day0支持。





官方也在第一时间提供了对华为昇腾NPU的支持。



本地部署方面,经开发者实测在32GB统一内存、M5芯片的苹果笔记本上能跑到43 token/s的速度。



官方API平台上基础版GLM-4.7-Flash完全免费(限1个并发),高速版GLM-4.7-FlashX价格也相当白菜。



对比同类模型,在上下文长度支持和输出token价格上有优势,但目前延迟和吞吐量还有待优化。



HuggingFace:
https://huggingface.co/zai-org/GLM-4.7-Flash


[1]https://x.com/Zai_org/status/2013261304060866758智谱新模型也用DeepSeek的MLA,苹果M5就能跑

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
这一次,公开拒绝“四大天王”合体的张学友,没给F4留一丝体面

这一次,公开拒绝“四大天王”合体的张学友,没给F4留一丝体面

白面书誏
2026-01-26 20:02:20
54年来首次,日本国内没有大熊猫了

54年来首次,日本国内没有大熊猫了

大象新闻
2026-01-27 07:05:12
这次军委的动作,真是让人倒吸一口凉气!直接倒查9年

这次军委的动作,真是让人倒吸一口凉气!直接倒查9年

忠于法纪
2026-01-27 08:57:33
“牢A”风波最倒霉的不是那帮留学生和陪读妈妈!而是某品牌项链

“牢A”风波最倒霉的不是那帮留学生和陪读妈妈!而是某品牌项链

火山诗话
2026-01-27 06:17:38
博晖创新推出尼帕病毒核酸检测试剂盒

博晖创新推出尼帕病毒核酸检测试剂盒

界面新闻
2026-01-27 10:44:03
广州一乘客羊城通欠费1400万元? 岭南通公司回应

广州一乘客羊城通欠费1400万元? 岭南通公司回应

深圳晚报
2026-01-27 10:15:25
湖人队史首人!东契奇46+11+7+8三分拒逆转 单节20分一人战一队

湖人队史首人!东契奇46+11+7+8三分拒逆转 单节20分一人战一队

颜小白的篮球梦
2026-01-27 11:22:27
国务院决定:免去曾国卫职务

国务院决定:免去曾国卫职务

看看新闻Knews
2026-01-27 11:01:02
支持率一路暴跌,高市彻底慌了,日本商界大佬发声,要求更换首相

支持率一路暴跌,高市彻底慌了,日本商界大佬发声,要求更换首相

时时有聊
2026-01-27 07:05:46
发明“斩杀线”的牢A,把胡锡进干沉默了

发明“斩杀线”的牢A,把胡锡进干沉默了

木蹊说
2026-01-27 01:22:30
10岁抗癌小王子豪豪去世,爸爸称“孩子解脱了”;曾因“王子请恢复健康”感动网友

10岁抗癌小王子豪豪去世,爸爸称“孩子解脱了”;曾因“王子请恢复健康”感动网友

潇湘晨报
2026-01-27 11:37:11
“网红小胖”:曾参演《爱情公寓》等电视剧,如今已结婚生子,回归正常家庭生活

“网红小胖”:曾参演《爱情公寓》等电视剧,如今已结婚生子,回归正常家庭生活

大风新闻
2026-01-27 10:52:13
哈梅内伊为什么慌了

哈梅内伊为什么慌了

臧启玉律师
2026-01-26 11:13:42
解放军报社论:坚决打赢军队反腐败斗争攻坚战持久战总体战

解放军报社论:坚决打赢军队反腐败斗争攻坚战持久战总体战

新华社
2026-01-24 23:03:04
这是一个危险信号!小心美国突然动手

这是一个危险信号!小心美国突然动手

李荣茂
2026-01-26 18:26:36
“抹黑”女留学生,不仅无知、而且无耻

“抹黑”女留学生,不仅无知、而且无耻

非典型佛教徒
2026-01-27 00:05:06
倒退千年?塔利班立法承认“奴隶”身份

倒退千年?塔利班立法承认“奴隶”身份

桂系007
2026-01-27 03:18:11
男子连杀两名19岁女子,已被枪决

男子连杀两名19岁女子,已被枪决

现代快报
2026-01-26 18:39:08
从“看得见”到“摸得着”,优酷SVIP重构双向奔赴式会员生态

从“看得见”到“摸得着”,优酷SVIP重构双向奔赴式会员生态

镜像娱乐
2026-01-09 15:18:16
雷军宣布每周分享车主提车美照,照片中小米汽车女车主比例很高

雷军宣布每周分享车主提车美照,照片中小米汽车女车主比例很高

映射生活的身影
2026-01-27 00:48:02
2026-01-27 13:07:00
量子位 incentive-icons
量子位
追踪人工智能动态
12067文章数 176366关注度
往期回顾 全部

科技要闻

理想开始关店“过冬”,否认“百家”规模

头条要闻

遭美国施压 卡尼:加拿大无意与中国达成自由贸易协定

头条要闻

遭美国施压 卡尼:加拿大无意与中国达成自由贸易协定

体育要闻

带着母亲遗愿战斗12年,交易添头成了队魂

娱乐要闻

张雨绮被曝代孕,春晚被拒,代言跑路

财经要闻

金价狂飙 “牛市神话”未完待续

汽车要闻

剑指小米YU7与特斯拉Model Y 问界M6要来了?

态度原创

房产
游戏
数码
旅游
军事航空

房产要闻

实景兑现在即!绿城,在海棠湾重新定义终极旅居想象!

《恶意不息》CEO:不止想做杰作 正式版将是千年一遇!

数码要闻

Intel高管:AMD集显竞争力不足!但没计划推Strix Halo竞品

旅游要闻

千年茶马古道:在现代文旅热潮中焕发新生

军事要闻

委代总统称遭美威胁:马杜罗已死

无障碍浏览 进入关怀版