网易首页 > 网易号 > 正文 申请入驻

基于国产算力发布新模型,面壁智能要给端侧AI“做减法”

0
分享至

5月25日,面壁智能联合清华大学、OpenBMB开源社区发布并开源极低位宽模型BitCPM-CANN,系国内首个完全基于国产算力平台(华为昇腾)实现端到端训练并开源的三值(1.58-bit)大模型。

据记者了解,该模型包含0.5B、1B、3B、8B四个尺寸,与面壁同尺寸MiniCPM-4全精度家族相比,新模型在推理阶段可释放约6倍显存红利,模型能力保留率维持在90%至97.2%之间。

采访中,面壁智能AI Infra负责人李宇轩对记者表示,这意味着未来有望在手机上运行60B大模型,手机智能可以大幅提升。

该款模型诞生背景是全球内存价格的持续飙升。表现在市场端,据李宇轩透露,2026年以来内存价格已上涨约5倍,内存涨价倒逼厂商控制成本,进而限制设备内存大小,反向传导到所有要在内存里跑的模型应用程序。行业对于模型内存尺寸的要求压得更加严格,牵引整个Infra方向向更节约内存的路线优化,这也是此次面壁新模型结合市场情况调整的重要原因。

伴随技术发展与市场需求,人工智能算法近年来持续侧重提效,只是每年市场关注点不同。李宇轩向记者表示,端侧大模型的行业共识约在2024年下半年形成——手机上以后一定会跑模型。此后,行业重心从“能不能跑”逐步转向“如何高效”。


将大模型从高精度压缩成更低精度、更少比特来展示,是AI Infra发展的核心方向。去年行业聚焦 FP8、FP4应用落地,如今FP8已成为主流模型标配,DeepSeek、MiniMax等均普遍采用。受内存价格上涨推动,行业重心转向FP4,并加速推进2-bit、1.58-bit技术落地。

如果说AI运行是货车物流,那么精度便代表货物打包方式,FP8如同标准纸箱,FP4类似真空压缩袋,2-bit为极致捆扎压缩,靠算法适配压缩形态,适配小型终端设备,最大限度节省空间功耗。只是相对前者,极低比特量化的精度损失风险更高,需要通过数据、架构、训练算法协同优化来弥补。

李宇轩称,极低比特模型对数据噪声更敏感,需做更严格的清洗与筛选,避免无效信息干扰模型学习;选用对称、带零点的高性能量化器可以减少压缩损耗;以及在训练层面采用先QAT (量化感知)训练、后大模型蒸馏的组合方案,找到训练与蒸馏的最优平衡点,既保证低比特训练稳定,又最大程度恢复模型能力。

行业内,高通从去年下半年已率先实现2-bit硬件支持,国内DeepSeek、智谱、阿里千问等模型厂商也在推进低位宽量化模式落地。硬件端,过去几乎所有低位宽训练都在英伟达卡上做,此次面壁智能与华为合作,李宇轩称,团队耗时约三周完成昇腾平台的适配与优化,最终实现较小开销。他认为,在8B以内尺寸模型训练上,昇腾体验已经比较好,训练稳定性、芯片利用率接近可比状态。

不过,模型参数越小、位宽越低,能存储的知识越少,能力不是线性下降,而是断档式下调。李宇轩表示,后续可通过更精细的课程学习体系、针对性补基础能力来改善。

目前,BitCPM-CANN全系列模型权重已开源,面壁智能称希望开发者能零门槛体验国产算力在低比特场景的真实性能。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
请天皇出山,高市拼了!日本政客:中日49年后从未有过这样的局面

请天皇出山,高市拼了!日本政客:中日49年后从未有过这样的局面

闻识
2026-05-30 08:56:27
逆天发言!法拉利前主席怒喷首款纯电车:中国人都不会抄

逆天发言!法拉利前主席怒喷首款纯电车:中国人都不会抄

泡泡网
2026-05-27 11:25:19
官宣骨折!总决赛中锋啊,又倒下了…

官宣骨折!总决赛中锋啊,又倒下了…

左右为篮
2026-05-29 21:47:37
日本公司发布调查报告:近九成在华日企“没有退出中国市场计划”

日本公司发布调查报告:近九成在华日企“没有退出中国市场计划”

环球网资讯
2026-05-30 06:40:14
暹罗为什么改称泰国?

暹罗为什么改称泰国?

地图帝
2026-05-29 19:22:34
5.30早评|刚刚!深夜猛拉!A股有救了?

5.30早评|刚刚!深夜猛拉!A股有救了?

龙行天下虎
2026-05-30 04:35:09
全网封杀已注定?林志玲风波升级,国台办回应,以后难在大陆捞金

全网封杀已注定?林志玲风波升级,国台办回应,以后难在大陆捞金

君笙的拂兮
2026-05-27 23:59:18
东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

番外行
2026-03-31 08:28:28
万万没想到,187比58票压倒性票数通过,高市成功集大权于一身!

万万没想到,187比58票压倒性票数通过,高市成功集大权于一身!

小莜读史
2026-05-29 23:00:38
九号M1电动车发布:100km全速真续航,首发价4899元起

九号M1电动车发布:100km全速真续航,首发价4899元起

IT之家
2026-05-29 19:55:32
连胜8局,2-0横扫!中国金花首次进大满贯16强,还狂揽225万奖金

连胜8局,2-0横扫!中国金花首次进大满贯16强,还狂揽225万奖金

侃球熊弟
2026-05-29 18:01:32
塞尔维亚第一夫人在上海花7000块买了4件衣服,店主想免单被拒了

塞尔维亚第一夫人在上海花7000块买了4件衣服,店主想免单被拒了

放开他让wo来
2026-05-29 08:58:29
河南南阳13死车祸真实反思:根本不是意外,全是人为漏洞堆出来的

河南南阳13死车祸真实反思:根本不是意外,全是人为漏洞堆出来的

做一个合格的吃瓜群众
2026-05-30 09:10:38
欧洲女议员:购买不等于拥有 那盗版就不是偷窃

欧洲女议员:购买不等于拥有 那盗版就不是偷窃

3DM游戏
2026-05-27 22:03:20
活久见!西南大学食堂“亮剑辣度图”走红,网友:你是要笑死我吗

活久见!西南大学食堂“亮剑辣度图”走红,网友:你是要笑死我吗

火山詩话
2026-05-30 08:37:40
集体“逃离”!38名球员选择退出!NBA时代怎么了?

集体“逃离”!38名球员选择退出!NBA时代怎么了?

体育新角度
2026-05-29 18:22:28
和尚请才子写挽联,他提笔就写“死个和尚”?下联写完令人叫绝

和尚请才子写挽联,他提笔就写“死个和尚”?下联写完令人叫绝

长风文史
2026-05-28 17:08:49
小米集团总裁卢伟冰:近八成用户在试驾对比YU7标准版与特斯拉Model Y后驱版后,选择了小米

小米集团总裁卢伟冰:近八成用户在试驾对比YU7标准版与特斯拉Model Y后驱版后,选择了小米

鲁中晨报
2026-05-27 14:20:18
休媒讨论布朗交易是否有利火箭!凯媒索要申京+伊森:2首轮为底线

休媒讨论布朗交易是否有利火箭!凯媒索要申京+伊森:2首轮为底线

颜小白的篮球梦
2026-05-30 08:42:14
金融危机要来?专家预测,2026到2027上半年,世界将爆发金融风暴

金融危机要来?专家预测,2026到2027上半年,世界将爆发金融风暴

洛川融媒科技
2026-05-29 17:40:06
2026-05-30 11:04:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
254674文章数 622555关注度
往期回顾 全部

科技要闻

英伟达、微软一同发布神秘预告 下周亮相?

头条要闻

茅台经销商电话轰炸企业家"搭售"卖酒:赚有钱人的钱

头条要闻

茅台经销商电话轰炸企业家"搭售"卖酒:赚有钱人的钱

体育要闻

即使是文班亚马,也做不到这件事

娱乐要闻

向太曝黄晓明曾当众给她下跪

财经要闻

双汇管不住一头猪

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

手机
时尚
家居
公开课
军事航空

手机要闻

北美Q1排名:苹果占60%,三星紧随其后,摩托罗拉大亮

aespa治好了我的黑眼圈焦虑

家居要闻

云栖 舒展如流云

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

中方公布参加香会阵容 几大议题受到关注

无障碍浏览 进入关怀版