网易首页 > 网易号 > 正文 申请入驻

端侧模型又“瘦身成功”!220倍极限提速、8B模型超过Gemma3-12B,面壁智能甩出“性能大小王”

0
分享至

智东西6月7日报道,在2025智源大会期间,北京大模型创企面壁智能发布开源模型MiniCPM 4.0的两个新版本(0.5B、8B),代号「前进四」。

MiniCPM4-0.5B训练开销仅为Qwen3-0.6B的2.7%,以一半参数量实现翻倍性能,综合得分平均分为52.06分,远超同类模型。面壁科技还发布了一个0.5B的三级量化版本,平均得分是56分,是非常好的成绩。

MiniCPM4-8B训练开销仅22%,加了长下文稀疏化版本,做到同等参数、性能更强,综合得分对标Qwen3-8B、超越Gemma3-12B,在下列同类端侧模型排行榜中分数排名第一。

面壁智能CEO李大海总结说,MiniCPM4模型最大的特点就是快。

在端侧跑140K上下文,需要很大的端侧内存,属于极端场景。在Jetson Orin AGX(64G)或RTX 4090(24G)硬件上运行128K长文本时,像Qwen3-8B这样没做过上下文稀疏化的模型,显存不够用,需要用CPU内存,offload导致速度急速下降;而MiniCPM4-8B做了快速稀疏化工作,可将占用的低长文本缓存降至1/4,在常规场景里至少可以取得3-5倍的速度优势。

在显存受限的极限场景中,MiniCPM4的测试数据甚至可以快到220倍。

面壁智能的MiniCPM4-MCP模型,在端侧利用MCP协议,支持15个主流应用,取得了很高的综合评测表现得分。另一个MiniCPM4-Survey端侧版可在AI PC上构建Deep Research(深度研究)服务,是一个离线可用的随身研究报告利器,有助于保护本地隐私数据。

面壁智能与英特尔紧密合作,首次端侧解锁128K长上下文窗口,在英特尔平台上基于InfLLM 2.0稀疏注意力结构已实现3.8倍加速的推理优化效果。同时,MiniCPM4已经可以在华为昇腾、联发科、高通等主流芯片上流畅运行,也支持vLLM、AutoGPT等推理框架,欧拉版正在积极适配中。

又快又好,是怎么做到的?

李大海分享了背后的技术细节——行业首个全开源系统级上下级稀疏化高效创新。

一、架构:混合稀疏注意力机制,稀疏与稠密方案灵活切换

传统Transformer模型每token需和序列中所有token进行相关性计算逐字重复计算,效率低下。在稀疏注意力机制下,稀疏度越高,计算量越小,速度越快。

MiniCPM4采用了InfLLM 2.0混合稀疏注意力结构。该架构采用类似于检索的思路,对文本分块分区域处理,只对最具相关性重点区域进行注意力计算“抽查”,更加高效。通过这种方式,面壁智能可将稀疏度降到5%,将计算量降到10%。

同时,面壁智能还创新地采用了高效的自动双频换挡技术,长文本用稀疏方案,短文本用稠密方案。

二、 推理:自研全套端侧高性能推理框架,90%瘦身 2倍速度提升

端侧生态丰富,兼容是一件成本较高的事。面壁智能希望尽可能简化端侧模型部署的复杂度,自研了“三级火箭”推理框架。

(1)自研端侧高性能推理框架CPM.cu:实现稀疏、投机和量化的高效结合,通过FR-Spec轻量化投机采样,相比原始模型提速2倍,让小模型给大模型当实习生,给小模型减负加速,速度提升超5倍。

(2)极致低位宽量化BitCPM:端侧低内存容量部署友好,4bit量化达到业界SOTA等级,3倍量化,可瘦身90%。

(3)自研跨平台部署框架Arkinfer:面向多平台端侧芯片极致优化,跨平台高效投机采样和限制解码,支持端侧多平台Model Zoo的丝滑使用,速度提升2倍。

三、学习:多维度训练策略优化,FP8低精度提升训练速度

在高效训练方面,面壁智能也做了很多探索。

(1)模型风洞Model Wind Tunnel v2:用小模型给大模型探路,通过高效训练小模型,寻求大模型训练最佳配置,将学习率、批大小等移至大模型训练,完成最优配置搜索。

(2)Chunk-wise Rollout负载均衡强化学习:强化学习训练中,单一数据过长时,将在GPU上产生大量空泡,导致负载不均,因此将长数据分段采样,使其在下一阶段继续生成,以此实现GPU资源的高效分配。

(3)工程优化:采用FP8训练,以低精度加速模型计算,提升训练效率;采用MTP监督信号,提供更稠密的监督信号,提升模型数据利用率。

四、数据:用8T高质量数据训练,表现不输36T竞品数据

MiniCPM4模型还有一个重要优势:只用了非常少的高质量训练语料。

好数据才能跑出好性能。8T的面壁高质量数据,与36T竞品数据的模型训练效果相当。

(1)Ultra-FineWeb:高效数据严格筛选机制,可构建万亿高质量数据集,通过“半成品加工法”高效验证,先训一个’半熟”模型,再用新数据快速微调,能够将成本降低90%;用fastText工具进行大语言模型质检,处理15万亿数据只需1000小时CPU。

(2)UltraChat-v2:高能力密度数据合成,可构建大规模知识密集型、推理密集型、指令遵循型、长文本处理型、工具调用型等多样化的有监督微调数据。

结语:以更低成本实现更高智能,端侧模型走向普及普惠

总体来看,MiniCPM4以更少参数量实现出色性能的背后,是面壁智能从架构层、系统层、推理层到数据层的层层优化。而用更少的数据和算力做出同等性能的模型,意味着降低成本,能将时间和资源用于做更多、更有价值的事。

作为国内端侧模型代表,面壁智能旗下模型矩阵已覆盖基座模型MiniCPM、旗舰多模态模型MiniCPM-V、旗舰全模态模型MiniCPM-o,全球下载量超千万。

面壁智能计划通过MiniCPM持续推进密度定律。李大海相信,接下来数年会涌现出越来越聪明的智能硬件和终端,搭载像MiniCPM这样的端侧模型,更好地为大众服务。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
咸鱼还是太全面了,怪不得人称国内黑市

咸鱼还是太全面了,怪不得人称国内黑市

另子维爱读史
2025-12-20 17:07:20
什么事是你交了男朋友才知道的?网友:鼻子大的真的大还厉害

什么事是你交了男朋友才知道的?网友:鼻子大的真的大还厉害

带你感受人间冷暖
2025-11-12 00:05:08
裁判文书上网隐去法官姓名,破了“几十年的规矩”

裁判文书上网隐去法官姓名,破了“几十年的规矩”

中国新闻周刊
2026-01-15 12:29:36
特朗普称泽连斯基阻碍和平协议

特朗普称泽连斯基阻碍和平协议

界面新闻
2026-01-15 09:33:30
乌克兰否决了多项任命,开始为泽连斯基的下台,做着最后的准备?

乌克兰否决了多项任命,开始为泽连斯基的下台,做着最后的准备?

军机Talk
2026-01-15 11:53:27
美将暂停75国签证!史上最大世界杯要凉?巴西球迷:不让俺们去算啥世界杯!

美将暂停75国签证!史上最大世界杯要凉?巴西球迷:不让俺们去算啥世界杯!

英国报姐
2026-01-15 21:37:03
苹果谷歌联手,重新定义手机,但真正要慌了的是腾讯和美团

苹果谷歌联手,重新定义手机,但真正要慌了的是腾讯和美团

王煜全
2026-01-15 06:41:39
闫学晶被举报偷税后:官方评论区被冲,海南税务受牵连,网友炸锅

闫学晶被举报偷税后:官方评论区被冲,海南税务受牵连,网友炸锅

天天热点见闻
2026-01-15 07:00:55
希腊“黄金签证”褪色,跨洲买房的中国人遭遇抛售困局:有人25万欧元买入,2万欧元卖出

希腊“黄金签证”褪色,跨洲买房的中国人遭遇抛售困局:有人25万欧元买入,2万欧元卖出

红星新闻
2026-01-14 17:46:42
独生子女补贴新动态!独生子女,父母若满七十岁,奖励金会更高吗

独生子女补贴新动态!独生子女,父母若满七十岁,奖励金会更高吗

社保小达人
2026-01-15 11:35:09
变天了!2026年燃油车迎来降价潮,最大降幅50%,合资车霸榜​​

变天了!2026年燃油车迎来降价潮,最大降幅50%,合资车霸榜​​

夜深爱杂谈
2026-01-14 19:39:52
三只羊杀回抖音,小杨哥风格突然反转!

三只羊杀回抖音,小杨哥风格突然反转!

互联网品牌官
2026-01-15 12:27:45
瓦良格号送到中国后有多震撼?专家刮掉表面的锈迹:钢材品质极佳

瓦良格号送到中国后有多震撼?专家刮掉表面的锈迹:钢材品质极佳

古书记史
2026-01-06 16:31:56
你敢信?统一台湾的关键人物,可能已经出现了!

你敢信?统一台湾的关键人物,可能已经出现了!

鹤羽说个事
2026-01-15 14:55:30
轻断食再次封神!研究证实:能让肝脏脂肪在3个月内少25.5%!

轻断食再次封神!研究证实:能让肝脏脂肪在3个月内少25.5%!

健康之光
2026-01-09 06:20:03
离婚才3个月,高调谈论再婚的李亚鹏,没给海哈金喜留一丝体面

离婚才3个月,高调谈论再婚的李亚鹏,没给海哈金喜留一丝体面

人间无味啊
2026-01-14 00:15:59
追觅员工怒怼CEO俞浩,其他员工纷纷截屏

追觅员工怒怼CEO俞浩,其他员工纷纷截屏

超角度
2026-01-15 12:30:36
iPhone18ProMax再次确认,新技术遥遥领先

iPhone18ProMax再次确认,新技术遥遥领先

3C毒物
2026-01-15 00:08:40
毛主席的机要秘书谢静宜有多美?长相可爱,当过北京市委书记

毛主席的机要秘书谢静宜有多美?长相可爱,当过北京市委书记

万物知识圈
2026-01-14 09:05:37
王健林预言成真!第3轮大涨来了?内行人:2026年房价或超出想象

王健林预言成真!第3轮大涨来了?内行人:2026年房价或超出想象

猫叔东山再起
2026-01-15 10:55:03
2026-01-16 02:12:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11082文章数 116942关注度
往期回顾 全部

数码要闻

Turbo 5 Max全球首发!REDMI详解天玑9500s:性能制霸2.5K档

头条要闻

美突袭委内瑞拉动用神秘武器:委士兵跪倒在地吐血

头条要闻

美突袭委内瑞拉动用神秘武器:委士兵跪倒在地吐血

体育要闻

聂卫平:黑白棋盘上的凡人棋圣

娱乐要闻

92岁陶玉玲去世,冯远征曹可凡悼念

财经要闻

央行再次结构性降息0.25个百分点

科技要闻

阿里最狠的一次“自我革命”

汽车要闻

吉利帝豪/缤越推冠军一口价 起售价4.88万

态度原创

旅游
时尚
本地
艺术
家居

旅游要闻

南京街头巷尾都是《寻秦记》

年度最扎心电影,看得中年男女坐立难安

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

艺术要闻

300亿!341米!迪拜将建全球首个奔驰品牌城市

家居要闻

自在自宅 个性自由

无障碍浏览 进入关怀版