网易首页 > 网易号 > 正文 申请入驻

面壁智能MiniCPM-V 4.6能否真正撬动端侧AI市场

0
分享至

5月13日,面壁智能联合清华大学、OpenBMB开源社区正式开源了新一代端侧多模态大模型MiniCPM-V 4.6。

在几乎所有大模型厂商都在追逐更大参数规模的时候,这家清华系团队选择了一条截然相反的路径。仅1.3B的参数规模,却号称能在6G内存的设备上流畅运行多模态任务,这本身就是一个不小的反差。

这款模型的架构选择值得注意,它基于SigLIP2-400M视觉编码器与Qwen3.5-0.8B语言主干构建,配合LLaVA-UHD v4技术,将图像编码阶段的计算量削减了超过50%。

更具体地说,团队将视觉token压缩提前到了ViT内部,而非传统做法中在视觉编码完成后再做压缩,这使得整体推理吞吐量达到了Qwen3.5-0.8B的1.5倍。

在Artificial Analysis的评测中,MiniCPM-V 4.6以13分超越了同尺寸的Qwen3.5-0.8B(10分)和Gemma4-E2B-it,token消耗仅为前者的1/43。

从技术实现来看,4倍和16倍混合视觉token压缩模式是一个相对灵活的设计。开发者可以在高精度文档解析场景选择4倍压缩,而在实时交互场景切换到16倍压缩。

实际测试中,处理3132×3132分辨率的高清图片时,首字响应延迟为75.7毫秒,比Qwen3.5-0.8B快了约2.2倍。

但必须指出的是,基准测试的漂亮数字与真实业务场景之间往往存在差距。尽管官方宣称模型在图文理解、STEM数理推理和文档OCR等任务上全面超越了直接竞品,但这些测试大多在vLLM框架的标准环境中完成,与手机端实机部署的功耗表现、发热控制和量化精度损失是两个范畴的事情。

有开发者已经明确提出,AWQ等激进量化方案在视觉语言任务上的稳定性需要进一步验证。

部署生态方面,MiniCPM-V 4.6全面接入了vLLM、SGLang、llama.cpp和Ollama等推理框架,并提供了GGUF、BNB、GPTQ等多种量化变体。

配套的微调工具链覆盖了ms-swift和LLaMA-Factory,开发者用一张RTX 4090即可完成全量微调。这个开发友好度值得肯定,但工具链的完善程度与实际落地方便程度之间仍然需要打一个问号。

一个现实的考量是,尽管模型只需要6G内存就能运行,但4位量化版本确实使其能在一块RTX 4090上以约3G显存运行,普通开发者和小团队确实可以低成本接入。

但一个1.3B的小模型在复杂多模态任务上的表现能否真正满足商业化场景的需求,尤其是面对阿里Qwen系列和谷歌Gemma等竞争对手的持续迭代,MiniCPM-V 4.6的高效率叙事是否足以让产业界买单,可能还需要更长时间的验证。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
捏蛋女已社死:正脸曝光面目狰狞,工作单位被扒,一家都是狠角色

捏蛋女已社死:正脸曝光面目狰狞,工作单位被扒,一家都是狠角色

吃瓜盟主
2025-08-30 15:53:04
戛纳这一天,3位中国女星有排面,巩俐台上说中文,她获1分半介绍

戛纳这一天,3位中国女星有排面,巩俐台上说中文,她获1分半介绍

科学发掘
2026-05-14 01:16:24
梅尔·吉布森罗马街头热吻,新恋情曝光

梅尔·吉布森罗马街头热吻,新恋情曝光

追星雷达站
2026-05-13 06:18:29
你最接近生理极限的一次经历是什么?网友分享让人目瞪口呆!

你最接近生理极限的一次经历是什么?网友分享让人目瞪口呆!

夜深爱杂谈
2026-04-09 19:39:13
裤子上这两根绳,一定还有它存在的道理!

裤子上这两根绳,一定还有它存在的道理!

新住家居
2026-05-12 06:06:10
五郎八卦棍,外媒G5赛后晒出文班亚马少林武僧海报

五郎八卦棍,外媒G5赛后晒出文班亚马少林武僧海报

懂球帝
2026-05-13 11:27:05
3-0!哈兰德缺战,福登喜迎里程碑,曼城主场大胜,紧咬阿森纳

3-0!哈兰德缺战,福登喜迎里程碑,曼城主场大胜,紧咬阿森纳

我的护球最独特
2026-05-14 04:55:52
卖不动了,日系车集体退守中国

卖不动了,日系车集体退守中国

21世纪经济报道
2026-05-13 23:28:25
河南纪委真给力!给一位深耕公职四十余年的老干部画了个沉重句号

河南纪委真给力!给一位深耕公职四十余年的老干部画了个沉重句号

健身狂人
2026-05-13 12:10:37
高海宁性感美图,身材好霸道

高海宁性感美图,身材好霸道

动物奇奇怪怪
2026-05-14 00:22:49
法国前主帅多梅内克日记曝光:亨利平庸且自恋,阿内尔卡纯白痴

法国前主帅多梅内克日记曝光:亨利平庸且自恋,阿内尔卡纯白痴

懂球帝
2026-05-13 20:30:05
南山一地铁口火上央视!网友:真的震撼

南山一地铁口火上央视!网友:真的震撼

娱乐的硬糖吖
2026-05-13 17:43:28
同样的质量,便宜30%!丰田日产集体倒戈中国,日本供应商慌了!

同样的质量,便宜30%!丰田日产集体倒戈中国,日本供应商慌了!

侃故事的阿庆
2026-05-13 17:36:19
张雪召回问题车辆 网友质疑:当初怎么说雷军的?应该退车退款

张雪召回问题车辆 网友质疑:当初怎么说雷军的?应该退车退款

念洲
2026-05-13 09:49:13
东盟峰会闭幕,11国当场松手,会后发表联合声明,中美成核心焦点

东盟峰会闭幕,11国当场松手,会后发表联合声明,中美成核心焦点

阿器谈史
2026-05-14 02:29:02
小米全新形态耳机官宣 耳夹款终于来了

小米全新形态耳机官宣 耳夹款终于来了

快科技
2026-05-13 15:22:33
Winpodx:Linux上跑Windows应用,终于不用开虚拟机了

Winpodx:Linux上跑Windows应用,终于不用开虚拟机了

像素与芯片
2026-05-13 06:00:24
广东队麻烦了,被淘汰后又收两大坏消息,NBA球员太失望

广东队麻烦了,被淘汰后又收两大坏消息,NBA球员太失望

宗介说体育
2026-05-13 10:15:37
宝玉和谁有过肌肤之亲?4个女人,2个千金小姐,2个漂亮丫头

宝玉和谁有过肌肤之亲?4个女人,2个千金小姐,2个漂亮丫头

掠影后有感
2026-05-13 11:17:09
张雪又“作妖”?820RR刚交付就停产!看完原因我才懂:亏得不冤

张雪又“作妖”?820RR刚交付就停产!看完原因我才懂:亏得不冤

小怪吃美食
2026-05-14 00:55:53
2026-05-14 06:32:49
i黑马 incentive-icons
i黑马
抄本质 找灵感 挖黑马
69069文章数 261916关注度
往期回顾 全部

科技要闻

阿里年营收首破万亿,AI终于不再是画大饼

头条要闻

女子闪婚获千万房产99%份额闪离后起诉分割 法院判了

头条要闻

女子闪婚获千万房产99%份额闪离后起诉分割 法院判了

体育要闻

14年半,74万,何冰娇没选那条更安稳的路

娱乐要闻

白鹿掉20万粉,网友为李晨鸣不平

财经要闻

美国总统特朗普抵达北京

汽车要闻

C级纯电轿跑 吉利银河"TT"申报图来了

态度原创

本地
旅游
健康
房产
军事航空

本地新闻

用苏绣的方式,打开江西婺源

旅游要闻

四大入口协同发力 让外国游客“丝滑”逛北京

干细胞能让人“返老还童”吗

房产要闻

卷疯了!最低杀到7字头!手握30万,海口楼市横着走!

军事要闻

沙特被指3月曾对伊朗发动多次“报复性”空袭

无障碍浏览 进入关怀版