网易首页 > 网易科技 > 网易科技 > 正文

无问芯穹发布首个端侧全模态理解的开源模型Megrez-3B-Omni

0
分享至
据了解,Megrez-3B-Omni 拒绝牺牲任何模态的精度,在图片、文本、音频三个模态中均取得了同尺寸下最优性能。

12月16日,无问芯穹宣布正式开源其“端模型+端软件+端IP”端上智能一体化解决方案中的小模型——全球首个端侧模态理解开源模型Megrez-3B-Omni,并同步开源了纯语言版本模型Megrez-3B-Instruct。

据介绍,Megrez-3B-Omni是一个为端而生的全模态理解模型,选择了最适合手机、平板等端侧设备的30亿参数黄金尺寸,结构规整,推理速度最大领先同精度模型300%。作为一个全模态模型,Megrez-3B-Omni同时具备图片、音频、文本三种模态数据的处理能力,并在三个模态的多种测评基准中取得了最优性能。

据了解,Megrez-3B-Omni 拒绝牺牲任何模态的精度,在图片、文本、音频三个模态中均取得了同尺寸下最优性能。无论是和同样三模态的VITA ( based on Mixtral 8×7B) 、Baichuan-Omni-7B ,还是双模态的MiniCPM-V 2.6 ( based on Qwen2-7B)、Qwen2-VL-7B、Qwen2-Audio-7B,又或是单一模态的Qwen、Baichuan 等模型相比,Megrez-3B-Omni 在主流基准测试集上的表现都毫不逊色。

在图像理解方面,Megrez-3B-Omni 作为一个体积仅为3B的模型,其综合性能表现可以全面超过34B的庞然大物,超越LLaVA-NeXT-Yi-34B 等模型,是目前OpenCompass、MME、MMMU、OCRBench等多个主流测试集上精度最高的图像理解模型之一。

与此同时,Megrez-3B-Omni 在场景理解、OCR 等任务上也具有良好表现,能够准确洞察和分析图像中的场景内容,并高效地从中提取文本信息,且无论是模糊的印刷体还是复杂的手写字,都能够轻松识别。

在文本理解方面,作为全模态理解模型,Megrez-3B-Omni 没有牺牲模型的文本处理能力,将上一代14B大模型的优秀能力压缩至3B规模,显著降低了计算成本、提升了计算效率。在C-EVAL、MMLU/MMLU Pro、AlignBench等多个权威测试集上更是取得端上模型最优精度。

在语音理解方面,Megrez-3B-Omni 的效果比肩行业主流方案。Megrez-3B-Omni不仅支持中文和英文的语音输入,还能够处理复杂的多轮对话场景,更能支持对输入图片或文字的语音提问,实现不同模态间的自由切换。用户就任意模态内容,发出语音指令,Megrez-3B-Omni 就能根据语音指令直接响应文本,让用户可以通过更少动作与模型展开更直观、自然的交互。

据介绍,模型的规模并不是决定其速度的唯一因素,因此模型小并不一定就意味着速度快。凭借对硬件特性的深入理解与利用,Megrez-3B-Omni 通过软硬件协同优化策略,确保了各参数与主流硬件高度适配,以实现硬件性能的利用最大化。与上一代及其他端侧大语言模型相比,单模态版本的Megrez-3B-Instruct 在推理速度上取得了显著提升,最大推理速度可以领先同精度模型300%。

Megrez-3B-Instruct 这次还特别提供了WebSearch 功能,这一功能使得模型能够智能地判断何时需要调用外部工具进行网页搜索,辅助回答用户的问题。用户得以构建属于自己AI搜索,通过网络获取最新信息,克服小模型的幻觉问题和知识储备不足的局限。

无问芯穹表示,Megrez-3B-Omni是一个能力预览,接下来还将持续迭代Megrez系列,提升自动化水平至“edge device use”效果,让用户只需要给出简单的语音指令,就可完成端设备的设置或应用操作,并将它作为“端模型+端软件+端IP”端上智能一体化解决方案的重要构成推向市场。

在这个方案中,除端侧全模态理解模型外,还有端上推理软件和IP设计方案,不仅支持CPU、GPU和NPU 的同时推理,更能通过跨越软硬件层次的系统优化,额外带来最高可达70%的性能提升,最大化端侧硬件性能的利用。(易智)

延伸阅读
相关推荐
热点推荐
12月下旬开始,红鸾星悄然启动,最容易脱单的三个星座出现了

12月下旬开始,红鸾星悄然启动,最容易脱单的三个星座出现了

小晴星座说
2025-12-14 17:30:41
打头推腰全用上!马刺5打8终结雷霆16连胜,9分钟被吹11犯也能赢

打头推腰全用上!马刺5打8终结雷霆16连胜,9分钟被吹11犯也能赢

嘴炮体坛
2025-12-14 12:58:21
中国3大长寿食物,牛肉只排第三,第一名我们天天见,却吃得的少

中国3大长寿食物,牛肉只排第三,第一名我们天天见,却吃得的少

江江食研社
2025-10-21 14:30:03
巨贪11个亿的白天辉临刑前妻子问骨灰怎么办?他说了句“随便”!

巨贪11个亿的白天辉临刑前妻子问骨灰怎么办?他说了句“随便”!

百态人间
2025-12-14 05:05:04
光刻机巨头开始慌了,中国造不成光刻机,但是要造一个光刻工厂

光刻机巨头开始慌了,中国造不成光刻机,但是要造一个光刻工厂

削桐作琴
2025-12-13 20:28:09
34岁数学家王虹在香港大学开讲座,现场用流利英语讲“挂谷猜想”,旁听学生:连过道都站满了人

34岁数学家王虹在香港大学开讲座,现场用流利英语讲“挂谷猜想”,旁听学生:连过道都站满了人

极目新闻
2025-12-12 17:34:56
佳能中山工厂搬离,保洁阿姨补偿30万,员工排队致谢

佳能中山工厂搬离,保洁阿姨补偿30万,员工排队致谢

西门老爹
2025-12-14 13:58:00
俄使用高超音速导弹发动打击

俄使用高超音速导弹发动打击

参考消息
2025-12-14 11:24:04
何晴“发小”邢岷山:她一直乐观面对病情

何晴“发小”邢岷山:她一直乐观面对病情

扬子晚报
2025-12-14 18:38:13
美防长通告全球,不让日本单打独斗,话音刚落,中国九天母舰登场

美防长通告全球,不让日本单打独斗,话音刚落,中国九天母舰登场

博览历史
2025-12-14 19:04:58
WTT香港总决赛:男女单打决赛赛程公布

WTT香港总决赛:男女单打决赛赛程公布

极目新闻
2025-12-14 09:37:32
广州这家饺子馆,饺子包得不好,价格也不便宜,但天天爆满!

广州这家饺子馆,饺子包得不好,价格也不便宜,但天天爆满!

黑天鹅洞察
2025-12-14 14:25:10
台海一旦打响第一枪,9国将卷入战火,中俄朝要包打6国联军

台海一旦打响第一枪,9国将卷入战火,中俄朝要包打6国联军

蜉蝣说
2025-12-14 19:16:11
老婆被外派非洲8年,直到偶遇她上司,惊讶知道:她5年前就离职了

老婆被外派非洲8年,直到偶遇她上司,惊讶知道:她5年前就离职了

农村情感故事
2025-12-07 15:05:41
曝北京富豪李春平去世,赠送他268亿的美国老太身份被扒出

曝北京富豪李春平去世,赠送他268亿的美国老太身份被扒出

吃瓜盟主
2025-10-30 19:55:14
62岁何赛飞现状:住杭州高档别墅区,学骑电车接地气,儿子很帅

62岁何赛飞现状:住杭州高档别墅区,学骑电车接地气,儿子很帅

小熊侃史
2025-12-11 11:27:49
1977年,万里被降格任职,邓小平提议华国锋同志:让他去安徽吧

1977年,万里被降格任职,邓小平提议华国锋同志:让他去安徽吧

混沌录
2025-12-08 21:34:03
十年未检出癌症确诊即晚期,女律师状告爱康国宾索赔处理意见公布

十年未检出癌症确诊即晚期,女律师状告爱康国宾索赔处理意见公布

第一财经资讯
2025-12-13 23:02:16
华为压轴新机曝光:12月25日,即将发布上市!

华为压轴新机曝光:12月25日,即将发布上市!

科技堡垒
2025-12-13 10:40:58
邓亚萍一针见血!林诗栋这一顽疾不除,何以跨过张本这座大山?

邓亚萍一针见血!林诗栋这一顽疾不除,何以跨过张本这座大山?

曹老师评球
2025-12-14 15:08:27
2025-12-14 20:15:00

科技要闻

当人形机器人有了App Store,宇树在赌什么

头条要闻

何晴唯一儿子已从中戏毕业 不久前和父亲合体亮相杂志

头条要闻

何晴唯一儿子已从中戏毕业 不久前和父亲合体亮相杂志

体育要闻

马刺终结雷霆:以勇猛,以文班亚马

娱乐要闻

何晴生前最大谣言!没有再婚嫁廖京生

财经要闻

重大违法强制退市!10人被判刑

汽车要闻

硬核敞篷巴士?掷弹兵Game Viewer 2026年初量产

态度原创

游戏
本地
时尚
教育
公开课

《如龙》系列20周年纪念 已有玩家与桐生一马“结婚”

本地新闻

云游安徽|阜阳三朝风骨,传承千年墨香

伊姐周六热推:《长安二十四计》;电视剧《唐诡奇谭》......

教育要闻

必看!华南理工考点(4414)应试须知!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×