网易首页 > 网易科技 > 网易科技 > 正文

无问芯穹发布首个端侧全模态理解的开源模型Megrez-3B-Omni

0
分享至
据了解,Megrez-3B-Omni 拒绝牺牲任何模态的精度,在图片、文本、音频三个模态中均取得了同尺寸下最优性能。

12月16日,无问芯穹宣布正式开源其“端模型+端软件+端IP”端上智能一体化解决方案中的小模型——全球首个端侧模态理解开源模型Megrez-3B-Omni,并同步开源了纯语言版本模型Megrez-3B-Instruct。

据介绍,Megrez-3B-Omni是一个为端而生的全模态理解模型,选择了最适合手机、平板等端侧设备的30亿参数黄金尺寸,结构规整,推理速度最大领先同精度模型300%。作为一个全模态模型,Megrez-3B-Omni同时具备图片、音频、文本三种模态数据的处理能力,并在三个模态的多种测评基准中取得了最优性能。

据了解,Megrez-3B-Omni 拒绝牺牲任何模态的精度,在图片、文本、音频三个模态中均取得了同尺寸下最优性能。无论是和同样三模态的VITA ( based on Mixtral 8×7B) 、Baichuan-Omni-7B ,还是双模态的MiniCPM-V 2.6 ( based on Qwen2-7B)、Qwen2-VL-7B、Qwen2-Audio-7B,又或是单一模态的Qwen、Baichuan 等模型相比,Megrez-3B-Omni 在主流基准测试集上的表现都毫不逊色。

在图像理解方面,Megrez-3B-Omni 作为一个体积仅为3B的模型,其综合性能表现可以全面超过34B的庞然大物,超越LLaVA-NeXT-Yi-34B 等模型,是目前OpenCompass、MME、MMMU、OCRBench等多个主流测试集上精度最高的图像理解模型之一。

与此同时,Megrez-3B-Omni 在场景理解、OCR 等任务上也具有良好表现,能够准确洞察和分析图像中的场景内容,并高效地从中提取文本信息,且无论是模糊的印刷体还是复杂的手写字,都能够轻松识别。

在文本理解方面,作为全模态理解模型,Megrez-3B-Omni 没有牺牲模型的文本处理能力,将上一代14B大模型的优秀能力压缩至3B规模,显著降低了计算成本、提升了计算效率。在C-EVAL、MMLU/MMLU Pro、AlignBench等多个权威测试集上更是取得端上模型最优精度。

在语音理解方面,Megrez-3B-Omni 的效果比肩行业主流方案。Megrez-3B-Omni不仅支持中文和英文的语音输入,还能够处理复杂的多轮对话场景,更能支持对输入图片或文字的语音提问,实现不同模态间的自由切换。用户就任意模态内容,发出语音指令,Megrez-3B-Omni 就能根据语音指令直接响应文本,让用户可以通过更少动作与模型展开更直观、自然的交互。

据介绍,模型的规模并不是决定其速度的唯一因素,因此模型小并不一定就意味着速度快。凭借对硬件特性的深入理解与利用,Megrez-3B-Omni 通过软硬件协同优化策略,确保了各参数与主流硬件高度适配,以实现硬件性能的利用最大化。与上一代及其他端侧大语言模型相比,单模态版本的Megrez-3B-Instruct 在推理速度上取得了显著提升,最大推理速度可以领先同精度模型300%。

Megrez-3B-Instruct 这次还特别提供了WebSearch 功能,这一功能使得模型能够智能地判断何时需要调用外部工具进行网页搜索,辅助回答用户的问题。用户得以构建属于自己AI搜索,通过网络获取最新信息,克服小模型的幻觉问题和知识储备不足的局限。

无问芯穹表示,Megrez-3B-Omni是一个能力预览,接下来还将持续迭代Megrez系列,提升自动化水平至“edge device use”效果,让用户只需要给出简单的语音指令,就可完成端设备的设置或应用操作,并将它作为“端模型+端软件+端IP”端上智能一体化解决方案的重要构成推向市场。

在这个方案中,除端侧全模态理解模型外,还有端上推理软件和IP设计方案,不仅支持CPU、GPU和NPU 的同时推理,更能通过跨越软硬件层次的系统优化,额外带来最高可达70%的性能提升,最大化端侧硬件性能的利用。(易智)

延伸阅读
相关推荐
热点推荐
十年试管终怀孕,回家报喜却听见丈夫让女助理别受实验罪,我来受

十年试管终怀孕,回家报喜却听见丈夫让女助理别受实验罪,我来受

晓艾故事汇
2025-12-13 08:19:58
接受远嫁!93年女子独自在农村生活很孤独想嫁人:家里就剩我一个

接受远嫁!93年女子独自在农村生活很孤独想嫁人:家里就剩我一个

唐小糖说情感
2025-12-07 12:12:45
三上悠亚近日公开冬季迷你裙造型,引粉丝围观

三上悠亚近日公开冬季迷你裙造型,引粉丝围观

随波荡漾的漂流瓶
2025-12-13 19:00:13
快讯!商务部:中国对部分钢铁产品实行出口许可管理!

快讯!商务部:中国对部分钢铁产品实行出口许可管理!

达文西看世界
2025-12-13 21:51:00
据说全球仅20例!巴西一女子在同一晚与2名男子发生了关系

据说全球仅20例!巴西一女子在同一晚与2名男子发生了关系

忠于法纪
2025-12-04 11:25:07
宋轶的脸到底怎么了?她一句话让全网炸锅!

宋轶的脸到底怎么了?她一句话让全网炸锅!

毒舌八卦
2025-08-31 22:34:38
英超豪门杀入欧冠区,22岁后卫爆发:独造2球,全场最佳

英超豪门杀入欧冠区,22岁后卫爆发:独造2球,全场最佳

足球狗说
2025-12-14 01:23:57
这位空姐颜值真的太漂亮了,不去当明星屈才了

这位空姐颜值真的太漂亮了,不去当明星屈才了

东方不败然多多
2025-12-14 02:57:45
10人聚餐逃单后续:张某正脸照曝光,把承诺当儿戏,已被老板起诉

10人聚餐逃单后续:张某正脸照曝光,把承诺当儿戏,已被老板起诉

冬天来旅游
2025-12-14 01:48:33
官方鼓励灵活就业交社保,蓄水池咋了?外卖员滴滴司机有苦说不出

官方鼓励灵活就业交社保,蓄水池咋了?外卖员滴滴司机有苦说不出

你食不食油饼
2025-12-12 01:29:04
失业不要急,很多人根本没意识到,这个时代最大的红利,就是随便做个小生意就能养活自己

失业不要急,很多人根本没意识到,这个时代最大的红利,就是随便做个小生意就能养活自己

李舟
2025-12-13 18:08:34
特朗普不得不访华,美国人已经发现,中国跟二战时期美国一样强大

特朗普不得不访华,美国人已经发现,中国跟二战时期美国一样强大

我心纵横天地间
2025-11-29 22:21:11
马雷斯卡:自从我来到俱乐部以来,过去48小时是最糟的48小时

马雷斯卡:自从我来到俱乐部以来,过去48小时是最糟的48小时

懂球帝
2025-12-14 02:33:07
演员张柏芝自曝只信任亲戚:被朋友背叛太多次,“家里人”才是最安全的

演员张柏芝自曝只信任亲戚:被朋友背叛太多次,“家里人”才是最安全的

极目新闻
2025-12-13 16:16:12
美国军火商洛马公司因没缴纳中方开出990亿罚单,后果竟如此严重

美国军火商洛马公司因没缴纳中方开出990亿罚单,后果竟如此严重

百态人间
2025-12-13 16:07:09
重庆10人聚餐逃单后续:嚣张称绝不付钱,餐馆老板不妥协已立案

重庆10人聚餐逃单后续:嚣张称绝不付钱,餐馆老板不妥协已立案

社会日日鲜
2025-12-13 07:13:04
叶童回应亲哥哥李忠宁当保安。叶童:不给他钱,父母从小就偏心。

叶童回应亲哥哥李忠宁当保安。叶童:不给他钱,父母从小就偏心。

百态人间
2025-09-23 16:32:42
泽连斯基,真汉子!

泽连斯基,真汉子!

近距离
2025-12-13 11:42:14
高市政府要取消中国留学生特权,已实行42年的“所得税豁免”政策

高市政府要取消中国留学生特权,已实行42年的“所得税豁免”政策

日本物语
2025-12-12 18:11:38
太鸡肋!CBA首场潜力赛打完,所有人都吐了,前国手马健吐槽

太鸡肋!CBA首场潜力赛打完,所有人都吐了,前国手马健吐槽

丁蓳解说
2025-12-14 01:35:43
2025-12-14 03:51:00

科技要闻

比亚迪、小鹏、北汽,集体表态

头条要闻

"小米公司不让卖小米"涉事村庄村民:冯书记直播不收钱

头条要闻

"小米公司不让卖小米"涉事村庄村民:冯书记直播不收钱

体育要闻

有了风骚白人秃头,忘掉谈了10年的前任

娱乐要闻

插刀门后,印小天一举动实现口碑逆转

财经要闻

镁信健康闯关港交所:被指窃取商业秘密

汽车要闻

表面风平浪静 内里翻天覆地!试驾银河星舰7 EM-i

态度原创

时尚
亲子
房产
本地
公开课

法式方头靴的30种穿法,时髦不重样!

亲子要闻

七小七:用清洁配方重新定义儿童食品健康标准,获双品类销量第一

房产要闻

中粮好房子体系盛大亮相三亚,礼献海南自贸港封关

本地新闻

云游安徽|阜阳三朝风骨,传承千年墨香

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×