网易首页 > 网易科技 > 网易科技 > 正文

无问芯穹发布首个端侧全模态理解的开源模型Megrez-3B-Omni

0
分享至
据了解,Megrez-3B-Omni 拒绝牺牲任何模态的精度,在图片、文本、音频三个模态中均取得了同尺寸下最优性能。

12月16日,无问芯穹宣布正式开源其“端模型+端软件+端IP”端上智能一体化解决方案中的小模型——全球首个端侧模态理解开源模型Megrez-3B-Omni,并同步开源了纯语言版本模型Megrez-3B-Instruct。

据介绍,Megrez-3B-Omni是一个为端而生的全模态理解模型,选择了最适合手机、平板等端侧设备的30亿参数黄金尺寸,结构规整,推理速度最大领先同精度模型300%。作为一个全模态模型,Megrez-3B-Omni同时具备图片、音频、文本三种模态数据的处理能力,并在三个模态的多种测评基准中取得了最优性能。

据了解,Megrez-3B-Omni 拒绝牺牲任何模态的精度,在图片、文本、音频三个模态中均取得了同尺寸下最优性能。无论是和同样三模态的VITA ( based on Mixtral 8×7B) 、Baichuan-Omni-7B ,还是双模态的MiniCPM-V 2.6 ( based on Qwen2-7B)、Qwen2-VL-7B、Qwen2-Audio-7B,又或是单一模态的Qwen、Baichuan 等模型相比,Megrez-3B-Omni 在主流基准测试集上的表现都毫不逊色。

在图像理解方面,Megrez-3B-Omni 作为一个体积仅为3B的模型,其综合性能表现可以全面超过34B的庞然大物,超越LLaVA-NeXT-Yi-34B 等模型,是目前OpenCompass、MME、MMMU、OCRBench等多个主流测试集上精度最高的图像理解模型之一。

与此同时,Megrez-3B-Omni 在场景理解、OCR 等任务上也具有良好表现,能够准确洞察和分析图像中的场景内容,并高效地从中提取文本信息,且无论是模糊的印刷体还是复杂的手写字,都能够轻松识别。

在文本理解方面,作为全模态理解模型,Megrez-3B-Omni 没有牺牲模型的文本处理能力,将上一代14B大模型的优秀能力压缩至3B规模,显著降低了计算成本、提升了计算效率。在C-EVAL、MMLU/MMLU Pro、AlignBench等多个权威测试集上更是取得端上模型最优精度。

在语音理解方面,Megrez-3B-Omni 的效果比肩行业主流方案。Megrez-3B-Omni不仅支持中文和英文的语音输入,还能够处理复杂的多轮对话场景,更能支持对输入图片或文字的语音提问,实现不同模态间的自由切换。用户就任意模态内容,发出语音指令,Megrez-3B-Omni 就能根据语音指令直接响应文本,让用户可以通过更少动作与模型展开更直观、自然的交互。

据介绍,模型的规模并不是决定其速度的唯一因素,因此模型小并不一定就意味着速度快。凭借对硬件特性的深入理解与利用,Megrez-3B-Omni 通过软硬件协同优化策略,确保了各参数与主流硬件高度适配,以实现硬件性能的利用最大化。与上一代及其他端侧大语言模型相比,单模态版本的Megrez-3B-Instruct 在推理速度上取得了显著提升,最大推理速度可以领先同精度模型300%。

Megrez-3B-Instruct 这次还特别提供了WebSearch 功能,这一功能使得模型能够智能地判断何时需要调用外部工具进行网页搜索,辅助回答用户的问题。用户得以构建属于自己AI搜索,通过网络获取最新信息,克服小模型的幻觉问题和知识储备不足的局限。

无问芯穹表示,Megrez-3B-Omni是一个能力预览,接下来还将持续迭代Megrez系列,提升自动化水平至“edge device use”效果,让用户只需要给出简单的语音指令,就可完成端设备的设置或应用操作,并将它作为“端模型+端软件+端IP”端上智能一体化解决方案的重要构成推向市场。

在这个方案中,除端侧全模态理解模型外,还有端上推理软件和IP设计方案,不仅支持CPU、GPU和NPU 的同时推理,更能通过跨越软硬件层次的系统优化,额外带来最高可达70%的性能提升,最大化端侧硬件性能的利用。(易智)

延伸阅读
相关推荐
热点推荐
旧手机不要了,选择“恢复出厂设置”就能清除个人信息?想得太简单了

旧手机不要了,选择“恢复出厂设置”就能清除个人信息?想得太简单了

新浪财经
2025-12-17 15:40:49
王励勤重磅调整!世界第一组合拆对,3大新星上位,蒯曼陈熠联手

王励勤重磅调整!世界第一组合拆对,3大新星上位,蒯曼陈熠联手

乐悠悠娱乐
2025-12-19 10:36:09
女教师跳楼再添猛料!父母不退彩礼,再提过分要求,难怪一直逼婚

女教师跳楼再添猛料!父母不退彩礼,再提过分要求,难怪一直逼婚

阿纂看事
2025-12-18 15:04:37
广州一小车误闯人行天桥进退两难,目前相关部门已到场完善交通指示牌,并增设止车柱

广州一小车误闯人行天桥进退两难,目前相关部门已到场完善交通指示牌,并增设止车柱

三湘都市报
2025-12-18 22:42:05
就在今天!12月19日早上,广东传来杜锋、徐杰和胡明轩的最新消息

就在今天!12月19日早上,广东传来杜锋、徐杰和胡明轩的最新消息

篮球看比赛
2025-12-19 11:00:05
77:20!美投票结果公布,白宫宣布“退群”,特朗普发表全国讲话

77:20!美投票结果公布,白宫宣布“退群”,特朗普发表全国讲话

现代小青青慕慕
2025-12-19 00:11:34
川普18分钟讲话:这就是他恐慌的样子

川普18分钟讲话:这就是他恐慌的样子

美国华人杂谈
2025-12-19 08:40:23
台军迈出疯狂一步,全面授权开火,不出24小时,福建舰堵门列阵

台军迈出疯狂一步,全面授权开火,不出24小时,福建舰堵门列阵

小兰聊历史
2025-12-18 05:39:28
2019年,被“港独”暴徒围攻,被迫举枪的光头警长,后来怎样了?

2019年,被“港独”暴徒围攻,被迫举枪的光头警长,后来怎样了?

知鉴明史
2025-12-18 18:21:51
吕某在工作群发布国家秘密信息并被3个群转发,近百同事无一提醒制止致全面扩散,3个群管理员也被追责

吕某在工作群发布国家秘密信息并被3个群转发,近百同事无一提醒制止致全面扩散,3个群管理员也被追责

环球网资讯
2025-12-18 08:02:08
泗水县人大常委会原副主任王士珂接受监察调查

泗水县人大常委会原副主任王士珂接受监察调查

齐鲁壹点
2025-12-18 16:47:55
海兰泡啊,海兰泡!124 年前的血色江水,仍在叩问良知

海兰泡啊,海兰泡!124 年前的血色江水,仍在叩问良知

诗意世界
2025-12-15 09:00:03
演!员王传君发文宣布退出

演!员王传君发文宣布退出

瓜农娟姐
2025-12-19 10:36:43
中国留学生保存大量儿童色情视频,面临终身监禁

中国留学生保存大量儿童色情视频,面临终身监禁

大洛杉矶LA
2025-12-19 07:11:48
翻出10年前的订单,网约车司机感慨万千!黄金时代一去不回

翻出10年前的订单,网约车司机感慨万千!黄金时代一去不回

网约车观察室
2025-12-18 17:54:25
预定普斯卡什奖?阿拉伯杯决赛惊现超远吊射世界波,对方门将被打懵

预定普斯卡什奖?阿拉伯杯决赛惊现超远吊射世界波,对方门将被打懵

侧身凌空斩
2025-12-19 05:19:49
曲靖15岁女生遭同班男生杀害案将开庭,公诉机关指控被告人犯杀人罪、强奸罪,女生父亲:希望凶手得到严惩

曲靖15岁女生遭同班男生杀害案将开庭,公诉机关指控被告人犯杀人罪、强奸罪,女生父亲:希望凶手得到严惩

极目新闻
2025-12-18 16:21:01
小学生吃早餐视频火了,116万网友点赞:这就是有父母兜底的幸福

小学生吃早餐视频火了,116万网友点赞:这就是有父母兜底的幸福

妍妍教育日记
2025-12-18 20:23:32
随着12月19日的来临 ,火箭队传来三条重磅消息非常值得关注!

随着12月19日的来临 ,火箭队传来三条重磅消息非常值得关注!

田先生篮球
2025-12-19 09:09:02
12月18日俄乌最新:普京决定让川普分一杯羹

12月18日俄乌最新:普京决定让川普分一杯羹

西楼饮月
2025-12-18 18:05:04
2025-12-19 12:19:00

科技要闻

2025新一代人工智能创业大赛总决赛收官

头条要闻

牛弹琴:战机又被照射后日本急了 有人第一个想到中国

头条要闻

牛弹琴:战机又被照射后日本急了 有人第一个想到中国

体育要闻

没有塔图姆,还有塔秃姆

娱乐要闻

曲协表态仅6天,郭德纲担心的事还是发生

财经要闻

非法集资911亿!"金融大鳄"终审被判无期

汽车要闻

轴距加长配置升级 广汽丰田雷凌L官图发布

态度原创

时尚
本地
家居
房产
公开课

“烟管裤”今年冬天爆火,怎么搭都时髦!

本地新闻

云游安徽|访黄山云海古村,读一城山水风骨

家居要闻

高端私宅 理想隐居圣地

房产要闻

万科·三亚嘉澜地,万科高端旅居系1号作品全球发布

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×