网易首页 > 网易号 > 正文 申请入驻

受DeepSeek-R1启发,小米大模型团队登顶音频推理MMAU榜

0
分享至

3月17日,小米技术官方微博发文称,小米大模型团队在音频推理领域取得突破性进展,受 Deepseek-R1 启发,团队率先将强化学习算法应用于多模态音频理解任务,仅用一周时间便以64.5%的 SOTA 准确率登顶国际权威的 MMAU 音频理解评测榜首。现同步开源。

据介绍,MMAU(Massive Multi-Task Audio Understanding and Reasoning)评测集是音频推理能力的量化标尺,它通过一万条涵盖语音、环境声和音乐的音频样本,结合人类专家标注的问答对,测试模型在27种技能,如跨场景推理、专业知识等应用上的表现,期望模型达到接近人类专家的逻辑分析水平。

作为基准上限,人类专家在 MMAU 上的准确率为 82.23%。目前 MMAU 官网榜单上表现最好的模型是来自 OpenAI 的 GPT-4o,准确率为 57.3%。紧随其后的是来自 Google DeepMind 的 Gemini 2.0 Flash,准确率为 55.6%。

来自阿里的 Qwen2-Audio-7B 模型在此评测集上的准确率为 49.2%。由于它的开源特性,小米大模型团队尝试使用一个较小的数据集,清华大学发布的 AVQA 数据集,对此模型做微调。AVQA 数据集仅包含 3.8 万条训练样本,通过全量有监督微调(SFT),模型在 MMAU 上的准确率提升到了 51.8%。

DeepSeek-R1 的发布为小米大模型团队在该项任务上的研究带来了启发。DeepSeek-R1 的 Group Relative Policy Optimization (GRPO) 方法,让模型仅通过"试错-奖励"机制就能使自主进化,涌现出类似人类的反思、多步验证等推理能力。

小米大模型团队尝试将 DeepSeek-R1 的 GRPO 算法迁移到 Qwen2-Audio-7B 模型上。最终,在仅使用 AVQA 的 3.8 万条训练样本的情况下,强化学习微调后的模型在 MMAU 评测集上实现了 64.5% 的准确率,这一成绩比目前榜单上第一名的商业闭源模型 GPT-4o 有近10个百分点的优势。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
俄驻华大使馆高调庆祝《北京条约》夺取外东北(海参崴)160周年

俄驻华大使馆高调庆祝《北京条约》夺取外东北(海参崴)160周年

律法刑道
2025-12-30 08:34:47
三士兵杀害多名战友后叛逃金门马祖,中央严令空军:坚决截杀!

三士兵杀害多名战友后叛逃金门马祖,中央严令空军:坚决截杀!

阿胡
2024-03-06 13:44:40
浙江绝杀球踩线不吹,广东三分没踩线被吹掉!CBA裁判水平太低了

浙江绝杀球踩线不吹,广东三分没踩线被吹掉!CBA裁判水平太低了

多特体育说
2026-01-06 06:20:03
影后辛芷蕾,这张照片摄影师得加鸡腿,抓拍的太到位了

影后辛芷蕾,这张照片摄影师得加鸡腿,抓拍的太到位了

徐帮阳
2025-12-23 18:33:38
27岁,好爱伸舌头,妈咪级别爱豆

27岁,好爱伸舌头,妈咪级别爱豆

技巧君侃球
2026-01-05 22:54:20
震惊!一根手指才值10万,江苏某院方回应,新生儿手指被护士剪断

震惊!一根手指才值10万,江苏某院方回应,新生儿手指被护士剪断

火山詩话
2026-01-06 07:02:05
胜广厦发布会!卢伟赞篮板,谈洛夫顿+白边发挥,李弘权强调团结

胜广厦发布会!卢伟赞篮板,谈洛夫顿+白边发挥,李弘权强调团结

篮球资讯达人
2026-01-06 00:10:33
国家明令禁止!2026停车费新规,这6类费用车主可以大胆拒缴!

国家明令禁止!2026停车费新规,这6类费用车主可以大胆拒缴!

今朝牛马
2026-01-05 17:12:02
特朗普急了,马杜罗迎来帮手,六国挺身而出,四国对美国发出通牒

特朗普急了,马杜罗迎来帮手,六国挺身而出,四国对美国发出通牒

墨印斋
2026-01-05 19:18:47
2026年春节不一般,老人说“5个生肖要穿红”,看看有你吗?

2026年春节不一般,老人说“5个生肖要穿红”,看看有你吗?

复转这些年
2026-01-05 23:36:21
丘成桐:我可以骄傲地说,未来5到10年中国将成为数学强国

丘成桐:我可以骄傲地说,未来5到10年中国将成为数学强国

新浪财经
2026-01-04 06:04:19
阿莫林 VS 全员下课主帅!谁才是后弗格森时代的最大败笔?

阿莫林 VS 全员下课主帅!谁才是后弗格森时代的最大败笔?

澜归序
2026-01-06 02:44:50
美论坛直言:不管中国承不承认,中国其实已经输掉了这场关税战?

美论坛直言:不管中国承不承认,中国其实已经输掉了这场关税战?

顾史
2026-01-05 18:35:07
老了才明白:父母一旦超过73!立刻停止3种行为,否则晚景会凄凉

老了才明白:父母一旦超过73!立刻停止3种行为,否则晚景会凄凉

阿凯销售场
2026-01-06 03:54:13
主持人高黎之去世,年仅52岁,当天上午还好好的,好友透露细节

主持人高黎之去世,年仅52岁,当天上午还好好的,好友透露细节

180视角
2026-01-05 14:55:47
房子里有“不干净”的东西,会有以下3种特征,占一样也不得了

房子里有“不干净”的东西,会有以下3种特征,占一样也不得了

神奇故事
2026-01-05 23:24:05
上海千亿集团塌房!企业要求员工“裸辞”,老板早已携款“跑路”

上海千亿集团塌房!企业要求员工“裸辞”,老板早已携款“跑路”

时光在作祟
2026-01-05 19:54:32
我奶奶打了我妈一巴掌,我爸默不作声,随即拉住我妈:咱们搬出去

我奶奶打了我妈一巴掌,我爸默不作声,随即拉住我妈:咱们搬出去

五元讲堂
2026-01-05 07:55:03
女排联赛曝丑闻!1米98副攻赛后施暴队友,被俱乐部罚款40万

女排联赛曝丑闻!1米98副攻赛后施暴队友,被俱乐部罚款40万

跑者排球视角
2026-01-06 00:03:53
“北京见”引爆网络热议,林更新一夜翻身,评论区全变“支持派”

“北京见”引爆网络热议,林更新一夜翻身,评论区全变“支持派”

橙星文娱
2026-01-05 22:06:57
2026-01-06 07:48:49
鞭牛士 incentive-icons
鞭牛士
准确、快速、有深度的科技媒体
102542文章数 61659关注度
往期回顾 全部

科技要闻

性能涨5倍!黄仁勋CES秀肌肉 下代芯片来了

头条要闻

马杜罗在美首次出庭表示不认罪:我仍是委内瑞拉总统

头条要闻

马杜罗在美首次出庭表示不认罪:我仍是委内瑞拉总统

体育要闻

50年最差曼联主帅!盘点阿莫林尴尬纪录

娱乐要闻

《探索新境2》王一博挑战酋长岩

财经要闻

丁一凡:中美进入相对稳定的竞争共存期

汽车要闻

海狮06EV冬季续航挑战 "电"这事比亚迪绝对玩明白了

态度原创

游戏
本地
手机
亲子
公开课

PS港服节日限定优惠阵容上新!超多游戏低至25折

本地新闻

云游内蒙|初见呼和浩特,古今交融的北疆都会

手机要闻

2699元起!10080mAh+240万跑分,荣耀Power2把性价比卷成天花板了

亲子要闻

五岁小女孩发现家里有小偷,她竟然这么做,太机智了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版