一水 闻乐 发自 凹非寺
量子位 | 公众号 QbitAI
中国AI音乐,悄悄把全球第一拿走了——
昆仑万维Mureka V8,最新登顶Artificial Analysis音乐模型榜,一举超越Suno V4.5、Udio v1.5 Allegro等国际主流模型。
而且还是人声(vocal)、器乐(instrument)双料第一那种。
![]()
![]()
那么问题来了,这个新鲜出炉的“双料第一”到底有多能打?
咱直接实测说话。
人声、器乐双实测
先看最直观的人声
这块儿我们先给出了一个极简提示词,不加复杂的结构和参数,就看Mureka V8最原始的理解和生成能力:
- 晚风民谣,温柔女声,黄昏乡间的慢时光。
![]()
视频链接:https://mp.weixin.qq.com/s/tw18swYdQYE2oxyuMWikEg
怎么说?AI唱歌是不是太有真人感了!!
吐字清晰咱就不提了,关键在细节。
第四句开头能听到一个明显的换气声,再往后,几处歌词结尾也明显能听出气息的上扬or下落处理。
这种呼吸起伏恰到好处地在曲子里穿插衔接,非常自然,而不是那种生硬堆砌。
还有温柔这个标签,不只是贴在声音上,在段落的推进上也贯穿始终。
主歌更克制、更贴耳、气息更轻;副歌才稍微把声带打开,情绪抬起来,不过这种情绪依然是收着的,没有用力过猛。
木吉他带入,人声一出,田间、黄昏、晚风……这惬意感简直扑面而来。
听完民谣,我们又甩给Mureka V8一个极其刁钻的指令。
“曲风要Pop Rock和R&B混着来,节奏要卡死在72BPM的慢板,人声还得在几个段落里来回切换:
第一段气声唱法是那种沙沙的、带点破碎感的声音;
副歌直接切摇滚嗓,带嘶吼的那种;
间奏再来一段R&B转音,最后用假声慢慢收尾。”
![]()
视频链接:https://mp.weixin.qq.com/s/tw18swYdQYE2oxyuMWikEg
没想到这反复横跳的刁钻需求,还真被Mureka V8给跑出来了,听上去完成得不错(doge)。
几种状态截然不同的丝滑转声,中间切换还不断档、不卡顿。
好吧我承认V8你的唱商在我之上……
再让AI试试玩乐器
一提到乐器,英式摇滚乐队The Kinks的《You Really Got Me》简直不要太出名——
这首歌的前奏,是一段1960年代最具标志性的失真吉他riff。
所谓riff就是一段简短、重复、极具辨识度的乐器乐句,通常是吉他或贝斯演奏,构成整首歌的记忆点。
而Mureka V8在学到这种技巧后,为我们生成了一首纯器乐演奏曲《Got Me Going》:
![]()
视频链接:https://mp.weixin.qq.com/s/tw18swYdQYE2oxyuMWikEg
就问有谁不想边听边摇头抖腿呢(笑.jpg)。
开头的riff味道非常正,一下子就把记忆点拉满,然后整个器乐编排也十分有画面感——
一听就知道人已经坐在酒馆或Livehouse台下了,而此时台上正有一支帅气逼人的乐队在演奏,还是边演边跳舞那种。
u1s1,AI生成的器乐演奏如今能到这个水平,确实给了人很大惊喜。
听完之后,你会很明显感受到它对不同乐器特性、歌曲意境的理解等,都往前迈出了一大步。
![]()
而当这种器乐演奏能力和人声能力相结合之后,Mureka V8曾被反复提及的一点,也愈发清晰——
它所生成的,已经不再是一段“AI音频片段”,而是一首结构完整、情感连贯、制作精良的“歌”
换句话说,它知道什么时候该唱、情绪怎么推进、用什么乐器以及该怎么用。
这种近乎专业音乐人的创作能力,让它真正跨越了一条从“可生成”到“可直接发布”的线。
因为懂音乐,所以可以直接生成“歌”。
而能够生成一首完整的“歌”,则意味着普通人无需专业训练也能拥有属于自己的作品——
人人都能参与创作发表的时代,真的来了。
至此,靠着“双料第一”实力打底的Mureka V8,也把AI音乐直接卷到了新的高度。
三个月一更,昆仑万维太卷了
不过实测一圈下来,我就想知道:它这股子暴力进化感是咋做到的?
答案大概藏在那条密密麻麻的时间线里——
昆仑万维这家公司在AI音乐的赛道上简直卷疯了。
2024年2月SkyMusic 1.0内测起步,到了2026年1月,Mureka V8正式发布,满打满算不到两年时间,硬生生迭代了8个大版本。
什么概念?平均三个月一更?!
能这么玩,到底是在烧钱还是真憋着一口气要把这事儿干成?
![]()
从结果来看,昆仑万维应该是后者。
回看Mureka这不到两年的进化史,其实就是一个把“AI音乐好听”从玄学变成可量化、可复现的工业化生产能力的迭代过程。
第一阶段是从不能用到能用
SkyMusic 1.0当时还只是个能跑通的内测版本,那时候团队就盯着一件事,先把端到端“能用”这件事做出来,跑通训练到评测的基础闭环。
紧接着两个月后,2.0版本就直接把中英文版本上线到天工,这时候的AI音乐勉强算是迈过了“能出声、不鬼畜”的门槛。
第二阶段是从能用到好用
到了2024年8月,产品迎来3.0到4.0大版本跃迁,解决了规模化的问题。
昆仑万维这次不仅落地了Mureka首个超大规模版本,构建起稳定的规模化基模能力,还在听感和音质方面还实现了“肉耳可听”的级数跃迁。
独立产品也借此杀出重围,正式切入市场。
到了5.0/5.5版本,多语种工程化能力补齐,Mureka开始在全球市场刷脸。
进入2025年,随着MusiCoT和更系统化的强化学习跑成闭环,模型开始具备主动思考的能力
这时候的Mureka就不是盲目撞大运了,拥有了先规划音乐框架、敲定配器细节和情绪,再按逻辑推进创作的主动能力。
第三阶段是从好用到直接生产可发布内容
到了V8,量变终于引起了质变。
人声的呼吸感、乐器的空间感、混音的专业度让它在AA榜单双料登顶,直接干翻了Suno和Udio。
![]()
这一步跨了两年,但昆仑万维是真跨过去了。
所以那套看似“超速”的迭代节奏,好像也没那么“疯”了——
不这么卷,怎么在两年内把一个从零开始的模型做到全球第一?
说它卷它还真没完!!
V8发布刚刚过去两个月,基于MusiCoT进一步深化的Mureka V9就要来了……
Mureka V8解决了AI音乐“能写出来”这件事,至于V9卷成了什么样嘛——
咱只能说,它琢磨的是“能按你想的方式写出来”
不懂?3月27日看发布会估计你就懂了。
AI音乐,这下得看北京了
当然了,即使不谈Mureka V9,仅从V8的两次登顶,我们也已经能看到一个更清晰的变化:
“东升西落”正在AI音乐这个垂类赛道上演
之所以这样说,是因为过去很长一段时间,AI音乐基本是太平洋那头的主场,出名的模型也就那几家。
包括这次提到的Suno、Udio等,基本有一个算一个。
但是现在,以昆仑万维Mureka V8为代表的国产模型,却悄然间拿回了主动权。
说到这里有人或许就好奇了,为什么会出现这种反转?
答案,其实早就已经浮出水面了。
![]()
一旦把这件事放在一个更大的背景下来看,你会发现,“东升西落”几乎已经成了各个AI赛道必然会出现的一幕景象。
从引爆这轮AI革命的大语言模型,到最近掀起热潮的“龙虾”,剧本基本都一样——
前期由海外公司完成技术引爆,后期则由国产团队实现追赶,甚至反超
到现在,国产开源已经成了比肩闭源的重要力量、国产模型被海外公司“友好借鉴”拿去玩“龙虾”……人们总是后知后觉发现,很多原本以为的“追赶”,其实早就变了。
而这一切背后的逻辑,其实大家也都心知肚明。
放在制造业领域,大家会说这是因为有“中国制造”;而放在互联网科技、放在AI领域,答案则是“中国速度”“中国规模”“中国场景”。
一方面,国内这批AI玩家基本都经历过互联网从诞生到发展的完整时期,所以他们很熟悉那套“小步快跑、不断根据用户反馈进行迭代”的打法。
可以说,相比从0到1,我们尤为擅长从1到100。
另一方面,在内容、场景和用户规模上,国内也拥有得天独厚的“练兵场”——
无论是庞大的互联网用户群体、丰富多元的应用场景,还是足够复杂的内容生态,都给国产模型提供了快速试错、持续优化的土壤。相应地,国产AI也能更快形成“飞轮效应”。
![]()
而这些,也同样正在支撑着AI音乐赛道的发展。
所以,此时国产玩家里有人能“站出来、站起来”,也就不足为奇了。
至于为什么会是昆仑万维,上一部分也已经说了很多了——
围绕把“好听”变成可复现的系统能力这个目标,他们对AI音乐这个垂类赛道进行了长期持续投入
俗话说,水滴石穿、绳锯木断。所以如今能有这个结果,也算是水到渠成的事情。
再加上昆仑万维还是北京市人工智能产业的科技创新代表,所以登顶这件事本身也多了另一层象征意义:
AI音乐,往后高地就是北京了。
据说,昆仑万维还会在3.27(本周五)举办的中关村论坛开专场发布会
届时Mureka V9,应该会有更多详情和介绍。
酷~
体验地址:
国内版:https://www.mureka.cn/
海外版:https://www.mureka.ai/
榜单地址:
人声:https://artificialanalysis.ai/music/leaderboard/vocals
器乐:https://artificialanalysis.ai/music/leaderboard/instrumental
— 完 —
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.