网易首页 > 网易号 > 正文 申请入驻

中国AI再突破,全球首个音乐推理大模型Mureka O1诞生,超越Suno登顶SOTA|甲子光年

0
分享至

会思考的AI已经席卷到了音乐领域,这一次,引领这场变革的,也是一家来自中国的公司——昆仑万维。

作者|伍月‍‍

编辑|栗子‍‍

生成式AI的发展已进入关键的应用落地阶段,AI正在从快速生成转向深度推理。更聪明的AI不仅会回答问题,还能在推理过程中深思熟虑地推理和解决问题。

2025年春节,DeepSeek R1惊艳全球,其突破性地将诺贝尔经济学奖得主卡尼曼提出的“慢思考”(System 2)理论工程化,通过动态思维链技术重构模型推理范式,不仅推动OpenAI被迫开放思维链功能,更标志着AI从“刺激-反应”的直觉型生成,正式进化为具备自主推理能力的认知主体。

当全球目光聚焦于文本领域的突破时,会思考的AI已经席卷到了音乐领域。这一次,引领这场变革的,也是一家来自中国的公司——昆仑万维。

3月26日,昆仑万维正式发布Mureka O1模型与Mureka V6模型。其中,Mureka O1作为全球首款音乐推理大模型,性能超越Suno、模型登顶SOTA。中国科技创新再次在AI音乐领域领跑全球。

具体来说,Mureka是昆仑万维在2024年发布的一款AI音乐产品。第一代音乐生成模型Mureka V1(SkyMusic)发布于2024年4月,目前基座模型已经迭代到第六版,也就是Mureka V6。而Mureka O1模型是基于Mureka V6的推理优化版本,也是全球范围内首个引入CoT的音乐模型。

经过「甲子光年」实际体验,具备推理能力的Mureka O1在实际效果上的确更加惊艳,也是此次Mureka模型更新的最大看点。

比如,输入相同的prompt给到Mureka O1和Suno V4,对比之下,Mureka O1生成的音乐在歌手声音质感、节奏、旋律上都明显更胜一筹。

输入同一prompt,对比Mureka O1和Suno V4生成音乐效果

在「甲子光年」看来,一场音乐创作革命正在发生:AI不只是辅助工具,而是能根据简单指令即兴写词,还能理解布鲁斯的忧郁蓝调曲风的智能创作伙伴。

如同DeepSeek在上线推理模型R1之后的爆火一样,今天Mureka O1的问世让我们感觉,AI音乐的“GPT时刻”正在到来。

1.Mureka O1 & Mureka V6一手实测:人人都能成为音乐创作者

前面提到,最新发布的Mureka O1模型是基于Mureka V6思维链的推理优化版本,而Mureka V6是当前Mureka的基座模型,支持纯音乐生成,还支持10种语言的AI音乐创作,包括英语、中文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语和俄语。

Mureka支持10种语言作曲,来源:Mureka官网

我们先来感受一下Mureka官方创作的作品demo。

Mureka O1和Mureka V6发布后的第一时间,「甲子光年」就进行了一手实测。

在对话框中输入“小巷人家”这四个字后,Mureka便自动生成了一段生动的文字,词句间洋溢着浓浓的烟火气息:“鸡鸣犬吠迎晨曦,日子悠然缓行,青石板路上苔痕碧绿,老树垂下斑驳树影。”

点击创作键,不出一会儿,一段两分半钟的音乐便缓缓流淌而出。

由Mureka生成的《大街小巷》音乐

目前,可以直接通过Mureka的网页端(官网界面:www.mureka.AI)体验Mureka O1和Mureka V6。

打开Mureka官网,可以直接到达创作页面。歌曲创作有简单模式和高级模式。高级模式下,输入你想创作的歌曲名称,可以直接让AI生成相应的歌词。

在模型界面,用户可以选择Mureka O1、Mureka V6和Mureka V5.5多个模型进行创作。

Mureka支持模型切换,来源:Mureka官网

曲风上,Mureka不仅可以支持“爵士(Jazz)、电子(Electronic)、流行(Pop)、乡村(Country)、节奏布鲁斯(R&B)、灵魂乐(Soul)、蓝调(Blues)、摇滚(Rock)、舞曲(Dance)”等,还能直接让用户上传参考歌曲,或者粘贴YouTube链接,让AI根据用户选择定向生成不同的曲风。在列表中可以看到,很多用户上传的歌曲列表。

用户上传参考歌曲,让Mureka生成相似曲风的音乐,来源:Mureka官网

词曲都设置完成后,就可以点击创作生成不同歌曲,每次Mureka都会生成两首不同的歌供选择。歌曲生成后,可以直接点击发布分享歌曲链接,还可以根据歌词让AI生成对应的视频。

音乐生成后支持下载、视频生成和发布,来源:Mureka官网

Mureka还推出了很多对于音乐工作创作者非常友好的功能。比如,Mureka不仅提供丰富的官方歌手音色选择,还允许用户上传自己的声音,通过AI学习和复刻,实现个性化音色定制。人人都能成为AI歌手的时代来临,每个人都能轻松创作出具有个人特色的音乐作品。

上传自己的声音,定制自己的专属音乐,来源:Mureka官网

歌曲生成后,用户也可以下载分轨音频和伴奏等,且能对音乐进行局部编辑,自定义自己想做的作品。

支持对歌曲的二次编辑,来源:Mureka官网

各种顺滑的体验之外,Mureka还搞了个大动作:开放API服务和模型微调功能。

Mureka是全球首批开放API服务的高质量AI音乐生成平台。更重要的是,不仅在全球范围内首次开放API服务,Mureka还同步开放基于Mureka V6的模型微调服务,成为全球首个开放模型微调功能的AI音乐生成平台。

来源:Mureka官网

面向企业和开发者,Mureka开放了两大类灵活的API服务,具体包括音乐音频生成API,还有语音合成API。

使用Mureka,音乐工作室就可以上传版权作品,训练专属厂牌风格模型。这意味着,音乐工作室和众多创业者可以直接通过Mureka API实现创作的工业化。

当游戏公司利用该API批量生成1000个NPC(非玩家角色)的专属背景音乐(BGM)时,音乐生产便真正融入了智能化的工作流之中。

之前,网友们调侃李荣浩词曲创作一手包办,一个人就是一支队伍。而现在,AI技术的发展正使得这样的个人全能现象变得更加普遍和可行。

音乐史上个人全能创作的时代正在逐步到来——零基础用户同样能够创作出热门单曲,独立音乐人正迎来黄金时代。

2.Mureka O1如何定义“音乐推理”?

DeepSeek R1的深度思考功能让很多人都感受到了思维链的魅力。如今,包括OpenAI的O1在内的很多语言模型都已经上线深度思考功能,让用户通过思维链(简称CoT)直观的看到大模型的动态思考推理过程。

实践证明,CoT能显著提升模型的推理能力,并促进模型的研究和迭代。

昆仑万维的Mureka团队开创性的把这种深度思考的“思维链(CoT)”能力引入了音乐生成模型上。在GitHub项目主页:MusiCoT.github.io,可以看到论文和项目介绍

https://arxiv.org/abs/2503.19611

MusiCoT利用了思维链Chain-of-Thought (CoT)方法,不同于传统自回归模型逐步生成音频,MusiCoT首次在细粒度音频token预测前预生成整体音乐结构,大幅提升生成音乐的结构连贯性与乐器编排精准度。

语言模型的CoT实践在跨领域方面并不是一项可以拿来即用的技术。因为传统的CoT方法通常是通过自然语言展示中间推理步骤,让AI像人一样,一步一步地解释它是怎么想的,然后得出结论。

但在音乐领域,音乐的情绪、节奏、旋律比较复杂,没办法像分析文字那样,一步步“思考”音乐。

Mureka团队的工程师们想出了个聪明的办法,为AI理解和生成音乐提供了一种新的“思考”方式。

传统的AI作曲方式,就像写日记一样,一个音符接一个音符地写,想到哪写到哪,没有整体规划。

Mureka团队引入了一种能"听懂"音乐的AI翻译器 CLAP模型,把一段旋律或节奏转化一串“数字指纹”,同时还使用了RVQ技术,像是一个“翻译官”,把复杂的“数字指纹”翻译成 AI 能够理解的“标签”。

RVQ的粗到细粒度标记化方法,就像是一个“分层翻译”的过程:先翻译出音乐的整体框架,比如歌曲的结构、主要旋律等,就像是画一个草图; 然后再逐步翻译出音乐的细节,比如具体的音符、节奏变化等,就像是在草图上添加细节。

Mureka自研基于MusiCoT的自回归模型音乐生成技术,来源:MusiCoT.github.io

如此,AI创作时,不再是生硬地拼凑音符,而是像音乐家那样,先开始“画蓝图”,想出一个大概的音乐结构,然后再慢慢细化,生成具体的音乐。

这是一种创新性的尝试,且这种方式方式更贴近人类的创作流程,有助于产生更具整体性和连贯性的音乐作品。

这样,Mureka O1就像一位不断打磨作品的作曲家,能够持续学习,不断推理,优化自己的创作能力。

在最新的音乐评测中,Mureka O1在最终的整体听感评测中已经超过了Suno V4,在总分为10分评测中,拿到了6.93分,且在声音质感和背景音乐质感上也超过了Suno V4。

Mureka O1在主观测评中整体听感超越Suno V4

此外,在客观评测中,在音乐连贯性、歌词发音准确度、文本相关性、作品复杂度和质量等维度上,Mureka O1表现明显超越Suno V4。

相同prompt下生成歌曲的横向对比

技术报告也显示,同一段prompt输入后,Mureka O1实现了行业领先的低延迟音乐生成。

Mureka O1实现了行业领先的低延时音乐生成

MusiCoT的创新技术实践,不仅在技术层面实现了突破,更加提升了音乐生成的质量和效率,让音乐成为成为更加普及、更加多元、更加个性化的表达方式。

通过引入AI的深度思考能力,很多人也能够生成超越人类固有思维模式的音乐作品,从而拓展音乐创作的边界,探索全新的音乐风格和表达方式。

3.AI音乐创作作曲革命:“智能创作大脑”重新定义音乐生产力

“Mureka”不仅仅是一个产品名,它也代表着在音乐的世界里,灵感抵达之际,创意的喷薄而出。它象征着一种顿悟,一种灵感迸发的瞬间,如同阿基米德在浴缸中发现浮力定律时喊出的“Eureka!”一样,充满了惊喜和激动。

这种灵感时刻,也恰如其分的隐含了MusiCoT的出现,让AI音乐呈现出了灵感与算法的共鸣。AI能够像人类一样,在音乐中表达情感和创意。

毋庸置疑,音乐创作将迎来巨变。

由于Mureka开放 API 服务和模型微调功能。开发者不仅可以将Mureka强大的AI音乐生成能力集成到各种应用程序和平台中;还可以据特定需求,对Mureka的AI模型进行个性化训练。任何音乐人都可以以极低的成本,用自己创作的版权音乐,训练属于自己的音乐模型。已经有游戏开发者在尝试,通过微调模型,使其生成特定游戏风格的背景音乐。即使没有专业的音乐知识和技能,用户也可以通过Mureka生成高质量的音乐作品。

对于个人创作者而言,Mureka降低了专业音乐制作门槛,让脑海中的“灵光一现”能够快速转化为作品,被更多人看见。更多人能够参与到音乐创作中来,用音乐表达自己的情感和想法。对于专业的音乐制作人而言,Mureka更是一个激发创意的平台,它能够为音乐人提供丰富的灵感和创意,帮助他们突破创作瓶颈。

比如输入prompt:love song,Mureka可以自动生成歌词,点击创作就生成了下面这首歌。

在更广阔的文娱和内容产业,AI音乐将会被广泛应用,对于游戏、影视、广告等领域而言,Mureka能够提供高效、高质量的配乐解决方案,缩短制作周期,降低制作成本,让创作者能够更专注于内容创作本身。更多崭新的音乐教育、音乐治疗、音乐娱乐等业态会诞生,为人们带来更加美好的音乐体验。

昆仑万维最新还发了一支《Mureka》的同名MV,歌曲由AI音乐人Mureka演唱,动画部分则由AI视频生成平台SkyReels制作,进一步展示了AI音乐与AI视频的融合潜力。

目前,Mureka产品已经在全球化100多个国家被使用。Mureka向「甲子光年」谈到他们的愿景:“音乐是情感表达最重要的手段之一,过去因为学习门槛过高,学习曲线过于陡峭,影响了人们使用音乐这一载体表达情感。AI 技术可以让人们更好的使用音乐这一手段表达自己的情感。”

Mureka在音乐生成领域的惊艳背后,依托的也是在大模型全产业链进行布局的昆仑万维。

昆仑万维是国内少数在AI领域全产业链布局的互联网大厂。

昆仑万维创始人周亚辉曾在朋友圈表示,昆仑万维的AI战略优势在于差异化,并强调公司找到了“小而大美的空间”。

此次,Mureka O1 & V6两个模型的上线,不仅向外界展示了昆仑万维在 AI 技术上卓越的创新能力,更印证了其“小而大美”战略的成功实践。

通过聚焦 AI 音乐生成这一细分领域,Mureka团队创新性地引入“思维链(CoT)”等技术,赋予 AI 更强的理解和创造力,实现了技术和应用的突破。

据团队透露,接下来,Mureka还将开发更多创新性的音乐创作功能,例如音乐生成的二次编辑、歌曲的创意再造等;同时也会积极拓展开发者生态和合作伙伴关系,通过开放平台和合作,构建一个充满活力和创新力的音乐创作社区。

从DeepSeek到Mureka,中国AI在认知架构上的突破并非孤立存在,而是密不可分的。DeepSeek在通用AI领域的突破,为Mureka在音乐领域的创新,提供了颇具借鉴意义的方向。Mureka的创新实践,是中国AI在认知架构突破的基础上,针对音乐领域进行深度探索和创新的成果。不仅展示了中国 AI 在垂直领域的技术实力,也为 AI 音乐的未来发展,开辟了新的道路。

Mureka让AI成为灵感之源,将音乐灵感的门扉向大众敞开,未来,随着AI技术的不断进步,音符在科技与艺术的交融中,将会绽放更加耀眼的光芒。

(封面图来源:昆仑万维)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
争议!全运会王曼昱4-3险胜,不和谐一幕:球迷一边倒加油至破音

争议!全运会王曼昱4-3险胜,不和谐一幕:球迷一边倒加油至破音

大秦壁虎白话体育
2025-11-11 18:00:45
深圳这两大片区为何死活不通地铁?背后原因让人哭笑不得!

深圳这两大片区为何死活不通地铁?背后原因让人哭笑不得!

金哥说新能源车
2025-11-12 11:27:01
张予曦的身材太吸睛了 胸围好大 翘臀细腰 身材曲线完美流畅 太迷人了

张予曦的身材太吸睛了 胸围好大 翘臀细腰 身材曲线完美流畅 太迷人了

小椰的奶奶
2025-11-12 13:56:09
访华失败亮狠招,德国三连发难,比特朗普还狠辣,中方坚决反击

访华失败亮狠招,德国三连发难,比特朗普还狠辣,中方坚决反击

阿七说史
2025-11-11 12:50:59
西班牙国家德比历史最强阵容发布!C罗入选 内马尔都没资格入选?

西班牙国家德比历史最强阵容发布!C罗入选 内马尔都没资格入选?

体坛八点半的那些事儿
2025-11-12 11:28:42
第38届中国电影金鸡奖开幕,最佳男女主提名已揭晓!

第38届中国电影金鸡奖开幕,最佳男女主提名已揭晓!

东方不败然多多
2025-11-12 01:42:49
自己生病却让人吃药!韩国瑜亲上火线呛赖清德打断台湾安全3只脚

自己生病却让人吃药!韩国瑜亲上火线呛赖清德打断台湾安全3只脚

新时光点滴
2025-11-12 14:25:35
民主党午夜崩盘!川普政府赢下关键回合,加州州长怒斥“7个叛徒”:这是可悲的投降!

民主党午夜崩盘!川普政府赢下关键回合,加州州长怒斥“7个叛徒”:这是可悲的投降!

华人生活网
2025-11-11 05:32:00
安史之乱的分水岭——让哥舒翰赴死的“函谷之战”

安史之乱的分水岭——让哥舒翰赴死的“函谷之战”

《中国国家历史》
2025-11-11 19:59:15
浙江20岁小伙闪婚37岁离异阿姨,十年后她们怎么样了?

浙江20岁小伙闪婚37岁离异阿姨,十年后她们怎么样了?

风起见你
2025-11-12 04:17:47
特朗普心急如焚,关税战不但没打赢中国,美国可能要倒赔2万亿

特朗普心急如焚,关税战不但没打赢中国,美国可能要倒赔2万亿

头条爆料007
2025-11-11 20:32:58
中央巡视组进驻后被查的张柏森被决定逮捕

中央巡视组进驻后被查的张柏森被决定逮捕

正义网新闻
2025-11-11 16:11:02
70多岁老人要提前做好五个准备,最后一个很重要,有人却讳莫如深

70多岁老人要提前做好五个准备,最后一个很重要,有人却讳莫如深

情感大使馆
2025-10-30 10:28:22
举重选手徐璐莹抓举失误后教练转身,赛后选手为教练发声

举重选手徐璐莹抓举失误后教练转身,赛后选手为教练发声

懂球帝
2025-11-12 10:59:08
“闹腾”过头了!新能源汽车被踢出“十五五”,上头彻底失望了?

“闹腾”过头了!新能源汽车被踢出“十五五”,上头彻底失望了?

小李车评李建红
2025-11-11 07:39:46
悬着的心终于放下:滞留太空的中国航天员,带来意想不到的惊喜!

悬着的心终于放下:滞留太空的中国航天员,带来意想不到的惊喜!

刘森森
2025-11-12 11:26:11
福建省赖氏宗亲会秘书长喊话赖清德,国台办回应

福建省赖氏宗亲会秘书长喊话赖清德,国台办回应

界面新闻
2025-11-12 11:06:35
杨振宁离世不到1个月,49岁翁帆入职清华被群嘲,校方曝关键信息

杨振宁离世不到1个月,49岁翁帆入职清华被群嘲,校方曝关键信息

秋姐居
2025-11-11 21:45:17
年薪849万,年终奖1000万,中国“最贵董秘”朱旭,49岁依然单身

年薪849万,年终奖1000万,中国“最贵董秘”朱旭,49岁依然单身

素衣读史
2025-11-11 17:54:33
北美夺冠,中国票房从7.8亿跌到6400万,这块金字招牌算砸了?

北美夺冠,中国票房从7.8亿跌到6400万,这块金字招牌算砸了?

靠谱电影君
2025-11-11 20:23:26
2025-11-12 15:16:49
甲子光年
甲子光年
中国科技产业化前沿智库
3242文章数 9253关注度
往期回顾 全部

科技要闻

Meta"宫斗"持续,AI教父杨立昆被"气"走了

头条要闻

美主持人污蔑中国人窃取知识产权 遭特朗普反驳

头条要闻

美主持人污蔑中国人窃取知识产权 遭特朗普反驳

体育要闻

太阳三连胜&活塞东部第一 哪个更想不到

娱乐要闻

辛芷蕾配得上威尼斯影后吗?

财经要闻

专家建议设立5万亿房地产稳定基金

汽车要闻

能得到央视的肯定 长安马自达EZ-60可不简单

态度原创

游戏
教育
亲子
房产
公开课

年度大作《COD22》预载现已开启!11月14日开玩

教育要闻

宝贝,在学校得罪谁也别得罪这2个人,尤其是第二个

亲子要闻

何总心里活动怎么那么丰富,哈哈哈哈

房产要闻

海口湾,1300亩巨无霸地块登场!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版