![]()
撰文 | 程书书
编辑 | 李信马
题图 | 豆包AI
曾几何时,AI音乐还只是科技爱好者手中的新奇玩具——用户只需输入几个关键词,便能“开盲盒”式地生成一段旋律。然而,其结果往往充满随机与实验色彩,难以真正步入专业音乐的殿堂。
但这一局面正在被快速打破。
近期,AI音乐初创公司Suno正以超过20亿美元的估值寻求新一轮融资,较此前翻了两番;据称其年经常性收入已突破1亿美元,为这一新兴赛道注入了坚实的商业信心。与此同时,流媒体巨头Spotify宣布携手三大唱片公司及行业组织,共同开发“负责任且以艺术家为中心”的AI音乐产品,标志着传统音乐产业正从观望转向积极合作。而AI语音领域的领军者ElevenLabs获得英伟达战略投资、OpenAI被曝即将正式入局等消息,更意味着该领域吸引了顶级科技公司的关注。
这一系列密集的资本与产业动态,指向一个清晰的趋势:在技术迭代、资本加持与产业协作的多重推动下,AI音乐已不再仅仅是实验室中的Demo或网络谈资。它正以可感知的速度,融入从创作到消费的完整产业链,从昔日的酷炫“玩具”,加速成长为一门真正的“生意”。
01、从“开盲盒”到生产力
早期AI音乐的核心局限,在于“一次性生成”的“盲盒属性”:输入关键词后得到的旋律往往是“一锤子买卖”,既无法修改调整,也难保证音质与专业度,只能作为趣味体验,难以切入正式创作场景。
而2025年以来,Udio、Suno等玩家密集推出的新一代工具,通过编辑功能升级、音质突破与创作逻辑重构,彻底打破这一困境,让AI音乐进入“可循环修改、可精准控制、可深度打磨”的“精雕细琢”阶段。
首先,可视化编辑工具的落地,实现了“段落级精修”。
今年4月1日,由澳大利亚公司TopazLabs开发的AI音乐生成平台Udio推出全新“UdioStyles”功能,允许用户上传自己拥有或控制的内容,进而生成模仿现有曲目“声音特征”的新音乐。与此同时,还发布了现有AI模型的更新版本v1.5Allegro,在不损失质量和一致性的前提下,输出速度提高了30%,大大提升创作效率,助力创作者更快将灵感转化为音乐作品。
两个月后,Udio又迅速推出可视化编辑工具Sessions,直接填补了AI音乐“难修改”的空白。该工具能自动从音频波形中识别主歌、副歌、桥段等音乐结构,创作者可以在其中移动、扩展或替换歌曲的不同部分。更关键的是,修改后的段落能与原有音乐在调性、节奏上自动适配,避免出现衔接断裂的问题。
其次,高质感模型与专业工作站结合,实现了“细节级可控”。
同样在6月,美国AI音乐生成器初创公司Suno收购了AI音频工作站WavTool,并在今年9月接连推出V5模型和自研的数字音乐工作站(DAW)SunoStudio。其中,V5模型带来了音质的飞跃,生成的音乐可以达到接近真人录制的自然质感;而自研的数字音频工作站SunoStudio更是对传统DAW的一次革命,“生成+编辑”的结合,也改变了以往AI一步生成不能编辑的模式。
![]()
图源:SunoStudio官方教程截图
一些没有经过音乐专业训练的用户,只需要输入音乐风格、歌词大意或者情感基调、具体指向性的提示词或者参考片段,甚至哼唱一段旋律由手机录音后上传,SunoStudio可以在几分钟内直接合成一个音乐成品,并同时生成每个乐器的分轨音频,可通过在音轨的局部段落修改编辑指令,让AI再次生成新的音乐段落。
音乐人可以用专业的知识来“指挥”AI为其提供更多的创作素材,例如可在分轨音轨上根据自己的需求剪辑、叠加和重组素材,指令生成多个AI版本进行选择或组合,以供创作者在瓶颈期捕获灵感,大大缩短制作周期。
与此同时,极简交互工具补位,实现了“需求级精准”。
英国AI语音生成器公司ElevenLabs旗下的ElevenMusic更是降低了AI音乐生成的专业门槛降,其主界面仅保留一个输入框,操作完全对话式,用户只需输入描述性的提示,如音乐风格、情感氛围、乐器配置等,系统便能据此生成各种类型的音乐。更令人惊叹的是,用户还可以选择音乐中是否包含人声、特定乐器等细节元素,极大地丰富了创作的自由度。目前,该AI已支持英语、西班牙语、德语、日语等多语种歌曲的生成。
工具的集体进化,使AI音乐生成的内容变得可修改、可组合、可嵌入,可以真正成为创作者手中的生产力工具,而不只是炫技的Demo。
02、竞逐“AI音乐”
随着技术基座的初步成型,一场围绕AI音乐的全球商业竞速赛已全面打响。从科技巨头到初创公司,从海外到国内,各方力量正从技术、产品、生态等多个维度展开布局。
在国际赛场,竞争日趋白热化。上文提到的技术驱动型初创公司,以“高质感+强落地”巩固头部地位。
Suno与Udio作为赛道标杆,已实现“技术突破-商业验证”的闭环:Suno不仅以V5模型与SunoStudio构建起“音质+可控性”的技术护城河,更以年收入1.5亿美元、三年增长4倍的业绩,印证了订阅制、企业级配乐等商业模式的可行性;Udio则通过Styles风格库与Sessions编辑工具,聚焦“专业创作效率提升”场景,成为短视频创作者、独立音乐人青睐的“快速Demo工具”,其商业化进度与用户粘性持续领跑。
其次是跨界入局的科技巨头们,以“资源整合+场景垂直”切入赛道。
谷歌在今年5月发布Lyria二代模型,避开“通用音乐生成”的红海,转而聚焦“广告配乐”——依托自身广告生态资源,Lyria二代可快速适配不同行业广告的风格需求,直接对接商业客户的定制化需求。
OpenAI也被爆出内部团队已悄然启动AI音乐生成技术的研发工作。为了给音乐生成模型提供高质量的训练数据,OpenAI正与茱莉亚音乐学院的部分学生展开合作,由这些学生对音乐谱例进行专业标注。
国内市场同样呈现出蓬勃的创新活力。当前,国内AI音乐大模型的玩家主要分为三类:
第一类是以字节、阿里为代表的“大厂派”。其中字节旗下的海绵音乐,是凭借免费策略和平台生态快速获取用户;以及阿里通义实验室发布的InspireMusic模型则是走“工具赋能”路径,开源InspireMusic全链路工具包,向中小开发者与企业开放AI音乐生成能力,以“生态共建”方式抢占B端市场。
![]()
图源:海绵音乐网页截图
第二类是以昆仑万维旗下的天工SkyMusic为代表的“新兴大模型厂商”。作为国内首个音乐SOTA模型,天工SkyMusic依托“天工3.0”超级大模型的技术底座,主打“快速生成+多风格适配”,重点切入“微短剧配乐”“游戏原声片段”等高频需求场景;其后续推出的MurekaO1模型更登顶行业SOTA榜单,以技术指标优势吸引专业创作团队合作,试图在“专业级AI音乐”领域建立话语权。
第三类是以趣丸科技旗下天谱乐为代表的“垂直赛道独角兽”。作为全球首个多模态配乐大模型,天谱乐不仅支持文生音乐、音频生音乐,更首创图片生音乐、视频生音乐功能,且比国际头部的Suno早3个月落地。从上线起,天谱乐就全面接入趣丸旗下的唱鸭App,直接触达千万级音乐爱好者用户,实现“产品-场景-用户”的深度绑定,快速完成用户与数据积累。
03、估值狂飙与版权暗礁
行业发展的如火如荼之际,隐藏的问题也悄然浮出水面。
AI音乐模型的核心能力,依赖于对海量音乐作品的学习与模仿,可这些训练数据中,绝大多数是受版权保护的商业作品(如唱片公司发行的歌曲、独立音乐人的原创作品)。目前行业普遍存在“数据来源不透明”的问题:多数AI音乐公司并未公开训练数据的授权情况,也未向原创作家支付相应的版权费用。
![]()
图源:豆包AI
这种“无授权训练”的模式,已引发全球版权方的警惕——德国音乐版权协会曾公开质疑Suno的训练数据合法性,称“未经授权使用受版权保护的音乐训练AI,本质是对创作者劳动成果的侵占”。
更复杂的是创作主体的界定。传统音乐创作中,“创作者即版权所有者”的逻辑清晰明确,但AI音乐却无法遵循这一逻辑:一位用户通过SunoStudio输入歌词与情绪提示,AI自动生成包含人声、鼓点、贝斯线的完整歌曲;另一位创作者则上传自己哼唱的旋律片段,由ElevenMusic扩展为交响乐版本。这些作品中,创意来自人类,执行由算法完成,素材源于训练数据——那么版权应归属于用户、平台,还是那些从未被署名的原始音乐人?
目前,无论是模型训练环节的“数据侵权”,还是生成作品的“归属模糊”,都尚未形成全球统一的解决方案。
面对版权困局,一些头部玩家开始主动搭建版权合作生态。Spotify与三大唱片公司、Merlin、Believe的合作,核心是建立“AI音乐版权分配机制”:AI生成作品若使用了版权方的授权数据,将按流量向原创作家支付分成;ElevenLabs则提前与独立音乐组织Merlin、版权商Kobalt达成协议,确保训练数据的合规性,并计划推出“AI音乐版权追溯系统”,通过技术手段记录作品的训练数据来源,实现“透明分成”。
行业政策与标准的制定也在加速。欧盟《人工智能法案》已将“AI生成内容的版权标注”纳入监管要求,明确AI公司需公开生成作品的训练数据来源;中国国家网信办在AI模型备案中,也将“训练数据合规性”作为核心审核指标。
对于AI音乐行业来说,合规不是终点,而是下一轮创新的起点。当技术突破与版权规范实现协同进化,当资本热情与法律框架找到平衡点,AI音乐才能真正完成从“玩具”到“生意”的蜕变。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.