![]()
2023年,Google DeepMind悄悄放出一款能写歌的AI,当时只给音乐人小范围试用。两年后,这套系统迭代到第三代,今天正式向全球开发者开放——不是实验室玩具,是带API的商业级工具。
Lyria 3的核心卖点很直白:能写带人声的完整歌曲,从主歌到副歌结构不乱,还能用自然语言精准控制情绪走向。
Google这次放出了两个版本。Lyria 3 Clip主打低延迟,适合实时交互场景;Lyria 3 Pro追求音质上限,给专业制作留空间。两者都支持多语言人声和跨流派生成,从流行到放克到摩城风格都能碰。
从"能响"到"能用",中间隔着一个音乐科班
音乐生成AI的痛点从来不是"有没有声音",而是结构能不能听。早期模型生成的片段像随机播放的短视频合集——15秒惊艳,2分钟后不知道在干嘛。
Lyria 3的解法是把"音乐意识"写进模型。具体来说,它理解曲式结构:前奏该多长、副歌怎么进、桥段放哪不突兀。开发者用自然语言描述"一段忧郁的钢琴前奏,过渡到激昂的电子副歌,最后淡出",模型能按这个叙事线走。
控制粒度也细了。情绪强度、乐器配置、人声表现力都能调。Google的演示里有个例子:同一首歌词,先让AI用"克制、压抑"唱一遍,再换成"爆发、撕裂"——同一把合成嗓子,两种人格。
API之外,Google还搭了个"试衣间"
开发者拿到Key之后,除了调接口,还能进Google AI Studio的新音乐专区。这个Playground提供两种模式:文本直接生成,或者上传图片让AI"看画面写配乐"。
后者是Lyria 3的新功能。给一张雨夜霓虹的街景,AI输出氛围电子;换一张草原日落,可能变成弦乐铺底。这个链路把视觉-听觉的通感自动化了,做短视频配乐的人应该能省不少找歌时间。
Google没有公开技术细节,但从输出规格看,Lyria 3 Pro的音质已经逼近商业发行门槛。水印系统SynthID是强制嵌入的,改采样率、加混响、甚至重新编码都抹不掉——这是Google应对版权争议的标配动作。
音乐人的态度,比技术更值得看
![]()
Lyria 3不是突然冒出来的。Google从2023年开始就和唱片公司、制作人、词曲作者密集开会,核心议题只有一个:怎么让AI不砸人饭碗。
目前的妥协方案是"附加性"定位——AI负责草稿和灵感,人做最终决策。Google产品负责人曾在闭门交流中表示,「我们测试过完全自动化的工作流,结果音乐人普遍反馈'少了点什么'。」
这个"什么"很难量化。可能是微分音的呼吸感,可能是副歌前那半拍的故意迟疑。Lyria 3的Pro版本保留了这些"瑕疵"的控制权,开发者可以关闭某些"修正",让输出更野生。
多语言支持是另一个隐蔽的战场。Lyria 3能生成英语、西班牙语、中文等语种的演唱,但非英语语料的训练质量直接决定"像不像人"。Google没有公布各语种的表现差异,但从行业惯例看,小语种可能是短板。
水印和溯源,是信任的基础设施
每段Lyria 3生成的音频都嵌有SynthID水印。这个系统2023年就在图像领域上线,音频版原理类似:把人耳不可闻的标识信号织进波形,任何修改都会留下指纹。
对平台方来说,这是过滤AI内容的工具;对诚实使用者来说,这是自证清白的凭证。Google把水印作为默认开启项,没有给关闭选项——这个设计本身就在表态。
但水印解决不了所有问题。如果音乐人用Lyria 3生成草稿,再找人重录、重新编曲,最终作品的"AI含量"怎么算?版权归属怎么定?这些灰色地带,Google选择留给行业慢慢吵。
Lyria 3的定价策略也还没公布。参考Google其他AI产品的路线,预览期可能免费或低价,正式商用后按token或时长计费。对独立开发者来说,成本会不会比买罐头音乐更划算,还得算账。
一个值得注意的细节:Google把Lyria 3和Gemini API绑在一起卖,而不是单独拆成音乐垂直服务。这个打包策略暗示,多模态融合才是长期方向——文本、图像、音频的生成能力最终会打通。
现在回到那个老问题:当AI能写出结构完整、人声自然的歌曲,音乐人还有什么不可替代?Lyria 3的预览文档里埋了一句产品团队的观察——「测试期间,专业用户最常见的反馈不是'再像一点',而是'能不能更奇怪一点'。」
这个需求,AI能接得住吗?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.