关注CAIE,国内头部AI人才认证、培训体系,助你在职场升职加薪。
今天凌晨,谷歌重磅发布音乐模型 Lyria 3,并且直接集成在 Gemini 里,未来几天全球用户全员开放,这回是真·人均音乐人了。
Lyria 3这次最狠的地方在于,不只是能理解文字,你甩一张照片或者一段视频过去,就能给你整出一首 30秒的配乐。音乐的多模态理解力,真的太惊艳了。
![]()
用过之前Lyria系列模型的能明显感觉到,这次的Lyria 3在音频生成上直接拉满了,核心就三个大升级,每一个都踩在创作者的需求上。
首先是不用自己绞尽脑汁写歌词了,模型会顺着你的提示自动编出适配的歌词,彻底告别词穷的烦恼。
创作的掌控感变高了,不管是音乐风格还是人声、节奏这些细节,都能按照自己的想法调,想做温柔的慢歌还是炸场的快节奏都可以。
最后就是做出来的曲子质感更棒了,不仅听着更真实,编曲的复杂度也上去了,不再是那种单薄的简单旋律,整体的音乐性提升特别多。
Lyria 3生成的玩法也更多了:第一种是文字生成音乐,你只要把自己想要的感觉说清楚就行。
比如具体的音乐流派、当下的心情,甚至是一段专属的小回忆、小玩笑,模型都能接住,做出来的曲子要么带歌词要么纯器乐,完全贴合你想要的心境。
你想给妈妈做首歌,怀念小时候一起的时光,指定做成欢快的非洲节拍曲风,模型都能精准还原这份心意。
第二种玩法更高效,可以用图片或者视频直接生成音乐。你把素材传上去,Gemini 会先读懂内容的氛围,再顺着这个感觉作曲写歌词,相当于给你的画面量身打造专属BGM。
比如你传了狗狗在林间徒步的照片,模型就能围绕这个场景做出一首温馨的小曲子,氛围感直接拉满。
并且生成的 30 秒音乐片段,还会自动配一张专属封面图,这是由 Nano Banana 模型做的,不用自己额外费心设计。
如果你是YT创作者,这个技术其实并不陌生。Dream Track功能里早就用上了类似的技术,现在Lyria 3进驻YT。
意味着做Shorts 短视频的时候,配乐的质量和定制化程度又上了一个台阶,再也不用担心版权问题或者找不到合适的背景音乐了。
谷歌这次还考虑到了AI内容的识别问题,给Lyria 3生成的音乐都加了专属的隐形水印 SynthID,这是谷歌自己研发的技术,专门用来标记自家AI生成的内容,肉眼听感都察觉不到,但能精准溯源。
并且Gemini的验证功能也升级了,之前只能识别图像和视频的AI内容,现在音频也能查了,你只要把音频文件传上去,问一句是不是谷歌AI做的。
模型就会先检测里面的SynthID水印,再结合自己的推理给出答案,不管是自己验证还是分辨别人的内容,都特别方便。
关于版权和原创性,大家肯定很关心。其实从 2023 年第一款 Lyria 模型出来,谷歌就一直在和音乐行业的各方合作,踏踏实实做技术研发,不是瞎搞的那种。
中间还做了音乐人工智能沙盒这类实验项目,攒了不少经验,这次训练 Lyria 3,更是把版权规定和合作协议抠得很细,一点都不马虎。
这个模型的核心是鼓励原创,不是让大家去模仿现有的歌手艺人。就算你在提示里提到了某个特定的艺术家,模型也只会把这个名字当成创作灵感,做出来的曲子只会在风格或者情绪上相近,不会照搬人家的作品。
同时谷歌还加了过滤机制,会把生成的内容和现有的音乐作品做比对,避免出现雷同的情况。
目前这个功能已经开始向部分用户开放了,支持的语言不少,英语、德语、法语等。桌面端现在就能用,手机端随后几天也会跟上。如果你是付费订阅用户,还能享受更高的生成额度。
![]()
对于这个重磅新模型,网友表示,这样一来,创作者就不用再使用素材网站上那些被用滥了的免版税音乐,而是能为视频配上专属定制的背景音乐。背景音乐对视频的整体氛围影响太大了!
![]()
真的很开心看到AI能这样突破创意的边界!那些能把文字、图片等想法直接转化成音乐的工具,彻底改变了创作者尝试和迭代的方式。谷歌AI带来的这些成果,真的太令人兴奋了。
照片转音乐提示功能太棒了,光是这一点就开启了许多创意工作流程。![]()
这是生成式音频技术的一次惊人飞跃。音质已经非常出色,但如果能实现原生3分钟音频生成,那将真正彻底改变音频制作流程。期待扩展上下文窗口。
![]()
想转型AI,不被时代淘汰
CAIE注册人工智能工程师认证
岗位能力 × AI工具 ×转型方向 × 场景落地 = 新AI职业价值
扫码免费领取《AI工程师入门学习指南》
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.