随着人工智能和大数据技术的日渐成熟,我们可以让过去的照片动起来、可以让人工智能模型模仿杜甫作一首诗、可以基于一个主题生成一段视频,也可以让我们有机会听到数字人模仿我们喜欢的歌手唱其他任意歌手的歌。
孙燕姿,新加坡华语流行乐女歌手,曾经的“四小天后”之一,是很多80后、90后的偶像,与周杰伦并称“男周女孙”,在其巅峰期却选择主动隐退。2021年4月27日,某网友在论坛中发文“推荐一个冷门的新加坡华语歌手—— 孙燕姿”,使得“冷门歌手”孙燕姿成了网络热搜话题,而孙燕姿本人也乐于接受这个称呼。在荣获“冷门歌手”这一“殊荣”的同年9月9日晚上,孙燕姿线上歌会1小时获得6亿个点赞,用实力证明了这个歌手不太冷,同时也证明了80后、90后这批粉丝依然在线。而对于00后的人群来说,孙燕姿之所以能够被推荐,也从侧面证明了好的声音、好的音乐,是不会因为代沟而消失的。
孙燕姿的再次火爆,并非孙燕姿本人又发表了新的作品或者频繁的活动,而是因为另一个孙燕姿—— “AI孙燕姿”的出现。
随着人工智能和大数据技术的日渐成熟,我们可以让过去的照片动起来、可以让人工智能模型模仿杜甫作一首诗、可以基于一个主题生成一段视频,也可以让我们有机会听到数字人模仿我们喜欢的歌手唱其他任意歌手的歌——这样,也就诞生了“AI孙燕姿”“AI陶喆”“AI周杰伦”们。而最为火爆的“AI孙燕姿”,其在抖音、哔哩哔哩(以下简称B站)、快手等平台上都是 “顶流”,仅在B站,“AI孙燕姿”演唱的歌曲达到100万播放量以上的歌曲就有11首。
面对“AI孙燕姿”的出现,孙燕姿本人表现得相当佛系,回应道:“凡事皆有可能,凡事皆无所谓,我认为思想纯净、做自己,已然足够。”
但是,孙燕姿本人不在意,并不代表“AI孙燕姿”不存在问题和潜在的风险,粉丝们在享受科技带给我们愉悦与便利的同时,也要注意知识产权、肖像权、隐私权等可能存在的法律问题以及伦理道德问题,更甚者,更要注意可能存在的安全性问题。
“AI 孙燕姿”到底是一个什么样的“人”?
“AI孙燕姿”是一个虚拟数字人,它本质上是基于孙燕姿本人现有的音乐和声音,通过数据处理技术以及人工智能模型等技术,模拟孙燕姿的音色、音质、声线和发音方式、演唱风格等声音特征,生成翻唱歌曲或语音内容的虚拟声音模型,使用这一虚拟声音模型,可以定制“AI孙燕姿”演唱任何歌曲。
“AI孙燕姿”是通过哪些技术实现,或者与哪些技术相关联呢?笔者认为,其主要包括以下技术:
数据集的采集与构建
使用网络爬虫等技术从网络采集大量孙燕姿的音乐作品以及其他音视频文件,提取文件中的音频数据,并对音频数据进行数据清洗、降噪等预处理操作,得到适于模型训练的数据集。
自然语言处理
包括语音识别、文本切分、语义分析、语音合成等技术,语音识别是将孙燕姿的原始音频转换为文本,文本切分是指将连续文本按特定规则分割为更小单元,语义分析是对文本单元进行情感、类别等的语义划分,而语音合成是使用深度学习模型生成类似孙燕姿的声音。
模型的构建及训练
将采集的数据输入到GAN、RNN、Transformer等人工智能模型中进行训练,生成高质量语音。
音频后期处理
对生成的音频进行混响、均衡等处理,使其更接近真实孙燕姿的声音,以达到较高的听觉效果。
科技是一把双刃剑
“AI孙燕姿”的出现拓展了娱乐的边界,但对社会也产生了多方面的影响。
在娱乐产业方面,“AI孙燕姿”展示了人工智能在音乐创作和表演中的巨大潜力,AI技术为人们提供了一个重要的创作途径。许多我们喜欢的歌手已经过世,通过AI手段,我们将有机会欣赏到这些优秀歌手的新作品,歌手之间也可以隔空对唱,给我们带来更加丰富的音乐体验。例如,台湾女歌手陈珊妮的单曲《教我如何做你的爱人》,就是由其本人的AI模型生成。在江苏卫视2022跨年演唱会中,歌手周深和已故歌手邓丽君通过AI技术,跨越时空合唱了《小城故事》《漫步人生路》《大鱼》等脍炙人口的歌曲。
在社会生活方面,“AI孙燕姿”的出现改变了人们对音乐和艺术的认知。虚拟歌手的兴起可能重塑粉丝文化,粉丝可以定制自己的偶像。AI技术使得音乐创作的门槛进一步降低,普通人也可以根据自己对音乐的理解,创作出属于自己的音乐作品。
在技术发展方面,“AI孙燕姿”的成功应用推动了语音合成、自然语言处理和深度学习等技术的发展与进步。这些技术不仅限于音乐领域,还可以应用于如虚拟助手、智能客服和教育辅助、养老陪护等更广泛的场景。
在法律建设方面,目前,我国并未确认AI具有法律的主体资格,因此,AI的制造者以及使用者,需要受到法律的约束。虽然孙燕姿本人并没有追究“AI孙燕姿”的作者是否侵犯了她的权利,但我们需要清醒地认识到孙燕姿的姓名、声音和音乐作品是受法律保护的,即便创作者在作品上附加了“免责声明”,也并不能完全逃避责任。
抖音平台在2023年5月9日发布了《抖音关于人工智能生成内容的平台规范暨行业倡议》,其中提到,创作者、主播、用户、商家、广告主等平台生态参与者,在抖音应用生成式人工智能技术时,发布者应对人工智能生成内容进行显著标识,帮助其他用户区分虚拟与现实,特别是易混淆场景;发布者需对人工智能生成内容产生的相应后果负责,无论内容是如何生成的;虚拟人需在平台进行注册,虚拟人技术使用者需实名认证;禁止利用生成式人工智能技术创作、发布侵权内容,包括但不限于肖像权、知识产权等。一经发现,平台将严格处罚。禁止利用生成式人工智能技术创作、发布违背科学常识、弄虚作假、造谣传谣的内容。一经发现,平台将严格处罚。
此外,AI生成的内容是否享有版权,以及其版权归属问题,也需要法律进一步明晰。2023年4月,杭州互联网法院审结了我国首例涉及虚拟数字人侵权的案件,引发了业界的极大关注,首例虚拟数字人侵权案的判决对于我国相关案件的审理具有重要的判例意义。
在财产安全方面,由于AI技术可以模拟人的声音,不法分子就可能利用这一技术,对未成年人、老年人等防范意识较为薄弱的群体实施诈骗,通过模拟亲人的声音骗取钱财或者实施侵犯,这也是需要特别防范的安全问题。
在伦理道德方面,中国台湾知名艺人包小柏在2021年痛失22岁爱女(包容),丧女之痛促使他攻读博士研究AI技术,以期通过AI技术重现女儿的音容笑貌。在《台湾启示录》节目中,公开了其女“包容”的AI影像,女儿透过荧幕告白爸爸,催人泪下。但另一方面,AI复活技术也引起了人们对AI技术在伦理方面的思考。例如,如果公众可以使用AI技术任意复活逝者,是否违背了公序良俗,对于逝者本人是否尊重、对于逝者亲友的影响也应加以考虑。
音乐人包小柏通过AI复刻出了“数字女儿”,以表达思念。
在专利技术方面,“AI孙燕姿”的实现依赖于多项人工智能和语音处理技术,其背后可能涉及多家科技公司的授权专利。例如谷歌公司的一件授权专利是基于深度神经网络的音乐合成技术,通过直接从数据学习,生成样本级别的声音;Supertone公司的一件授权专利结合迁移学习技术,使用预先训练的人工神经网络模型可以合成新输入歌手的歌唱声音;百度的一件专利通过少量语音样本复刻特定人声音色;以上专利在语音合成与音色克隆方面有较高影响。科大讯飞的一件专利可以通过波形生成模型进行波形学习,可以提高语音合成的音质、音色以及自然度;Antares的一件专利是Auto-Tune技术的核心专利,用于调整音高。华为的一件专利可以通过训练基于BLSTM的深度神经网络模型,生成不同情感类型 情感强度的语音。
以上列举的专利技术涉及了语音合成与音色克隆、音频信号处理、深度学习模型训练、语音内容生成等方面,是否会侵犯到以上权利主体的利益,如何寻求技术与法律的双重合规,也是需要思考的问题。
无意中听到的她的歌,声音非常有特色。查了一下,零几年就出道了,但感觉在国内不是很多人听过。她的歌很棒,曲风多变,最喜欢《遇见》和《绿光》,还有《180度》。 大家去qq音乐、酷狗都可以免费听。
政策需要及时跟进
为了促进AI音乐发展,平衡技术创新、艺术创作保护与社会伦理需求,笔者提出以下建议:
明确法律框架
制定相关法律法规,明确AI音乐的版权归属、使用范围、数据使用权限、利益分配规则等,鼓励人性化执法。
平台监管与惩罚机制
平台成立AI音乐监管机构,负责审核AI音乐生成内容的合规性。对违规账号采取限期整改、罚款、永久封号等措施。
伦理与创作规范
要求AI生成音乐必须标注“AI制作”标签,避免误导听众,对深度伪造音乐实施分级管理,限制传播范围。禁止AI创作的恶意模仿或诋毁性创作(如生成低质量歌曲损害艺术家声誉、传播暴力、歧视性内容、不良价值观等)
鼓励良性竞争
通过权威媒体宣传合法AI音乐,鼓励平台举办“AI+音乐”创新大赛,鼓励技术公司与音乐人联合开发高质量作品。
跨领域融合
寻求AI音乐与影视、教育、医疗、广告等多行业的跨界合作,丰富AI音乐的创新形式。
迎接 AI 音乐的新纪元
“AI孙燕姿”的出现只是科技与音乐融合的一个开始。未来,随着人工智能技术的不断进步,可以预见的是,更多类似的应用将会涌现。例如,AI技术可以用于生成更多类型的音乐作品,与其他艺术形式(如舞蹈、戏剧)结合,创造出全新的艺术作品。此外,AI技术还可以用于音乐教育和治疗,帮助人们更好地理解和享受音乐。随着社会老龄化的加剧,人们也可以将AI技术应用到养老服务,例如可以合成亲人的影音信息与老人互动,为老人提供情绪价值。
AI赋能沉浸式音乐创作场景,探索人机协同艺术未来。图/AI生成
然而,未来,AI音乐在发展的同时也需要在技术开发和应用过程中,加强法律规范、伦理审查和社会讨论,以确保AI技术的健康发展。如何在技术进步和艺术创作之间寻找到平衡,如何保护艺术家的权益和创作的原创性,如何防止AI技术诈骗等,都是需要深入探讨的问题。AI技术的脚步已经无法阻挡,我们应该积极拥抱科技,在法律、伦理和社会共识的共同作用下,AI技术必然能 够为音乐产业和人类社会带来积极的影响。
(文章来源:《创意世界》2025年4月号)
编校:范晓华,审读:郭丽
/ / / / /
/ / / / /
/ /
/ / / / /
/ / / /
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.