国家知识产权局信息显示,中国移动香港有限公司;深圳市大数据研究院申请一项名为“自适应情感语音生成方法及系统”的专利,公开号CN121354602A,申请日期为2025年11月。
专利摘要显示,本申请公开了一种自适应情感语音生成方法及系统,其方法实现,包括:获取目标用户的原始音频波形数据,并提取语音情感特征向量;获取回复文本,并进行语义解析与特征提取,生成文本特征序列;对语音情感特征向量与文本特征序列进行跨模态整合,生成融合条件序列;将融合条件序列作为双约束条件,通过预设可逆生成网络,将采样自先验分布的潜在变量映射生成与双约束条件匹配的梅尔频谱图;将梅尔频谱图转换为合成语音波形,得到与目标用户情感状态相匹配的回复音频数据。本实施例,从目标用户原始音频中提取语音情感特征向量,并与回复文本中提取的文本特征序列整合后作为额外条件,生成符合用户情感预期的回复音频,从而实现端到端的情感自适应。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.