国家知识产权局信息显示,深圳市大数据研究院;中国移动香港有限公司申请一项名为“基于因果对齐的语音与场景声联合生成方法及系统”的专利,公开号CN121483219A,申请日期为2025年11月。
专利摘要显示,本发明公开了基于因果对齐的语音与场景声联合生成方法及系统,其方法包括:获取多模态输入信息;对多模态输入信息进行双流自回归处理,生成语音特征序列和场景声特征序列,语音特征序列中各语音特征单元由发声特征信息、语音内容信息及历史语音特征单元协同确定;场景声特征序列中各场景声特征单元由所有已生成的语音特征单元、场景描述信息及历史场景声特征单元协同确定,以实现因果对齐;对语音特征序列和场景声特征序列进行时序融合处理,生成混合音频特征序列;将混合音频特征序列映射为语音波形序列,得到混合音频。本申请通过双流解耦、独立控制与因果对齐,实现语音与场景声动态协同生成,提升真实沉浸感,且情感细腻、成本低、响应快。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.