金融界2025年7月21日消息,国家知识产权局信息显示,安徽讯飞寰语科技有限公司申请一项名为“语音合成模型的训练、语音合成方法、装置及电子设备”的专利,公开号CN120340455A,申请日期为2025年03月。
专利摘要显示,本发明提供一种语音合成模型的训练、语音合成方法、装置及电子设备,方法包括:基于初始语音合成模型,对音素序列的发音特征与语音离散标记序列的语音特征进行注意力计算,得到发音特征与语音特征之间的相关度,基于相关度,确定当前合成语音的第一期望音素位置,以及当前合成语音的下一合成语音的第二期望音素位置;基于音素位置约束确定目标损失;音素位置约束包括第一期望音素位置和第二期望音素位置之间的前后位置约束和音素位置间隔约束;基于目标损失对初始语音合成模型进行参数迭代,得到语音合成模型。该方法中语音合成训练过程不依赖于语音的时长信息,直接对语音合成模型的注意力模块约束,有效提升语音合成的鲁棒性。
天眼查资料显示,安徽讯飞寰语科技有限公司,成立于2020年,位于合肥市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本2000万人民币。通过天眼查大数据分析,安徽讯飞寰语科技有限公司参与招投标项目4次,专利信息27条,此外企业还拥有行政许可6个。
本文源自:金融界
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.