金融界2025年8月1日消息,国家知识产权局信息显示,深圳市腾讯计算机系统有限公司;香港科技大学(广州)申请一项名为“提示语音姿态生成方法、相关装置和介质”的专利,公开号CN120409484A,申请日期为2024年01月。
专利摘要显示,本公开提供了一种提示语音姿态生成方法、相关装置和介质。该方法包括:获取目标输入,目标输入包括目标文本与目标语音中的至少一个;将目标输入加入引导语输入大语言模型,得到描述目标提示语音姿态的姿态描述;生成姿态描述对应的姿态描述引导向量;利用姿态描述引导向量对扩散模型进行引导,使扩散模型生成目标提示语音姿态向量;基于目标提示语音姿态向量,生成目标提示语音姿态。本公开实施例能够提高生成提示语音姿态的准确性和精细度。本公开实施例可应用于线上教育、线上交流、视频处理等各种场景。
本文源自:金融界
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.