金融界2025年4月26日消息,国家知识产权局信息显示,中电信人工智能科技(北京)有限公司申请一项名为“语音信息的生成方法、装置、存储介质和电子设备”的专利,公开号CN119864017A,申请日期为2024年12月。
专利摘要显示,本申请公开了一种语音信息的生成方法、装置、存储介质和电子设备,涉及人工智能、语音合成技术领域。其中,该方法包括:获取待处理文本;将待处理文本分割为多个字符,且将多个字符与语音提示信息进行拼接,得到初始输入序列;按照滑动窗口的目标窗口和目标步长,将初始输入序列分割为多个子输入序列;将多个子输入序列和与语音提示信息对应的音色信息输入至语音合成模型,且利用语音合成模型将多个子输入序列和音色信息,生成与待处理文本对应的语音信息,其中,语音合成模型为基于文本样本、语音提示信息样本,以及语音提示信息样本对应的音色信息样本训练得到。本申请解决了生成语音信息的效果差的技术问题。
天眼查资料显示,中电信人工智能科技(北京)有限公司,成立于2023年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本300000万人民币。通过天眼查大数据分析,中电信人工智能科技(北京)有限公司参与招投标项目319次,专利信息277条,此外企业还拥有行政许可1个。
本文源自:金融界
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.