金融界2025年3月22日消息,国家知识产权局信息显示,大众问问(北京)信息科技有限公司申请一项名为“语音分离方法、模型、计算机设备和存储介质”的专利,公开号 CN 119649825 A,申请日期为 2023 年 9 月。
专利摘要显示,本申请涉及一种语音分离方法、模型、计算机设备和存储介质。该方法包括:获取多通道音频采样数据;将多通道音频采样数据输入编码器进行编码处理,得到与多通道音频采样数据对应的二维时频表达数据;将二维时频表达数据输入图卷积神经网络以进行空间特征提取,得到与二维时频表达数据对应的空间特征数据;将空间特征数据输入时频掩码网络进行时频掩码处理,得到各说话人声源分别对应的时频掩码数据;将各说话人声源分别对应的时频掩码数据以及空间特征数据输入解码器进行解码处理,得到解码器输出的各说话人声源分别对应的单声源音频数据。采用本方法能够提高语音分离的效果。
天眼查资料显示,大众问问(北京)信息科技有限公司,成立于2017年,位于北京市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本8000万美元,实缴资本8000万美元。通过天眼查大数据分析,大众问问(北京)信息科技有限公司财产线索方面有商标信息28条,专利信息313条,此外企业还拥有行政许可4个。
本文源自:金融界
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.