金融界2025年6月17日消息,国家知识产权局信息显示,北京悦动双成科技有限公司申请一项名为“基于声纹辨别并与多人面对面交流的AI数字人装置及方法”的专利,公开号CN120162601A,申请日期为2025年05月。
专利摘要显示,本申请公开了一种基于声纹辨别并与多人面对面交流的AI数字人装置及方法,通过麦克风阵列接收来自不同方向的声音信号,并通过红外测距传感器精确测量发言者与装置的距离,同时借助微型摄像头进行面部跟踪,确保了每个发言者的位置和眼睛位置能够被精确捕捉。其次,波束成形算法和RNNoise降噪模块的结合,使得装置能够从复杂环境中准确提取目标发言者的声音,并去除背景噪音,提升语音清晰度。通过梅尔频率倒谱系数和ECAPA-TDNN深度学习模型对语音特征的高效提取,系统能够实现高精度的声纹识别,结合哈希表存储方式,快速对比发言者的声纹特征,进一步增强了识别准确性。
天眼查资料显示,北京悦动双成科技有限公司,成立于2011年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本2018万人民币。通过天眼查大数据分析,北京悦动双成科技有限公司共对外投资了1家企业,参与招投标项目17次,财产线索方面有商标信息4条,专利信息7条,此外企业还拥有行政许可5个。
本文源自:金融界
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.