金融界2025年5月23日消息,国家知识产权局信息显示,谷歌有限责任公司申请一项名为“基于评估的说话者改变检测评估指标”的专利,公开号CN120035859A,申请日期为2023年10月。
专利摘要显示,一种方法(600)包括:获得多话语训练样本(410),该多话语训练样本包括表征由两个或更多个不同说话者(10)说出的话语的音频数据(412);以及获得指示音频数据中在两个或更多个不同说话者间发生说话者改变的时间区间的真实值说话者改变区间(414)。该方法还包括使用序列转导模型(300)来处理音频数据以生成所预测的说话者改变词元(302)序列。针对每个对应的所预测的说话者改变词元,该方法包括:当所预测的说话者改变词元与真实值说话者改变区间中的一个重叠时,将对应的所预测的说话者改变词元标记为正确。该方法还包括基于被标记为正确的所预测的说话者改变词元的数量和所预测的说话者改变词元的总数来确定序列转导模型的准确率指标(442)。
本文源自:金融界
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.