金融界2025年5月12日消息,国家知识产权局信息显示,浙江大学软件学院(宁波)管理中心(宁波软件教育中心);宁波明物智能科技有限公司申请一项名为“一种基于文本、语音和表情动作的多模态情感识别算法”的专利,公开号 CN119961634A,申请日期为2024年11月。
专利摘要显示,本发明涉及人工智能、情感计算领域,提出了一种一种基于文本、语音和表情动作的多模态情感识别算法。首先,设计了一种浅层特征提取网络(Sfen)和并行卷积模块(Pconv)提取语音和文本中的情感特征,在表情动作模态中,将提取面部表情和手部动作的序列特征与双向三层含有注意力机制的LSTM模型相结合;其次,为强化模态间的关联性,设计了一种用于优化语音和文本特征融合的交叉注意力模块;最后,提出一种多性能指标下的模态融合方案,整合不同模态的情感识别结果,实现高精度的情感识别。该系统旨在通过融合音频、文本和表情动作等多模态信息,提高情感识别的准确性。
本文源自:金融界
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.