近日,奇富科技智能语音团队的多模态情感计算研究论文《Qieemo: Multimodal Emotion Recognition Based on the ASR Backbone》被语音领域国际顶会ASRU 2025收录。至此,奇富科技已成功集齐全球语音三大顶会(ICASSP、INTERSPEECH、ASRU)研究成果,成为极少数具备全链路自研语音技术实力的金融科技企业,标志着其正式跻身全球语音技术研发第一梯队。360借条富能计划也因此得以再度被赋能升级,进一步拓展着金融科技生态领域发展的边界。
作为音频理解领域最具影响力的国际会议之一,ASRU每两年举办一次,代表该领域全球最高研究水平。本次入选的论文突破了现有技术范式,从数学建模角度构建了以ASR(自动语音识别)模型为核心骨架的通用特征融合理论框架,系统阐释了预训练ASR编码器多层次特征对下游任务的本质性贡献与作用机制。该框架摒弃了传统“网络层叠加”或“参数微调”思路,从根本上重新定义了语音表征与跨模态应用的底层逻辑,为多模态情感识别及更广泛的语音理解任务奠定了全新理论基础。
基于这一理论突破而研发的Qieemo模型,以广泛可用的预训练ASR模型为基础,创新性地提取文本相关语音后验概率特征与帧级对齐情感特征,通过自研多模态融合模块与跨模态注意力机制,实现ASR多层次特征的高效融合。Qieemo不仅具备优秀的跨任务迁移能力,更在识别准确率上实现重大飞跃——较传统方法提升15%以上,并在已达SOTA水平的单模态方案MSMSER基础上再提升4%,成为情感计算领域名副其实的“SOTA+”新标杆。
而该项技术突破正在全面赋能奇富科技旗下360借条等金融业务场景以及360借条富能计划等服务生态。在智能客服领域,Qieemo使360借条首次具备实时情感感知能力,系统可通过用户语音中的情绪波动动态调整应答策略与服务节奏,显著提升用户满意与信任度。在信贷审核环节,平台结合语音情感特征与文本信息,构建更立体的用户信用画像,提升风险判断精准度,进一步优化资产质量。
此外,Qieemo技术内核已深入360借条富能计划的服务生态。经过赋能发展的360借条富能计划,其内容推荐、个性化产品匹配及高频交互场景中,系统可依据用户实时情感状态调整内容呈现方式与服务动线,实现“有温度”的智能金融陪伴,推动用户关系从工具型交互向情感型连接升级。
与多数依赖开源技术或外部合作的金融科技企业不同,奇富科技坚持在人工智能核心领域开展全链路自主研发。当行业普遍聚焦模型堆叠与组合优化时,奇富选择回归语音信号处理与特征融合的数学本质,从底层原理推动框架原创,从而在技术深度与应用灵活性上建立起长期优势。
奇富科技也在会上表示,完成三大顶会‘大满贯’并不是终点,而是奇富语音技术生态化的起点。Qieemo的推出,标志着奇富科技已奠定了基础性语音理解能力的关键基石。未来,该技术不仅将持续赋能360借条富能计划等金融场景,更可向教育、医疗、娱乐等跨行业智能交互领域输出底层能力。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.