品玩2月10日讯,据实况网报道,声网与美团、xbench联合发布了AI语音外呼行业的首个评测基准VoiceAgentEval。
其评估语料库完全基于真实的外呼业务数据构建,摒弃传统固定脚本,覆盖六大业务领域的30个子场景。评测采用文本与语音双维度评估体系,不仅考核AI对话的逻辑正确性,也全面评估其在语音交互中的综合表现。
为严格测试AI的任务遵循与通用交互能力,该框架还通过用户模拟器构建了150种虚拟对话场景进行压力测试。据悉,基于这一新标准,目前已初步甄选出在该场景中综合性能排名前三的模型,为行业设立了明确的技术标杆。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.