当地时间1月14日,据大模型评测榜单Artificial Analysis Speech Reasoning最新结果,中国大模型企业阶跃星辰的原生音频推理模型Step-Audio-R1.1登顶,超越Grok、Gemini、GPT-Realtime等。
该榜单是目前业界评估“原生语音模型”最权威的第三方基准之一,核心考量模型直接处理音频并进行复杂逻辑推理的能力,考察维度包括准确率、首包延迟等。
![]()
去年11月,阶跃星辰发布了Step-Audio-R1,可以在不增加额外时延的情况下,端到端理解语音内容。此次发布的Step-Audio-R1.1是R1的升级版,基于推理能力,R1.1不仅能准确识别声音,还可以捕捉到声音背后的情绪和心理状态、言外之意,并能基于环境音推导对物理世界的理解。
目前,阶跃星辰已开源该模型,chat模式也已搭载该模型核心,完整的实时语音API预计将于 2 月上线。(澎湃新闻记者 秦盛)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.