3月6日,声网正式发布全球首个对话式AI引擎。不仅实现了650ms 超低延时响应,还实现了随时打断,以及全模型适配。价格方面更是达到了0.098元/分钟,1分钟不到1毛钱。
声网AI RTE产品线负责人姚光华表示,"经过一段时间与客户的打磨及实际使用场景调研,我们统计出,用户与AI 每产生1次对话中,平均会有约3轮问答,计算下来平均对话时长约为21.1s,单次成本仅需3分钱。如果每月对话次数15次,那么月成本不到5毛钱,年成本也只需5元。"
据介绍,声网对话式AI引擎支持包含 DeepSeek、ChatGPT等在内的全球几乎所有大模型厂商。同时也支持全球主流语音合成供应商任意切换,支持开发者通过语音合成供应商定制的自定义音色接入。更有音视频SDK支持30000+终端机型适配,可兼容多种设备。
响应速度层面,通过全链路深度优化,并在中、美、欧、东南亚主要城市实测,语音对话延迟中位数低至650ms,基本实现“秒回”。还支持随时打断,实现模拟真人对话的节奏。
同时,对话体验层面,“选择性注意力锁定”功能下,可屏蔽95%环境人声、噪声干扰,精准识别对话人声。还具备抗弱网、抗丢包能力,据介绍,在80%丢包率下,仍能稳定流畅对话,断网3-5s依旧流畅对话。
此外, 声网对话式AI引擎的部署也并不复杂。官方表示,只需2行代码,15分钟就能让AI开口说话。
据介绍,通过声网对话式AI引擎,开发者可以快速部署智能助手、虚拟陪伴、口语陪练、智能客服、智能硬件等对话式AI场景。(袁宁)
