7月24日,字节跳动Seed团队发布端到端同声传译模型Seed LiveInterpret 2.0,这是首个延迟和准确率接近人类水平的产品级中英语音同传系统。该模型基于全双工端到端语音生成理解框架,支持中英互译,可实时处理多人语音输入,像人类同传译员一样“边听边说”。其翻译准确率在多人会议场景中超过70%,单人演讲场景中超过80%;翻译延迟低至2-3秒,较传统系统降低超60%。此外,该模型还支持零样本声音复刻,能用说话人的音色特质实时“说出”外语,提升交流的自然度。Seed LiveInterpret 2.0技术报告已公布,基于火山引擎对外开放,Ola Friend耳机也将在8月底接入该模型。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.