不依赖真实语音堆料也能在低资源语言合成上超越现有最强模型,这是入选 ICML 2026 的 SE-Bridge-TTS 交出的答案。该工作以合成数据扩展与偏好对齐为核心,完全绕开了传统对大规模真声采集的路径依赖,仅利用极少量的真实语音标注即可完成自举训练。在泰语、老挝语等长期缺乏高质量语音数据的语种上,SE‑Bridge‑TTS 一举刷新多项客观与主观评测指标,实现对先前 SOTA 的全面超越。研究团队同步释出了泰语、老挝语预训练权重以及专门的评估基准,为整个低资源语音合成社区补上了关键的基础设施缺口。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.