StoryTTS是由上海交通大学构建的一个具有丰富声学和文本表达性的中文文本到语音(TTS)数据集。该数据集包含了61小时的连续且富有韵律的语音,并且配有精确的文字转录和丰富的文本表达性注释。数据源自普通话讲故事节目的录音,通过系统全面的标注框架,研究人员对文本表达性进行了深入分析,定义了五个不同的维度:修辞手法、句子结构、场景、模仿角色和情感色彩,并利用大模型(LLMs)进行批量标注。该数据集对于希望提升TTS系统表达性的研究人员来说是一个宝贵的资源,它有助于推动TTS技术在表达性方面的研究和发展。
详情请参见五号雷达:https://www.5radar.com/result?key=StoryTTS
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.