10月28日消息,近日,豆包语音团队发布了“AI多人有声剧”自动化方案,该方案支持从小说文本到高质量多人有声剧成品的全自动生产,无需人工参与。
据了解,该方案基于多角色智能朗读技术,能够自动划分角色,准确率超过98%。通过语音大模型对文本和语音的多模态预训练,系统具备较强的文本理解与语音演绎能力,使演播效果更自然、情感更丰富。
![]()
方案还实现了全自动AI后期处理,包括自动添加音乐、音效、特效,并进行智能混音。画本预测模型可根据小说文本生成带音效、环境音等元素的画本信息,再通过音频召回与合成技术动态调整参数,最终输出成品。
据悉,该方案能显著提升听书的自然度与沉浸感,同时降低制作成本、缩短周期。目前,首批作品已在番茄小说APP上线,未来计划覆盖更多有声内容,实现小说更新与有声剧同步。(袁宁)
本文来自网易科技报道,更多资讯和深度内容,关注我们。
