网易首页 > 网易号 > 正文 申请入驻

小说一键转有声剧!豆包语音团队「AI多人有声剧」,沉浸感拉满了

0
分享至



机器之心发布

机器之心编辑部

「东州市第一监狱,犯人屠国安被狱警带到了招待室。
门一开,他看到有人背对着他,对方短发,身形纤瘦,姿态挺拔,在他的记忆里,并没有这样的熟人。」

这段文字源自一本知名的刑侦小说《遮云》,而下面这段音频是对应章节的「有声」版本,先听听:



在音频最开始的一分钟里,我们就听到了人物对白和旁白解说,脚步、开门、坐下、手铐晃动和递名片的声音,背景音乐等多种元素。相比于单纯地阅读文字,听书的沉浸感确实强了不少。

如果说,这段声情并茂的朗读音频都是由 AI 生成的呢?很多读者可能会感到惊讶:「不知不觉,AI 讲书的水准已经进化到这个地步了?」

是的,这段「AI 讲书」背后的配音和后期,来自豆包语音团队近日发布的「AI 多人有声剧」自动化方案。该方案不仅支持多角色、高表现力的 TTS 演播,同时也实现了全自动 AI 后期的链路。

也就是说,从小说文本到高质量的多人有声剧成品,全部由 AI 端到端完成。这意味着,基于该方案的有声书生产制作成本和周期大幅降低。目前,首批由该方案端到端创作的有声剧已经在番茄小说 App 上线。

具体而言,这套方案基于新升级的多角色 Seed-TTS-2.0 模型,配合 AI 自动音乐、音效、特效和智能混音,在听感效果上已经能够媲美行业一流水准的真人有声剧。

当然,开篇的 Demo 只是该方案的众多成果之一,让我们再欣赏一些高光片段:



把小说变成多人有声剧,总共分几步?

小说作品通常具有充满戏剧性的情节和极具感染力的台词,而将这些小说的文字内容转化为有声剧,同样受到了很多读者的欢迎。

传统多人有声剧的制作周期较长,一般会持续数月。立项后需要先经过人工切分画本并校准,设计配音角色表,并完成十几甚至几十个声优录制。随后,后期人员会精修音频,并在此基础上进行音效、音乐和混音处理,完成母带制作,最终输出为专业的有声剧成品。

而豆包语音团队提出的这套新方案,使得有声书生产的制作成本和周期大幅降低。方案首先利用端到端多角色语音模型合成 TTS 音轨,基于音频和后期画本预测模型,进一步生成带后期的有声剧。后期音效包含特效、音乐、音效、环境音,通过智能混音技术平衡音轨,最终生产出完整的成品多人有声剧。



AI 一键生成多人有声剧,如何媲美「真人配音 + 后期」?

在「多角色演播」和「AI 后期」等流程中,豆包语音团队的「AI 多人有声剧」自动化方案做到了高水准生成。

首先是「多角色演播」的效果升级。这套方案支持从「小说文本」到「多角色智能朗读音频」的全自动生产,音色匹配和对话归属准确率超过 98%。

在多人演播效果上,多角色 Seed-TTS-2.0 模型通过对海量文本与语音的多模态预训练,原生地将文本和语音模态融合,凭借强大的文本理解能力和语音演绎能力,进一步提升了对小说的角色、情感、副语言等细腻的演绎效果。这种演绎效果的升级,源自于几个创新点:

  • 篇章级长上下文感知,进一步增加模型对上下文的感知范围,对角色的理解更加到位;
  • 历史长音频建模,模拟真实小说录制场景,可感知所有上文音频信息,各角色语音承接力、表现力进一步加强;
  • 多轮思维链 (CoT) 推理,引入思维链信息,强化对当前角色、人设、情感、副语言的理解,打造更加细腻的演绎效果,带来沉浸式的听书体验。



当模型的上下文感知能力更深刻,所呈现的「人物情感」也就更精准了:

满身是血的李子夜双臂强行撑起,说道:“趁他还不能动。”



再比如,小说文本中的「副语言」演绎效果有了显著的提升:

“咯咯咯!我现在告诉你一个好消息。”



此外,该方案创新地实现了「全自动 AI 后期」

我们知道,画本对有声书的制作非常重要,传统人工方案需要根据剧本中的人物特点,在文本上标记强调词、停顿点、角色转换提示等,帮助配音者在演播过程中准确无误地传达信息。而「AI 多人有声剧」方案能高效地实现从小说文本到带有音效、人声特效、环境音、配乐的画本预测。



其中,「人声特效预测」能够结合说话人信息,预测是否添加特效以及特效内容,准确度接近 100%;动作音效预测基于 AED(音频事件检测)技术构建动作音效体系,在篇章级别的预测中避免剧情撞车的问题,实现时间轴精准对齐;环境识别预测能够在环境渲染可实现智能的淡入淡出,丰富后期效果的同时,保持情节和情绪的稳定性,完美适配 TTS 时长;在配乐设计层面,方案包含的小说智能配乐系统,能够为不同题材匹配最佳 BGM, 配乐与剧情情绪同步、章节收尾自然,可以很好地烘托剧情氛围。

方案包含智能动态混音策略,做到了整体听感的自然统一与音质清晰度的最优平衡。在智能动态平衡与响度控制上,方案能够实时分析人声轨的能量与响度,使用侧链压缩技术通过人声自适应压低 BGM 与环境音,让对白始终清晰突出,并通过内容感知的动态范围与响度标准化处理,确保成品在不同设备上始终保持一致、自然、专业的听感。



据了解,「AI 多人有声剧」自动化方案未来将持续升级,覆盖更多精品内容,为更多用户带来优质的听书体验。

文中音频链接:https://mp.weixin.qq.com/s/g1A_U9R6oqxhL1t6tIz0BA

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
重估吉利,不能再等了

重估吉利,不能再等了

市值Observation
2025-11-14 16:44:25
小海绵和杨颖现身上海!杨颖打扮朴素,小海绵长高了也长胖了!

小海绵和杨颖现身上海!杨颖打扮朴素,小海绵长高了也长胖了!

乐悠悠娱乐
2025-11-16 11:33:26
中国共产党中央军事委员会副主席张升民简历

中国共产党中央军事委员会副主席张升民简历

上观新闻
2025-10-23 18:17:07
2025年,5国被踢出发达国家行列,分别都是谁?

2025年,5国被踢出发达国家行列,分别都是谁?

泠泠说史
2025-10-12 17:40:53
二次战役后,志愿军打扫战场,遍地“洋落”,捡回了多少呢?

二次战役后,志愿军打扫战场,遍地“洋落”,捡回了多少呢?

鹤羽说个事
2025-11-15 11:40:07
一个败家子毁全家,57岁李克勤被曝为小舅子还债多年,苦不堪言

一个败家子毁全家,57岁李克勤被曝为小舅子还债多年,苦不堪言

冷紫葉
2025-11-14 20:00:23
如果日本同中国爆发战争,日本将被毁灭

如果日本同中国爆发战争,日本将被毁灭

观察者网
2025-11-16 09:09:19
高市早苗做最坏打算,可她没想到:解放军没出手,最强帮手就来了

高市早苗做最坏打算,可她没想到:解放军没出手,最强帮手就来了

靓仔情感
2025-11-15 12:22:11
张伟丽升重挑战UFC蝇量级冠军失败,张伟丽回应不敌舍甫琴科:没能赢下比赛非常抱歉,我已经尽力了

张伟丽升重挑战UFC蝇量级冠军失败,张伟丽回应不敌舍甫琴科:没能赢下比赛非常抱歉,我已经尽力了

极目新闻
2025-11-16 13:37:28
“战时大老虎”,被查前离境出走了

“战时大老虎”,被查前离境出走了

中国新闻周刊
2025-11-16 09:20:27
心理学上有一个词:雷尼尔效应(让一个人爱你且精神上舍不得离开你,只需记住雷尼尔效应)

心理学上有一个词:雷尼尔效应(让一个人爱你且精神上舍不得离开你,只需记住雷尼尔效应)

壹心理
2025-11-11 11:03:50
多地关店!曾火爆无锡

多地关店!曾火爆无锡

江南晚报
2025-11-15 19:36:33
妹子“把胸放桌上休息”被拍走红!女菩萨们不服发照片PK:最后这波赢麻了

妹子“把胸放桌上休息”被拍走红!女菩萨们不服发照片PK:最后这波赢麻了

经典段子
2025-10-11 22:34:42
不顾央视警告顶风作案,与刘涛传出绯闻的杨烁,究竟是谁给的底气

不顾央视警告顶风作案,与刘涛传出绯闻的杨烁,究竟是谁给的底气

芳芳历史烩
2025-09-24 20:13:19
严查非机动车非法改装违法行为!

严查非机动车非法改装违法行为!

上海交警
2025-11-13 16:19:09
幼儿园老师上传“午睡照”到家长群,妈妈发怒斥责:必须给个说法

幼儿园老师上传“午睡照”到家长群,妈妈发怒斥责:必须给个说法

谭老师地理工作室
2025-11-16 10:52:40
刚刚,交易所重拳出击:重点监控!释放什么信号?下周要变天了?

刚刚,交易所重拳出击:重点监控!释放什么信号?下周要变天了?

云鹏叙事
2025-11-16 08:05:02
100万架军机对付中国!南海若交战,结局只有6字,美防长突然下令

100万架军机对付中国!南海若交战,结局只有6字,美防长突然下令

墨兰史书
2025-11-11 19:05:03
莱因克尔:梅西是历史第一人、什么都有!C罗也是个射手!

莱因克尔:梅西是历史第一人、什么都有!C罗也是个射手!

氧气是个地铁
2025-11-15 16:13:53
熊猫杯:0-1,闪电丢球酿苦果,越南不敌中亚劲旅,无缘2连胜

熊猫杯:0-1,闪电丢球酿苦果,越南不敌中亚劲旅,无缘2连胜

凌空倒钩
2025-11-15 21:37:39
2025-11-16 14:44:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
11720文章数 142505关注度
往期回顾 全部

科技要闻

谁在炒作全固态电池?

头条要闻

毛宁援引《中日联合声明》 发英日双语海报提醒日方

头条要闻

毛宁援引《中日联合声明》 发英日双语海报提醒日方

体育要闻

最佳新秀候选!2028美国男篮有他一个位置

娱乐要闻

宋佳二封,易烊千玺拿奖张艺谋乐开花

财经要闻

涉三宗罪 释永信被批准逮捕

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

旅游
数码
手机
艺术
军事航空

旅游要闻

雪后初晴 新疆乌孙山现水墨画卷

数码要闻

首家线下旗舰店深圳开业!徕芬的野心远不只是电动牙刷

手机要闻

小米之家重返法国巴黎,首店开启试营业

艺术要闻

耗资17亿!中国最“丑”建筑?不,这是最硬核的!

军事要闻

解放军报:武力介入台海 日本全国都有沦为战场的风险

无障碍浏览 进入关怀版