三年前我还在给ElevenLabs按月付费。现在?一个完全免费的本地工具让我彻底换了阵营。
这个叫Voicebox的开源项目,支持Windows、macOS和Linux三平台。最初只是在官网听了几个演示样本,效果让我愣了几秒——必须下载实测。
![]()
安装过程出乎意料地顺。官网下载页点完即走,自动开始下载。安装向导就是常规流程:选文件夹,下一步,完成。启动后有个初始化界面,随后进入主界面。
核心功能是声音克隆。点击"Create Voice"后有三条路:上传本地音频、软件内直接录制、录制系统音频。样本长度上限30秒。
我用Maono PD200X动圈USB麦克风录了一段。录完点"Transcribe"按钮,语音自动转文字填入参考文本栏。接着命名声线、设定性格、选择语言,声纹档案就建好了。
生成环节需要打字输入目标文本、选语言、挑模型、加特效。首次运行会慢一些,因为要下载加载模型。我选了Qwen3-TTS 1.7B版本。
结果出来那一刻,我确实僵住了。之前听过Linus Tech Tips和Fireship的克隆样本,但听到自己的声音被复刻,感受完全不同。官网提供了原始录音和克隆版本的对比,差距小到需要仔细分辨。
Voicebox的野心不止于克隆。深入使用后会发现它埋了更多功能线——这部分留到后面展开。
现在我的ElevenLabs订阅已经停掉。本地运行、零月费、效果能打,这三个条件同时满足的情况,在语音AI领域并不常见。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.