以往的文字转语音TTS工具,基本都无法实现真人富有情感的配音效果,出来的声音总是带有一股AI味儿,给人一种硬邦邦的感觉。
而Azure语音服务TTS,微软出品的一种语音服务功能,可将文本转换为逼真的语音。是目前公认的最好用的文字转语音工具。注意,没有之一。
近期Azure更是新增了9种超真实的AI语音,已经接近真人播报能力,效果非常惊艳!
无论您是创建基于语音的聊天机器人、语音助手还是对话代理,这些新声音都将确保您的交互更加真实、逼真和引人入胜。
与为通用目的设计的语音相比,在阅读会话和休闲文本时,会话优化的语音听起来更自然、更有吸引力。
此外,它们甚至还包括笑声和充满停顿等感叹词,为您的虚拟对话增添人情味。
我们先来试听下中文版本用于对话、博客的场景:
【对话】zh-CN-Xiaoxiao多语言神经网络 (女性),全云在线,22秒
【播客】zh-CN-Xiaoxiao多语言神经网络 (女性),全云在线,19秒
更多 GA 声音示例
声音
场景
脚本+音频
en-US-Ava多语言Neural(女):明亮、迷人的女声,音色优美
对话
是的,被纳入 Microsoft 创业计划是一项巨大的成就。该计划对初创公司必须满足特定要求才能获得资格,因此被接受意味着您的初创公司满足这些要求并因其潜力而得到认可。再次恭喜!1,全云在线,18秒
带有感叹词的对话
嗯,我不知道今晚穿什么去参加聚会。我想要看起来漂亮,但我也想要舒服。也许我会穿我的新衣服和高跟鞋。哦不,但是如果我的脚在一段时间后开始疼痛怎么办?也许我应该带一双平底鞋以防万一。2,全云在线,16秒
冥想
在宁静中寻找安慰,感受脚下大地的能量。每次吸气,汲取力量和稳定性;每次呼气时,释放不再为你服务的东西。你脚踏实地、集中、平和。3,全云在线,18秒
在一项突破性的开发中,一个国际科学家团队成功部署了一个支持珊瑚生长的人工鱼礁结构,为濒临灭绝的海洋生物带来了新的希望。4,全云在线,15秒
生命花园里,每一朵玫瑰都有黎明,花瓣散落在我们所画的道路上。在阳光的强烈照耀下,荆棘可能会刺痛,然而,在困境中,花朵依然傲然挺立。5,全云在线,15秒
en-US-AndrewMultilingualNeural(男):温暖、迷人的男声,听起来像是您想认识的人。
对话
Winnebago Industries 是一家制造房车、旅行拖车和其他休闲车的公司。其股票代码为 WGO,在纽约证券交易所 (NYSE) 交易。我希望这有帮助!如果您还有其他问题,请告诉我。6,全云在线,17秒
带有感叹词的对话
哇,这听起来很神奇!我一直想看北极光。嗯,想象一下那些鲜艳的色彩在北极的天空中舞动。是的,它在我的愿望清单上!7,全云在线,12秒
带着 Wanderlust 背包,您的终极旅行伴侣,尽情享受旅程。我们的背包专为现代游牧者设计,采用人体工学设计、内置太阳能充电器和 GPS 跟踪器,让您的冒险之旅顺利进行。无论您漫游到哪里,Wanderlust 都能轻松承载您的世界。8,全云在线,18秒
除了不断扩充的逼真AI语音库,微软Azure还提供超过400种神经网络文本转语音功能,覆盖140多种语言,功能非常强大,企业再也不需要辛苦找寻和测试其他的配音工具啦!
逼真的人声配音,非常适合应用到小说推文,儿童绘本、有声书朗读等等场景,接下来详细给球员培养分享Azure详细操作指南。手把手教大家如何申请Microsoft Azure账号,部署Speech Studio,让大家能免费体验这些顶尖的AI语音模型。
01企业申请Azure AI语音服务、免费试用
企业如何获取Azure AI语音服务?
目前企业需要通过微软官方合作伙伴获取服务。
通过微软官方合作伙伴获取服务,可以合规、稳定地使用Azure AI 语音服务,满足国内发票需求,同时也能解决连接不稳定/响应速度慢/并发配额低等问题。
作为微软的合作伙伴,全云在线可为企业开通绿色申请通道!包括Azure AI 语音服务、企业版Azure OpenAI 最新版本GPT-4o、Dalle-3,只要企业有需求,全云在线都能协助快速开通!
微软Azure AI语音服务免费试用申请:
https://azureopenai.cloudallonline.com/?zxwwy86
微软官方认证企业账号
无需梯子、不会遭受封号风险!
享有企业级SLA保障!
无需境外信用卡、合规开具增值税发票!
02Azure AI语音服务部署流程
首先,我们需要进入Microsoft Azure官网,然后点击“免费试用文本转语音”。
注意,对个人用户来说,需要绑定国际信用卡,且通常转语音两三次之后就不能再免费用了。
第一步,注册步骤:
进入Microsoft Azure页面后,点击绿色按钮“免费试用文本转语音”,新用户可以获得12个月的免费服务,到期后,仍可获得每月50万字符的免费额度。
Microsoft Azure注册地址:
https://azure.microsoft.com/zh-cn/products/ai-services/text-to-speech
注册需要填写个人信息,同时还得绑定信用卡。
首先使用自己的微软账号登录或者使用邮箱免费注册一个新的账号。
如果你说,"我没有信用卡怎么办?”这一步如果你嫌麻烦的话,可以直接在某鱼,或者某宝上解决也是可以的。或者直接去申请跨境visa卡。
先把那个“其他电话号码”打个勾,然后在地区一栏,然后选择中国。
接下来,就是把自己的手机号码填进去,等待验证码。
完成个人信息填报之后,轻点下一步,就能进入信用卡验证环节了。
这里信用卡只是走个流程,不会从你的卡里扣钱的。但是,确保卡里至少有1美元,这样才能顺利通过验证。
成功验证后就打开了通往Azure的大门,点击“转到Azure门户”,访问Azure控制台。
这就是成功验证后的情景。
接下来,我们进入第二步骤:启动语音服务。
首先,找到左上角的菜单栏,展开它,你会看到一堆服务列表。
只需要找到语音服务就行。
这就是我们接下来要部署的重点。
定价层这块,试用直接选择那个“Free F0”。
弄完这些,再点一下“审阅并创建”,就大功告成了。
这就是搞定界面的全过程。
然后创建起来
别急,稍等一会语音服务就会呈现在你面前了。
唤醒你的声音
按下这个按钮,你就可以开始从文字转到语音了,输入你需要转成播报的文字。
在Speech Studio里,你能找到各种各样的语音服务,除了“文字转语音”,还有“语音转文本”、“语音转字幕”等等,这些都是现成的,拿来就能用。
所以,如果你有语音处理的需求,不妨试试Speech Studio,这里可能有你想要的一切,能满足企业的各种需求,让你的工作变得更加轻松。
找到那个神秘的"文本转语音服务"的宝藏库
声音模型全览
在这个神奇的地方,你可以一览无余地使用全球各地的声音模型。
逼真的合成语音
启用与人类语音的语调和情感匹配的流畅、自然发音的文本转语音。
可自定义文本讲述者语音
创建反映品牌标识的唯一 AI 语音生成器。
精细文本转语音音频控制
通过轻松地调整语速、音调、发音和停顿等,为你的方案优化语音输出。
灵活部署
在任何地方(在云中、本地或容器边缘)运行文本转语音。
而且,每当微软Azure上有新的语音模型出炉,这里都会第一时间为你更新,让你始终保持在AI语音模型的最前沿。
这些声音模型,可不仅仅是简单的“说话”那么简单。它们每一个都配备了各种各样的对话场景和情绪,就像一个会演戏的演员,能在不同的场合,展现出不同的情绪。
而且,它们还能说各种各样的方言,无论你是想听到家乡的方言,还是想体验一下外地的口音,这里都能满足你。
微软的Speech Studio可以说是目前市面上最全的AI语音库了。
最后一步,试听体验:真人声音的逼真模拟
就这样,我们的试听之旅开始了。
点击进行试听,不得不说,这些声音已经和真人的声音如此接近,简直让人难以分辨。
挑选好了你心仪的声音模型,然后点击那个“转到有声内容创作”按钮。
接下来,就是把你想要转化为语音的文本内容粘贴到文本框里,按下播放按钮,你的文字就会被魔法般地转化为语音,就像是被赋予了生命一样。
而在右侧的操作栏,你可以设置语言、声音模型、说话风格,甚至是气口停顿等等功能,就像是一个声音的调色板,你可以在这里调整出你想要的声音效果,非常的全面和强大。
点“保存”,再点“导出”,一个崭新的文本变声术就大功告成啦!
简单几步,轻松搞定,你的语音文件,就这样诞生啦!
通过微软官方合作伙伴获取服务,可以合规、稳定地使用Azure AI 语音服务,满足国内发票需求,同时也能解决连接不稳定/响应速度慢/并发配额低等问题。
作为微软的合作伙伴,全云在线可为企业开通绿色申请通道!包括Azure AI 语音服务、企业版Azure OpenAI 最新版本GPT-4o、Dalle-3,只要企业有需求,全云在线都能协助快速开通!
- 微软Azure AI语音服务免费试用申请:
- https://azureopenai.cloudallonline.com/?zxwwy86
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.