![]()
以文本翻译工具著称的翻译公司DeepL,近日正式发布了一套语音到语音的翻译解决方案。该套件覆盖多种使用场景,包括会议翻译、移动端与网页端对话翻译,以及面向一线员工的团队对话翻译(可通过定制化应用接入)。与此同时,DeepL还开放了API接口,允许外部开发者和企业基于其技术构建定制化应用,例如呼叫中心场景。
"在文本翻译领域深耕多年之后,语音翻译对我们来说是顺理成章的下一步,"DeepL首席执行官Jarek Kutylowski在接受TechCrunch采访时表示,"我们在文本翻译和文档翻译方面已经走了很长的路,但我们认为市场上还缺乏一款出色的实时语音翻译产品。"
Kutylowski指出,开发实时翻译产品的核心挑战在于如何在降低延迟(即从用户说话到译文播出之间的时间差)与保证翻译准确性之间取得平衡。
DeepL此次为Zoom、Microsoft Teams等主流平台推出了插件,用户可以在他人以母语发言的同时,实时收听翻译音频,或在屏幕上查看实时翻译字幕。目前该功能处于早期访问阶段,公司正邀请有意向的组织加入候补等待名单。此外,DeepL还推出了适用于移动端和网页端的对话翻译产品,支持面对面或远程交流场景。
针对培训课程、研讨会等团队场景,DeepL还支持多人参与的群组对话功能,参与者可通过扫描二维码加入会话。
DeepL表示,其语音翻译技术还具备自适应学习能力,可识别并记忆自定义词汇,例如特定行业术语、公司名称及人名等。
Kutylowski认为,AI正在重塑未来几年客户服务的形态。他特别指出,翻译层的引入有助于企业为那些合格员工稀缺、招聘成本高昂的语种市场提供支持服务。
DeepL表示,公司掌控着语音到语音翻译的完整技术栈。目前,该系统的工作流程为:将语音转换为文本,完成翻译后再转换回语音。DeepL认为,凭借多年积累的文本翻译经验,其在翻译质量上具有明显优势。未来,公司计划开发端到端的语音翻译模型,彻底跳过文本转换环节,实现真正意义上的直接语音翻译。
在竞争格局方面,DeepL面临多家资金雄厚的创业公司的挑战。专注于实时口音调整的Sanas去年完成了由Quadrille Capital和Teleperformance参与的6500万美元融资,其产品主要面向呼叫中心坐席人员。总部位于迪拜的Camb.AI则专注于面向亚马逊云科技等媒体与娱乐公司的语音合成与翻译服务,帮助客户实现视频内容的大规模配音与本地化。而由Reddit联合创始人Alexis Ohanian旗下Seven Seven Six基金支持的Palabra,正在打造一款能够同时保留语义与说话人原声的实时语音翻译引擎,与DeepL当前的产品方向形成了更为直接的竞争。
Q&A
Q1:DeepL的语音翻译产品支持哪些使用场景?
A:DeepL的语音翻译套件覆盖多种场景,包括Zoom、Microsoft Teams等平台的会议实时翻译、移动端与网页端的对话翻译,以及面向培训和研讨会等场合的群组对话翻译。用户可以实时收听翻译音频,也可以在屏幕上查看翻译字幕。目前会议翻译插件处于早期访问阶段,有需要的组织可申请加入候补名单。
Q2:DeepL语音翻译的底层技术原理是什么?
A:DeepL目前采用的是"语音转文本→翻译→文本转语音"的流水线方式,即先将语音识别为文字,再进行翻译,最后合成译文语音。公司认为凭借多年文本翻译经验,在翻译质量上具备优势。未来DeepL计划开发端到端的语音翻译模型,直接跳过文本转换步骤,进一步降低延迟并提升体验。
Q3:DeepL在语音翻译市场面临哪些竞争对手?
A:DeepL的竞争对手主要包括:专注实时口音调整的Sanas(已完成6500万美元融资)、面向媒体娱乐行业提供配音本地化服务的Camb.AI,以及由知名投资人支持、致力于保留说话人原声的实时翻译引擎初创公司Palabra。这些公司从不同细分方向与DeepL的语音翻译业务形成竞争。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.