网易首页 > 网易号 > 正文 申请入驻

语言学 | 促进口译的人机协同

0
分享至

近百年来,信息与通信技术赋能口译不断取得突破。20世纪20年代,基于有线语音传输技术能够实现译员边听边译的同声传译系统问世,颠覆了传统口译工作模式。20世纪60—70年代,计算机与互联网的出现重塑了口译中的语言与知识资源获取模式,开启了计算机辅助口译时代。20世纪80年代至21世纪初,随着机器翻译的复苏与发展,机器口译逐步成为研发热点,但多用于预订排程与出行信息服务等对话口译场景。近年来,大数据、人工智能等领域蓬勃发展,语音识别、自然语言处理等技术突飞猛进,加上神经网络机器翻译的颠覆性突破,极大提升了机器口译能力,机器口译是否会替代人工口译成为值得关注的问题。剖析、对比人工与机器口译过程、能力、质量及效果差异,梳理各自优势与不足,展望人工及机器口译未来,显得尤为必要。

加工过程对比

机器口译指以计算机系统对源语进行实时自动化语音翻译,包含语音识别、机器翻译、语音合成三个模块,分别由经过语料训练和机器学习的源语声学模型、源语语言模型与源语边界模型,机器翻译模型与译语语言模型,语音合成模型完成。由于机器口译各模型依赖自然话语与人工翻译语料的训练和学习,因此机器口译本质上是基于有限语境、情境的既有有限、固定用法或译法,实现源语识别、语言转换与译语输出。人工口译则是基于人类智力,并综合利用知识、经验、场景、语境,调用各种认知资源进行源语听辨理解、信息存储(记忆、记录)、语言转换和译语发布的动态认知过程。

人工与机器口译在加工对象、加工层次、加工路径与机制、策略运用等方面存在根本差异。一是加工对象。机器加工源语语音以及识别后的文本;译员加工源语语音(含各类韵律信息),书面或电子参考资料与讲稿、PPT、视频材料,演讲人表情、手势、体态等各类视、听觉信息,以及场景、情境信息等。二是加工层次。机器语音识别时高度依赖语音,翻译时高度依赖文本语言结构,基本为自下而上的语言形式与语义浅层加工,难以进行语用加工。译员将源语语言驱动的自下而上加工和知识驱动的自上而下加工相结合,进行语义、语用等多层次、深度加工。三是加工路径与机制。口译过程涉及纵向加工与横向加工两种路径。纵向加工时,源语理解和译语转换各为独立单语加工体系/过程,源语经音、词、句、语义与语用分析至概念表征,经由概念中介后再进行译语转换。横向加工时,源语理解与译语转换属双语加工体系/过程,两者同时发生,不经概念中介,而是通过共享双语表征寻求横向词汇、分句对应。机器依赖静态语料训练,翻译时加工路径单一,采用双语词汇、分句对应式横向转码加工,如音译、逐词对译、记忆配对。译员既能进行横向转码,又能调用各种认知资源进行经由概念中介的纵向脱壳(脱离源语语言形式)理解和表达,进行命题化、命题重构等操作。四是策略运用。机器基于训练语料和模型进行程序化操作,基本不具备策略运用能力。译员能够视源语特征、语境情境等因素灵活运用各类策略,如内容策略:省译、增译、释译;语言策略:拆分、融合、开放结构;发布策略:等待、占位、韵律运用;综合策略:预测、显化、软化等。

核心能力对比

口译核心能力包括三块:信息加工能力(Message Processing),语言资源丰富度、可用度与灵活度(Associative Flu-ency),表达伶俐度(Verbal Fluency)。三大能力分别对应口译过程的三个方面:源语听辨、双语转换、译语发布;也分别对应口译质量的三个维度:内容准确与完整,语言正确、地道、明晰、高效,发布清晰、流畅、韵律可用。此外,口译能力还包括信息存储能力、沟通能力、策略运用能力、快速学习能力、抗压能力等。下面则是译员和机器二者在口译能力上的具体优势与不足。

译员认知资源丰富,理解深入且容错(模糊)性高,表达高效多样且可用性高;善用策略;具备承担复合翻译任务(同传+交传、陪同翻译等)能力;具备人际沟通能力、身份立场和情感温度等。然而,译员使用成本较高;长期记忆(术语等资源)与短期/工作记忆(信息密度高或认知精力不足时)容量及可用性有限;生理与心理、源语变量与场景因素、工作时长与负荷等制约翻译表现。

机器口译的综合成本低;具备巨量存储能力,学习效率更高;加工速度更快,且完全自动化,不受生理、心理因素制约,一般也不受工作时长、负荷等因素影响,表现更稳定。同时,机器口译也存在以下不足:难以加工语音韵律信息及源语外的多模态信息;语音识别高度依赖语音本身,对音质、发音标准性/典型性等异常敏感,容错(模糊)性低,同音字词识别困难;受限于训练语料,对新术语、专有名词、低频词、复杂结构、口语化表达等的识别和翻译存在困难;翻译以转码为主,语用信息、情感信息、隐喻表达等加工能力不足;语音合成或字幕展示缺少凸显信息的自然韵律,译语可用性不足;译语多样性不足;临场策略能力不足;难以承担复合翻译任务,无法与发言人、听众等进行现场沟通。

质量与效果对比

口译质量评估一般涉及三个层次:语际层(源语与译语对比)、语内层(译语声音、语言及逻辑等)和工具层(译语可理解性及可用性)。语际层评估又称忠实性评估,属产品视角评估,评估译语与源语内容/意思的一致性(译语准确性和完整性)。语内层和工具层评估属交际视角评估,关注译语表达和发布的正确性及对口译用户(或听众)的可用性。影响口译质量的因素包括源语变量、场景变量、语对因素、方向性及译员因素等。源语因素影响较大,其可进一步细分为:口音、发音、韵律等发布音韵因素,语速、信息密度等发布时间因素,表达规范性、明晰度、结构复杂度等语言因素,专业性等内容因素。

笔者通过初步实证研究发现:对发布音韵,机器极为敏感,译员较为敏感;对语言(正式程度、规范性、明晰度、复杂度、灵活度),机器比较敏感,译员较不敏感;对内容(主题知识专业程度等),机器敏感度较低,译员则比较敏感;对发布时间因素(语速、命题信息密度、信息成分密度等),机器敏感度不明显,而译员则极为敏感。

机器口译的主要问题包括:语音或词汇识别错误、句法、语义或语用识别错误、翻译错误(逐字对译)、非流利表达或不规范表达未过滤等,一般为认知能力不足所致。从效果看,用户会觉得机器的语音合成译语尚不够自然、流畅,难以通过恰当韵律凸显、传达信息,影响译语可用性;而字幕展示译语时,观众边阅读翻译,边看演讲人或PPT也存在一定困难。而译员的问题既表现为认知能力不足,也表现为认知精力不足,主要包括数字、专有名词、文化负载词、术语加工困难,句子理解困难与转换困难等。在以听译同步、时间受限为特征的同声传译中,译员精力不足造成漏译、错译等问题更为常见。

人机协同前景展望

前述对比分析表明,人工与机器存在较大互补合作空间,口译的人机协同(机助人译、人助机译)尤为可期。

在机助人译方面,机器可凭借自动化和大存储优势,通过源语实时语音转写与/或翻译提示,重点在以下场景支持人工口译:典型口音外语;语速较快、信息成分(数字、术语、专有名词等)密度较高;译语固定/稳定、适用转码的时政、行业、技术类话语较多;读稿致辞、演讲;非常用语对口译。此外,机器口译可以助力人工译前知识、语言、术语准备与译中语言转换。

在人助机译方面,学术与行业技术会议、典礼仪式、推介发布会等场景,可以机译为主,人工利用现场多模态信息加工、高容错性、语用理解及临场策略优势等,在机器口译过程中提供必要的降噪、修正、调节等干预措施,如编辑/预加工机转结果,消除语音解码、语块切分与标点预测错误,纠正双语转换中的逻辑、语用和跨文化交际错误,动态调节译语内容和形式等。除职业实践外,机器口译的实时转写、翻译等功能,还可用于口译课堂教学、模拟会议口译、学生自学等环节,赋能教师点评、反馈学员表现。

未来的机器口译研究,应以模拟人工口译优势机制与能力为重点,以多场景人机协同应用为目标,从单一源语语音加工转向多模态信息加工,从语言加工转向语用信息加工,从语音识别与机器翻译为重点转向学习模拟人工认知过程和能力,从简单场景和单一工作方式应用转向可定制复杂场景与复合工作方式应用,从理论模型建构转向满足市场真实多元交际需求。具体而言,应加强以下研究:突破目前三个任务分离模式,实现端到端实时语音翻译;多模态信息加工;即兴口语的高容错(模糊)性理解;理解与转换中的语用信息加工;高质量、多特征训练语料库研制;大规模、市场化人机同传应用对比;多场景人机协同路径和机制探索与人机协同模式构建。

(本文系国家社科基金重点项目“基于大型语料库的汉英同声传译信息加工路径与机制研究”(22AYY005)阶段性成果)

(作者系北京外国语大学高级翻译学院副教授、口译教育与实践研究中心主任)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
发生关系时,男人用手抚摸这4个部位,证明爱你如命

发生关系时,男人用手抚摸这4个部位,证明爱你如命

闻心品阁
2024-04-24 21:11:44
易中天:流氓的五大特征

易中天:流氓的五大特征

尚曦读史
2024-04-03 08:58:55
揪心!广西南宁一初中女孩被欺凌脱光衣服!现在的女孩都那么坏吗

揪心!广西南宁一初中女孩被欺凌脱光衣服!现在的女孩都那么坏吗

王小乖
2024-04-29 20:44:24
佘诗曼弟弟送别亡父!亲手撒骨灰,父母离异曾对爸爸再娶曾有恨意

佘诗曼弟弟送别亡父!亲手撒骨灰,父母离异曾对爸爸再娶曾有恨意

娱乐圈酸柠檬
2024-04-29 20:44:38
华为又惹火上身?问界m7碰撞造成三人伤亡后续:鸿蒙智行备受质疑

华为又惹火上身?问界m7碰撞造成三人伤亡后续:鸿蒙智行备受质疑

户外小阿隋
2024-04-28 20:42:31
广州高速出城第一波高峰将于明天出现!12处路段易拥堵缓行

广州高速出城第一波高峰将于明天出现!12处路段易拥堵缓行

南方都市报
2024-04-29 18:20:19
欧文:没时间互相安慰了 若东契奇身体不佳他会选择休息的

欧文:没时间互相安慰了 若东契奇身体不佳他会选择休息的

直播吧
2024-04-29 16:59:17
瓜帅:埃德森情况看起来不太妙 阿森纳估计全胜收官了

瓜帅:埃德森情况看起来不太妙 阿森纳估计全胜收官了

直播吧
2024-04-29 11:28:21
关于问界M7起火事故-需要批判的不是事故,而是过度的宣传夸大

关于问界M7起火事故-需要批判的不是事故,而是过度的宣传夸大

户外小阿隋
2024-04-28 14:43:47
特斯拉在华运营FSD,没有悬念!主要问题在成本

特斯拉在华运营FSD,没有悬念!主要问题在成本

不看车bukanche
2024-04-28 20:05:53
闹大了!新冠疫苗之父杨晓明被抓 ,科兴暴雷,网友:头发都掉没了

闹大了!新冠疫苗之父杨晓明被抓 ,科兴暴雷,网友:头发都掉没了

小怪吃美食
2024-04-29 13:31:01
中国最大的工程将在新疆亮相,耗资4万亿,被称“第二长河”

中国最大的工程将在新疆亮相,耗资4万亿,被称“第二长河”

古装影视解说阿凶
2024-04-29 22:04:09
那天晚上,洗完澡后,我没有穿内衣,直接上了床上

那天晚上,洗完澡后,我没有穿内衣,直接上了床上

罗卜说娱乐吖
2024-04-21 23:08:25
男子冰球锦标赛:中国队7-1大胜西班牙取得两连胜

男子冰球锦标赛:中国队7-1大胜西班牙取得两连胜

懂球帝
2024-04-29 17:10:27
外资大买,A股突破3100,牛市来了?别做梦!关键隐患还未解决

外资大买,A股突破3100,牛市来了?别做梦!关键隐患还未解决

老道闲聊
2024-04-29 13:29:02
中法免签,大量法国游客涌入我国,看似旅游却不去任何景区,为啥

中法免签,大量法国游客涌入我国,看似旅游却不去任何景区,为啥

清欢渡语
2024-04-12 14:39:43
红牛,突然封杀所有电商!

红牛,突然封杀所有电商!

一品扫地僧
2024-04-27 23:05:40
中国花滑冠军夫妻现状:赵宏博白发苍苍,45岁申雪保养很好像少女

中国花滑冠军夫妻现状:赵宏博白发苍苍,45岁申雪保养很好像少女

娱乐的小灶
2024-04-29 19:49:20
事实证明,坚持“丁克”25年的康辉,如今也走上了一条“不归路”

事实证明,坚持“丁克”25年的康辉,如今也走上了一条“不归路”

小兔子爱旅游
2024-04-24 18:02:57
我和老伴退休金共1万8,自驾游3年风风光光,如今却后悔不已

我和老伴退休金共1万8,自驾游3年风风光光,如今却后悔不已

萧黎观历史
2024-04-22 17:59:28
2024-04-30 02:48:49
积学储宝
积学储宝
观点集萃
1698文章数 480关注度
往期回顾 全部

科技要闻

马斯克收获大礼,李彦宏梅开二度?

头条要闻

周鸿祎近10天里热搜不断 背后是360市值蒸发4000多亿

头条要闻

周鸿祎近10天里热搜不断 背后是360市值蒸发4000多亿

体育要闻

足球童话!执教16年,从业余联赛到德甲

娱乐要闻

田馥甄遭抵制,蔡依林却能稳稳捞金?

财经要闻

建信人寿巨亏40亿 部分产品退保率93%

汽车要闻

配置更丰富 静态体验2024款欧拉好猫

态度原创

时尚
教育
旅游
艺术
公开课

学会这一招,0成本get上镜脸

教育要闻

四川高中数学题,方法如果得当,做起来轻松

旅游要闻

入境游热度持续攀升 “畅游中国”更便捷

艺术要闻

共度北京108小时 北京当代2024“凝聚”全球36座城市100余家艺术机构

公开课

父亲年龄越大孩子越不聪明?

无障碍浏览 进入关怀版