#机器翻译 #人工翻译 #专利出海 #专利翻译 #知识产权翻译
人类译者与AI的协作将成为未来专利翻译的主流模式。AI时代,高质量翻译需求对译者技能要求更高,而参考性翻译需求则可通过AI工具轻松满足。尽管AI工具提高了效率,但在高质量翻译方面仍无法替代人类译者。
![]()
引言
专利翻译对于保护全球知识产权至关重要。准确的翻译是在当地获得专利保护的基础,也是侵权判定的重要依据。由于专利文件包含大量专业术语和技术细节,翻译必须准确无误,同时还要考虑法律、文化差异及语言结构的转换。这对翻译者提出了专业背景、法律知识和技术敏感度的高要求。
随着人工智能(AI)技术的快速发展,AI工具正深入渗透到各个行业,专利翻译领域也不例外。在本文中,我们将探讨AI技术,特别是神经机器翻译(NMT)工具和大型语言模型(LLM),如何影响专利翻译的工作模式和市场,以及企业和从业人员应如何积极应对和适应这种变革。
一、AI翻译工具概述
AI技术并非一个全新的概念,它在科技领域已经存在多年。然而,由于算力和数据技术的限制,早期应用AI技术的产品往往无法达到人们对"人工智能"的期望,有时甚至被戏称为"人工智障"。在翻译领域,AI的应用可以追溯到机器翻译的早期探索,其历史源远流长。
1、早期的机器翻译(MT)技术
早期的机器翻译技术,主要依托于规则和统计方法。从20世纪50年代的基于规则的机器翻译(Rule-Based Machine Translation, RBMT)起始,到90年代开始广泛采用的基于统计的机器翻译(Statistical Machine Translation, SMT),这些技术在实际应用中并未达到普遍的满意度。由于翻译质量不尽如人意,它们甚至遭到了专业翻译人员的抵制。同时,翻译服务的客户们也普遍对翻译服务提供商使用机器翻译持保留态度。
2、神经机器翻译(Neural Machine Translation, NMT)技术
MT技术的转折点出现在2017年,谷歌推出了具有划时代意义的Transformer模型,这一创新显著提升了机器翻译的质量,并以一种令人瞩目的方式将MT技术重新带入了公众视野。自此,机器翻译领域逐渐全面采用NMT技术来训练翻译模型,开启了机器翻译的新时代。
随着深度学习、神经网络以及自然语言处理技术的突破性发展,基于这些先进技术的机器翻译模型如同雨后春笋般涌现,并迅速占据了市场的主导地位。众多知名企业纷纷推出了各具特色的机器翻译工具,这些工具在翻译领域展现出独特的优势。尽管一些工具因为翻译质量不稳定而受到批评,但它们在处理日常用语翻译方面已经取得了显著的进步,有效解决了大多数常见问题,为用户提供了实际的便利。
部分专业翻译人员开始逐渐接受机器翻译作为日常工作中的底稿或参考。翻译服务的客户们也开始转变态度,期待能利用机器翻译来节约时间、降低成本。这表明机器翻译技术不仅在技术上取得了突破,更在实际应用中赢得了市场和专业人士的认可。
3、大型语言模型(Large Language Model, LLM)
2022年11月,OpenAI推出ChatGPT,引发了一场新的AI技术革新。人们在赞叹LLM展现出的高度智能化的同时,也对其未来的发展和潜在影响抱有种种担忧和疑虑。尽管目前市场上的LLM并非专门针对翻译任务进行训练,但它们在翻译领域所展现出的能力确实令人瞩目。
目前,越来越多的用户尝试将LLM应用于通用文本的翻译任务,包括新闻文章、社交媒体内容和百科全书条目等。其强大的上下文理解能力使其在处理多种语言转换时表现出色,这几乎让人们考虑是否仍然需要人类译者的参与。另外据悉,在法律、医疗等专业领域,通过微调专门数据集,LLM模型也能够更好地理解和处理专业术语和复杂句子结构,进一步提升了其翻译能力。
总体来看,相比早期的MT技术,NMT工具和LLM的应用能够显著提高翻译工作的效率。AI技术在翻译领域展现出巨大的潜力,同时也提示翻译从业者去发掘AI工具的更多功能,以便更有效地利用这些工具来提升工作效率。
二、NMT在专利翻译领域的优势和局限性
在人工智能的浪潮中,专利翻译领域也经历了创新性的变革。尽管通用的NMT模型在多个领域取得了显著成果,但在专利翻译这一特定领域,它们却难以满足所需的高标准。专利文献的翻译面临多重挑战,例如技术内容的复杂性、法律术语的严谨性以及句法结构的复杂性等等,这些都要求机器翻译工具具备比日常场景更为专业的“能力”。
为了应对这些挑战,“优选字符”等专业的专利机器翻译工具应运而生,将NMT技术专门应用于专利翻译这一垂直领域,专注于提供更精准的专利及相关文献的机器翻译服务,以满足该领域对翻译质量的特定要求。通过这种专业化的解决方案,专利机器翻译的质量得到了显著提升,为专利领域的专业人士提供了强有力的支持。一些对翻译精度要求不高的“参考性”的翻译需求开始逐渐被机器翻译替代,同时越来越多从事专利领域翻译工作的人员开始学习并习惯使用机器翻译作为翻译底稿,工作模式从“翻译”转换到“机翻后编辑”(MTPE)。
1、NMT在专利翻译中的优势
(1)译文流畅性好
与早期的MT技术相比,NMT模仿人类的语言模式,译文明显更加自然流畅,语法错误和译文不通顺的情况远远少于早期MT工具的翻译结果。
(2)句内上下文“理解”
NMT能够更好地“理解”句子内部的上下文,提供更准确的翻译和句子内部的术语一致性。
(3)可定制性和持续学习
NMT支持定制训练,可以使用专利语料进行训练私有模型,以满足专利翻译的特定需求,提高翻译的准确性和规范性;并且可以通过持续学习不断优化,随着训练数据的优化和增加,翻译质量能够逐步提高。
(4)自动化潜力
NMT可以集成到自动化工作流程中,提高整体办案效率;并且可以接入计算机辅助翻译(CAT)系统,实现NMT+CAT结合的工作模式,发挥二者优势提升高质量翻译的效率。
2、NMT在专利翻译中的局限性
(1)训练语料的局限性
NMT模型的性能在很大程度上依赖于训练语料。训练语料通常是彼此对应的原文和译文句对。如果训练语料不够丰富全面,那么NMT在处理未被覆盖到的领域和场景时,很可能无法提供正确的翻译。
(2)术语准确性问题
专利文献中使用大量专业术语,有时即使是文字相同的术语,在不同的上下文中也可能表达不同的含义。NMT模型可能不能准确识别和翻译这些术语,难以确保翻译的专业性和准确性。
(3)术语和表达一致性问题
在专利文献的翻译过程中,确保相同术语或表达在全文中的翻译一致性至关重要。这种一致性不仅有助于维护专利文献的严谨性,而且对于理解和解释专利内容也极为关键。然而,由于NMT模型倾向于以句子为单元进行翻译,缺乏全局上下文的整体把握,NMT工具在处理这一问题时普遍难以实现术语的全文一致性翻译。这已经成为NMT工具在专利领域应用的最大挑战。
(4)错误传播问题
训练语料中的错误有可能被NMT模型学习并体现在生成的译文中,影响翻译的准确性。
(5)受限于原文质量
使用高质量的专业语料训练的NMT模型通常需要原文(即待翻译的文本)有较高的质量,原文中的错误、逻辑模糊等问题容易被将错就错地“复现”在机翻译文中;专利语言中的复杂文法结构NMT可能难以准确处理。
三、LLM在专利翻译领域的优势和局限性
目前LLM在专利翻译领域的应用仍然处于探索阶段,我们团队也对LLM抱有很高的期待,非常希望LLM能够突破NMT的局限性,在专利翻译方面提供更好的支持。在对国内外一些LLM进行测试后,我们对LLM在专利翻译领域的优势和局限性有了一些初步的认识。
1、LLM在专利翻译中的优势
(1)更准确的翻译
与NMT模型相比,LLM通常具有更大的模型规模和更丰富的训练数据,这使得它们能够更深入地理解专利语言的语义,从而提供更准确的翻译。
(2)复杂句式处理
专利文本包含许多复杂的技术句式和结构,相比NMT模型,LLM能够更好地解析和翻译这些复杂结构。
(3)长文本处理
相比于NMT在翻译时侧重于单个句子内部逻辑,LLM在处理跨越较长文本的上下文信息方面表现出色,因此能够更好地匹配专利文件中语言的连贯性、逻辑性和术语一致性要求。
(4)错误纠正能力
LLM的机翻译文比NMT模型的结果更为流畅丝滑,同时也比NMT展现出更优越的错误修正能力。它们经常能够识别和修正原文中的错误,提供的正确译文,而非像NMT那样“将错就错”地进行翻译。
(5)交互式翻译
LLM支持交互式翻译模式,例如,能够根据用户的反馈实时调整翻译结果,这是绝大部分NMT模型不具备的功能。
2、LLM在专利翻译中的局限性
(1)成本高
即便使用开源模型,不考虑研发LLM所需的专业人才和资源,LLM的训练和运行也需要使用价格昂贵的硬件资源,耗费大量电力,并且要求大量的高质量数据。除此之外,模型的维护和部署也对人员、硬件和网络资源有较高的要求。这些因素使得训练私有LLM的难度和成本较高,特别是对于资源有限的小型企业或个人而言。
(2)隐私和数据安全风险
私有LLM成本较高,这使得大部分用户不得不使用在线LLM。即使采用开源模型训练私有LLM并部署在私有服务器,也无法完全避免数据泄露的风险。而专利及专利相关文件很可能涉及权利人尚未公开的重要信息,使用LLM处理这些信息存在泄密风险,可能造成权利人的巨额经济损失。
(3)处理资源限制
LLM需要大量的计算资源来处理复杂的翻译任务,目前在线LLM普遍对用户开放的资源有限。因此在使用在线LLM进行专利翻译等工作时,模型单次能够有效处理的字数有限(通常为数百至两千字左右),难以满足专利翻译的实际需求。
(4)“创新性表达”
虽然这点通常被宣传为LLM的优点和进步,然而对于专利领域的翻译而言,这有另外一种解释——不忠实于原文。与NMT模型相比,LLM执行翻译任务时对原文的容错更高,但是增译、漏译非常多,译文质量不够稳定;同时LLM译文的“二创”问题严重,有时甚至会出现译文与原文意思相反的情况,严重违背专利翻译的要求。即使在提示词中明确给出“不允许增译、漏译”、“必须依照原文翻译”等翻译质量要求,这些问题仍然无法完全避免。
(5)法律法规因素
同样由于其“创新性表达”能力强,LLM还有可能“编造”法律法规条款以及案例等,因此不适宜进行法律法规相关的翻译;另外使用LLM进行专利这类法律文件的翻译,翻译结果也可能不符合当地的法律语言要求或习惯。
(6)术语和表达一致性问题
与NMT模型相比,LLM在术语一致性方面有更好的表现,但是仍然存在不一致的情况;此外对特定表达的翻译也不一定能够按提示词要求进行一致化处理。
(7)错误传播问题
由于其强大的上下文捕捉能力,LLM在翻译过程中产生的错误可能会在后续的翻译中被不断放大,使得译文越来越偏离原文。
四、AI工具对专利翻译影响
在探讨了NMT和LLM在专利翻译领域的各自优势和局限性之后,我们很自然地会开启一个近年来备受关注的话题:这些先进的AI工具是否能够取代人类专利翻译工作者的工作?它们将如何改变未来专利翻译行业的工作方式乃至行业格局?
1、AI应用的积极影响
(1)提高翻译效率
AI工具能够迅速完成机器翻译任务。专业的NMT模型不仅能够迅速执行翻译任务,而且其输出质量已接近初级专业翻译人员的水平,大幅度减少了手动打字的工作量。而功能强大的LLM更进一步,它们不仅支持对专业术语的深入解释,还能够提供总结参考、术语解释和辨析等多样化应用。与传统的搜索和阅读方法相比,LLM显著缩短了翻译过程中所必需的查询和验证时间,从而使得整个翻译流程更加高效、流畅。这使得能够熟练运用NMT和LLM作为辅助工具的翻译人员在处理专利翻译任务时,相较于那些未能有效利用这些先进工具的同行,能够显著提高工作效率,更快地完成同等的工作量,而不降低工作质量。
(2)改善翻译质量
对于用于专利申请提交、复审/无效证据提交等高质量的翻译需求,AI工具正成为人类译者的得力助手。在处理这类翻译精度要求极高的翻译项目过程中,AI的术语解释和辨析功能能够助力人类译者迅速而准确地锁定专业术语的精确含义,确保译文用词的严谨性和准确性。此外,基于AI技术的语言检查工具以及LLM的文本润色功能还能进一步帮助提升译文的整体质量。有能力善用这些AI工具的专利译者可以在它们的帮助下,独立地完成高质量的译文,而无需像传统工作模式中那样,需要翻译、校对、母语审校、核查等各个岗位相互配合才能达到同样的工作质量。
对于对比文件、提交美国IDS、检索结果初筛等“参考性”翻译需求,恰当地运用提示词能够让LLM更加精准地优化机器翻译的输出,从而提升参考性译文的质量。在处理这类对翻译精度要求不高的翻译项目时,可以先使用NMT模型或LLM提供初步的翻译草稿,再由LLM在有一定经验的专利代理师、专利检索师、企业内部专利相关工作人员等的指导下,生成更加贴近原文风格和语境的翻译内容,增强机翻译文的可读性和专业性。
(3)提升语料管理效率
LLM能够帮助迅速识别并提取关键术语,这一过程不仅加速了专业词汇的整理工作,还极大提高了术语库的构建效率。此外,LLM在进行句子对齐方面同样表现出色,相比现有的对齐工具,LLM能够更精确匹配原文与译文,确保语料的对应关系准确无误。这种高效的术语管理和句子对齐功能,为高效构建高质量、高一致性的语料库提供了强有力的支持,为高质高效地完成翻译项目奠定了基础。
同时,LLM为提升语料库管理效率开辟了多种可能性,包括自动化分类与标注、智能搜索与筛选、质量控制、动态更新与管理、语料库优化以及数据可视化等关键功能。这些功能不仅能极大提高管理效率,还会显著增强语料库的应用价值,为翻译工作提供更高效、更智能的辅助。它们值得业界进一步探索和深入应用,以充分发挥LLM在翻译领域的潜力。
(4)提供多语言支持
鉴于专利权的"地域性"特质,专利申请往往需要转换成多种语言,以便在不同国家或地区获得相应的保护。AI工具的恰当使用能够在此过程中发挥作用,简化多语言翻译的工作,让这一过程变得更加高效和便捷。此外,AI工具还能辅助权利人或代理机构高效地协调和管理国际专利事务,从而提升专利申请与维护的整体效率。
(5)优化项目管理
定制化的AI工具可以帮助翻译项目管理更加系统化和自动化,简化任务分配、进度跟踪、质量控制、资源库管理等工作。通过减少重复性和繁琐的工作,AI工具可以使翻译管理工作更加高效,减轻翻译管理方面的工作量。
(6)节约人员成本
在不考虑开发和维护成本的前提下,应用AI工具对翻译流程管理进行优化,能够降低对部分人力资源的依赖;同时,AI工具的有效辅助能够显著提升翻译的质量和效率,进而增加每位翻译人员的个人产出。这些因素共同作用,将会实现翻译人员成本的整体降低,从而提升企业在市场上的竞争力。
2、AI应用带来的挑战
(1)数据安全需求
随着NMT模型和LLM的广泛应用,专利翻译面临的最直接的挑战是数据安全。确保在翻译过程中对未公开内容进行严密的数据和隐私保护,是专利翻译工作首先需要考虑的关键点。无论是提供专利翻译服务的企业或个人,都必须制定并恪守严格的保密措施,以保障权利人的数据安全。例如,我们的翻译团队在处理未公开的文件时,会严格控制AI工具的使用范围,不允许将原文内容输入到外部在线AI工具中处理。
(2)工作模式变革
人类译者与AI的协作必然成为未来专利翻译工作的主流模式。目前,大部分专利及相关文件的翻译都是通过计算机辅助翻译(CAT)的模式完成,一些则采用在CAT软件之外进行机翻后编辑(MTPE)的模式。当然,也有一些翻译人员和企业坚持纯手工翻译。我们团队主要采用将NMT与CAT工具结合的MTPE模式,并在工作过程中使用LLM进行辅助。这种方式的好处是,既能获得专利专用NMT模型的优质机翻底稿,利用LLM的强大功能,又能充分发挥CAT工具的专业功能。我们也期待将LLM工具集成到CAT工具中,实现翻译工作模式的进一步升级,同时希望通过AI技术的加持使专利翻译的工作流程变得更智能、更高效。这些变革将推动行业向更高层次的专业化和智能化迈进。无法适应新型工作模式的从业人员或企业,可能面临被边缘化甚至淘汰的风险。
(3)人员能力要求变化
这个问题需要从两个方面讨论。
首先,对于高质量的翻译需求而言,AI工具的普及实际上提升了对翻译人员技能的要求。有效利用AI工具的关键在于翻译人员需要具备迅速准确地评估和验证AI工具产出结果的能力。只有如此,翻译人员才能主导翻译流程,而不是被工具所左右。翻译人员无论是未能纠正机器翻译中的错误,被LLM的答案带偏,还是被AI质检工具的错误指示所误导,都有可能导致翻译质量严重下降。这不仅可能引起客户的不满和指责,还可能涉及到对客户经济损失的赔偿。这对翻译人员是极大的挑战。
以“最基础”的术语一致性要求为例,随着机器翻译越来越广泛地使用,我们已经观察到,近年来在术语和表达一致性这一关键翻译质量指标上的扣分情况呈现上升趋势。这一趋势与NMT难以解决通篇术语和表达一致性的问题密切相关。由于专利文献的篇幅通常较长,一旦机翻译文中存在大量的术语和表达不一致问题,尽管翻译人员在后编辑过程中会尽最大努力进行校对和修改,但要达到100%的一致性仍是一项极具挑战性的工作。
其次,对于仅以获取信息为目的“参考性”翻译需求,AI工具的应用降低了对操作人员的翻译技能要求。以往依赖人工翻译完成的任务,例如审查意见、对比文件以及检索到的现有技术文件等的翻译,现在可以借助优选字符这类专注于专利领域的NMT工具,迅速获得质量接近人工翻译质量的机器翻译结果。如果操作者具备一定的专利基础知识,并能恰当运用LLM对机翻译文进行调整和优化,即便没有专业专利翻译人员的介入,也能满足基本的参考需求,使翻译过程更加高效和便捷。
为了适应这些变化,企业的招聘和培训策略都需要作出相应调整,同时从业者也应及时调整自身的学习和发展方向,以跟上时代发展的步伐。
(4)翻译技术和管理工具的更新
目前,AI工具的应用通常分散在不同的网站,或依赖用户自行进行小规模定制开发。在这种分散化的供应模式下,用户需要四处搜寻合适的工具,不停地在工作界面与各种不同的AI工具之间切换,导致效率提升效果不显著,无法充分发挥其潜力。因此,需要对翻译技术工具进行智能化更新,整合必要的AI功能,以优化机器翻译的输出并辅助人工后编辑。更新后的系统应支持翻译流程的自动化和智能化,涵盖任务分配、术语提取、机器翻译、辅助后编辑以及质量检查等多个环节。这种技术革新不仅能提高翻译效率,还能确保翻译质量,从而实现专利翻译服务的整体提升。
(5)客户期望和市场格局变化
随着人工智能翻译技术的飞速发展,客户对专利翻译服务的需求也在不断变化。他们从早期坚决拒绝应用机翻,到逐渐谨慎接触,再到尝试寻找优秀的机翻工具来满足“参考性”翻译需求。以往需要由人类译者完成的“参考性”翻译任务,现在可以通过优选字符等专用于专利领域的AI翻译工具来完成。随着AI工具的广泛应用,专利翻译市场的竞争格局也在发生变化。那些能够有效整合和应用AI技术的翻译服务提供者在竞争中可能占据更有利的地位。
综上所述,NMT模型、LLM等AI工具在专利翻译领域能够提供强大的辅助作用,有助于提升效率和降低成本。对于“参考性”翻译需求,利用AI工具在很大程度上能够满足。然而,对于高质量的翻译需求,AI工具尚无法充分满足,无法完全替代人类译者。人类译者的专业知识、灵活性和对复杂语境的理解是当前AI工具难以模拟的。因此,AI工具与人类译者之间的协作将是未来发展的趋势——这也是我们团队目前采用并持续完善的工作模式。
结语
AI技术正在推动专利翻译行业经历一场深刻的变革。作为翻译服务提供者,我们应采取积极态度,通过持续学习适应新技术的发展,同时提升专业技能,尤其是在特定领域的专业知识和语言能力,以弥补AI在处理复杂语境和专业术语方面的不足。我们可以通过调整工作模式,将翻译系统与智能化辅助工具结合,使用NMT和LLM工具与人类译者相配合,以提升高质量翻译的效率。只有不断适应和利用新技术,优化工作模式,提升人员能力,我们才能持续满足客户和市场的期望,在AI时代中保持竞争力。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.