网易首页 > 网易号 > 正文 申请入驻

大语言模型翻译的喜与忧

0
分享至

(来源:光明日报)

转自:光明日报


光明图片/视觉中国


光明图片/视觉中国


光明图片/视觉中国

大语言模型(Large Language Model,LLM)作为人工智能领域的标志性成果,正以前所未有的速度重塑全球翻译生态,甚至从根本上改变着整个翻译行业的业务结构与价值链条。依托其深度的上下文理解与交互式迭代等技术红利,大语言模型翻译正在把传统的“翻译—审校—排版”流水线升级为“人机共创”的知识增值平台,其价值远超翻译本身,成为促进全球沟通、提升生产力和赋能创新的关键基础设施。然而,技术红利背后的隐忧不容忽视。当一本20万字的书籍可被大语言模型在半分钟内“翻译完成”时,我们必须审视这种效率背后的代价。大语言模型本质上是一种基于海量语料训练的复杂概率统计模型,它依赖表层语言形式,却缺乏人类将自然语言与现实世界建立认知联系的深层理解能力。这一局限使其在面对跨文化语境时,常常陷入“形似而神不似”的困境。更为深层的挑战在于,表面“流畅”的翻译输出可能会掩盖文化偏见,成为新时代语言智能治理的重要议题。

核心优势

与传统机器翻译(如早期的统计机器翻译SMT和后来的神经机器翻译NMT)相比,大语言模型翻译的核心优势源于其“以海量数据学习语言规律、以上下文理解语义信息”的底层逻辑,具体表现为:

卓越的理解能力。传统的机器翻译通常只分析单个句子或很短的上下文,经常导致歧义消除错误。例如,“Apple”一词在没有上下文的情况下,无法确定是公司名还是水果。而大语言模型翻译拥有强大的长上下文窗口,能够通过上下文关键词与常识整合精准捕捉文本的逻辑关联、情感倾向与专业背景。此外,大语言模型能更好地处理不符合语法的句子、口语化的表达、行业黑话甚至混合语言的文本(如中英混杂等)。

灵活自然的适应能力。传统机器翻译模型通常只有一种标准输出,难以变换不同风格,而大语言模型用户可以通过领域微调或提示词引导,适配不同场景的专业需求。例如,用户可在指令中添加“请将以下文本翻译成正式的商业信函语气”“请用口语化的、轻松的网络用语翻译这段对话”等。而且,大语言模型可根据用户提供的高质量翻译示例进行学习,并迅速模仿这种模式和风格。这特别适合医疗、商业、法律等专业领域的术语统一和风格定制。

多模态翻译能力。传统机器翻译多拘泥于单一模态,而大语言模型可实现多模态内容的翻译与解读。如涉及图片(如路牌、菜单、海报)翻译时,大语言模型不仅可以翻译文字内容,还能结合图片场景补充信息,帮助用户理解;涉及语音翻译时,大语言模型可实时将语音(如会议发言、电话沟通)转为文本并翻译,同时支持翻译文本转语音,产出符合目标语言语调的自然语音;针对视频翻译,大语言模型可结合视频画面与字幕,灵活调整翻译内容。

交互式迭代能力。传统机器翻译只能实现人工后期编辑或离线重训,而大语言模型拥有强大的交互式迭代能力,用户可直接与模型对话,输入提示词,实现即时重译。这样不仅可以降本增效,还可让知识、文化、信息以前所未有的速度跨越语言壁垒,大幅提升沟通效率。大语言模型还可以一站式处理更复杂的任务,如翻译+摘要、翻译+润色、翻译并提取关键信息等。

基于上述优势,大语言模型翻译的价值日益突出。对个人而言,大语言模型可降低跨语言沟通门槛,帮助个人拓展信息获取边界,获取各种知识,如学习海外在线课程,查阅外文论文和书籍等;对企业而言,大语言模型可助力降本增效,赋能全球化业务,减少企业在文档翻译、字幕制作、客服翻译等场景的人力成本;对社会而言,大语言模型有助于促进跨文化交流,助力本土文化走出去。例如,中国网络文学在大语言模型助力下快速输出至海外阅读平台,2023年海外市场规模突破30亿元。

三重挑战

尽管大语言模型翻译有巨大的优势,但也面临不少深层挑战:第一,语言霸权的数字延伸。目前的国际主流大模型,参数数据集以英文为主,中文数据占比较少。斯坦福大学研究发现,当要求大语言模型处理斯瓦希里语、菲律宾语等低资源语言时,其准确率比处理英语时低30%~50%,且容易生成“非洲村庄=茅草屋”等刻板印象。

第二,文化传播的效能压缩。大语言模型翻译对具有丰富文化内涵的话语处理存在明显短板。相关研究显示,在涉及中国特色社会主义核心概念的翻译测试中,主流大语言模型的准确率不足50%,文化内涵保留率更低。例如,“江南”一次可能会被大语言模型译成South of the River,这种简化处理无法传达出原词所蕴含的深厚历史文化底蕴。

第三,社会伦理的多维挑战。一是知识产权难题,翻译成果的归属权界定不清。二是算法偏见问题,大语言模型可能吸收低质量或虚假训练数据,导致输出带有系统性偏见的内容。例如,当源语言性别不明确时,大语言模型会默认选择性别,如用“他”指代医生,用“她”指代护士。三是数据安全风险,用户输入的敏感信息可能被模型记忆并在后续翻译中泄露。四是信息生态污染,大语言模型生成的低质量翻译内容可能被再次纳入训练数据,形成“误译—学习—再误译”的恶性循环。

语言智能治理体系

面对上述挑战,我们亟须从国家战略高度,构建具有中国特色的语言智能治理体系。

首先,坚持标准引领,建立中国特色的翻译规范体系。国际层面,要积极推动制定更具文化包容性的大语言模型翻译国际标准;建议在联合国教科文组织《人工智能伦理建议书》框架下,提出“人工智能翻译文化多样性保护公约”,确立尊重各国语言文化的国际准则。国内层面,加快制定更为完备的“大语言模型翻译服务国家标准”和“关键概念翻译规范”;成立“国家翻译技术安全评估中心”,建立关键领域翻译系统的准入机制与动态监管体系。

其次,技术赋能,打造中华文化全球传播新引擎。大力支持发展“文化自觉型”大语言模型,增强模型对中华文化的理解能力。例如,开发“文化词汇识别机制”,对“天人合一”“和而不同”“中庸之道”等蕴含中国哲学内涵的概念进行特殊标注;探索“多模态翻译技术”,将文本、图像、音频等多模态结合,立体呈现中华文化元素;推动建设国家级多语言平行语料库,重点支持“一带一路”共建国家语言与中文的平行语料积累,突破低资源语言翻译瓶颈,服务国家战略需求。

最后,生态共建,培育翻译智能化发展新格局。建立“人机协同翻译生态系统”,明确人类译者在翻译中的主导地位,发挥大语言模型在效率提升方面的辅助作用,形成“人类主导、大语言模型辅助、专家把关”的工作流程,特别是在文学作品、历史文献、外交文件等专门领域,保持人类译者的主体性。可成立由语言学家、文化研究专家、技术专家和政策制定者组成的“国家翻译技术伦理委员会”,对大语言模型翻译的文化影响进行常态化评估与指导。要支持高校设立“人工智能翻译伦理”“计算语言学与文化传播”等课程,培养兼具语言文化素养与技术理解能力的复合型人才。加强国际合作,推动成立“全球语言智能治理联盟”,构建多边参与、多方受益的国际合作机制,共同应对大语言模型翻译带来的全球性挑战。

(作者:黄文红、尹静,分别系北京语言大学英语和高级翻译学院副教授,北京语言大学中国语言与标准制定研究所、北京交通大学语言与传播学院教授)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
对日发出最严厉警告后,中国第一记惩罚重拳到来,日方措手不及

对日发出最严厉警告后,中国第一记惩罚重拳到来,日方措手不及

一口娱乐
2025-11-16 02:17:37
日本专家:投降不是因为美国的原子弹,而是因为苏联发的1个公告

日本专家:投降不是因为美国的原子弹,而是因为苏联发的1个公告

寻途
2025-11-12 18:54:46
喧宾夺主!湖人吊打雄鹿队,字母哥独木难支,赶紧换队吧

喧宾夺主!湖人吊打雄鹿队,字母哥独木难支,赶紧换队吧

邹维体育
2025-11-16 10:02:04
刘国梁当选,得票第一

刘国梁当选,得票第一

新京报
2025-11-16 07:57:18
初三女生让座孕妇被讹68万,18年后孕妇女儿高考落榜,校外跪求原谅

初三女生让座孕妇被讹68万,18年后孕妇女儿高考落榜,校外跪求原谅

悬案解密档案
2025-10-21 09:22:26
景甜惊艳亮相,前凸后翘,简约时尚,张继科肠子都悔青?

景甜惊艳亮相,前凸后翘,简约时尚,张继科肠子都悔青?

娱乐领航家
2025-11-15 19:00:03
终究是纸老虎!豪华之师不敌东道主丢金,李梦6中1,郑薇用兵神奇

终究是纸老虎!豪华之师不敌东道主丢金,李梦6中1,郑薇用兵神奇

萌兰聊个球
2025-11-15 21:35:54
周末信息如何影响市场?明天是红色星期一?还是黑色星期一?

周末信息如何影响市场?明天是红色星期一?还是黑色星期一?

春江财富
2025-11-16 09:15:10
郑丽文又有大动作,当着日媒的面、直接说出心里话,绿营瞬间炸锅

郑丽文又有大动作,当着日媒的面、直接说出心里话,绿营瞬间炸锅

南宫一二
2025-11-15 15:45:41
吴石的后人有点意思:明明父亲是烈士,儿子吴韶成在河南格外低调

吴石的后人有点意思:明明父亲是烈士,儿子吴韶成在河南格外低调

小虎新车推荐员
2025-11-14 14:54:30
从确诊到去世仅15天,“央视最帅主持人”的遭遇为人们敲响警钟

从确诊到去世仅15天,“央视最帅主持人”的遭遇为人们敲响警钟

银河史记
2025-11-03 19:31:33
“除了鬼,什么都见过了!”陪读妈妈开始“污名化”,太毁三观!

“除了鬼,什么都见过了!”陪读妈妈开始“污名化”,太毁三观!

知晓科普
2025-11-04 09:48:54
中方直接掀了桌,27国不许用华为,“5G之战爆发”,先拿德国开刀

中方直接掀了桌,27国不许用华为,“5G之战爆发”,先拿德国开刀

趣文说娱
2025-11-15 14:11:13
曼联中场引援首选已定!对巴莱巴兴趣下降,担心其与一人毛病相同

曼联中场引援首选已定!对巴莱巴兴趣下降,担心其与一人毛病相同

罗米的曼联博客
2025-11-16 08:57:53
一夜3大消息!首位主帅下课,杜兰特超越哈登,湖人遭联盟调查

一夜3大消息!首位主帅下课,杜兰特超越哈登,湖人遭联盟调查

体坛小李
2025-11-16 09:05:13
人民日报专访,揭开32岁周深的真实处境,那英确实一个字都没说错

人民日报专访,揭开32岁周深的真实处境,那英确实一个字都没说错

八斗小先生
2025-11-01 08:46:54
大湾区申办奥运?巴赫鼓励称具备一切条件,香港方面:没有不可能

大湾区申办奥运?巴赫鼓励称具备一切条件,香港方面:没有不可能

米修体育
2025-11-15 13:23:39
老板让我帮忙娶他情妇,我帮人帮到底,1年后老板娘一胎,情妇龙凤胎

老板让我帮忙娶他情妇,我帮人帮到底,1年后老板娘一胎,情妇龙凤胎

温情邮局
2025-11-14 10:40:23
8+13+4!正式达成首秀!太阳十号秀点评杨瀚森

8+13+4!正式达成首秀!太阳十号秀点评杨瀚森

篮球实战宝典
2025-11-15 14:14:37
挤爆了!上海迪士尼排队2小时还没进门,“含孩量”飙升,热门项目排队100分钟起

挤爆了!上海迪士尼排队2小时还没进门,“含孩量”飙升,热门项目排队100分钟起

新民晚报
2025-11-15 14:34:28
2025-11-16 11:39:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
1394098文章数 4515关注度
往期回顾 全部

科技要闻

谁在炒作全固态电池?

头条要闻

牛弹琴:中国看透了高市早苗 采取前所未有的反制措施

头条要闻

牛弹琴:中国看透了高市早苗 采取前所未有的反制措施

体育要闻

樊振东和他的尖子班 勇闯地表最强乒乓球赛

娱乐要闻

宋佳二封,易烊千玺拿奖张艺谋乐开花

财经要闻

中国县城的打工人,快被AI培训班包围了

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

本地
游戏
房产
公开课
军事航空

本地新闻

沈阳都市圈“冷资源”点燃“热联动” “组团”北上“圈粉”哈尔滨

多人合作肉鸽冒险《UnderMire》将于12月开启测试

房产要闻

首开狂卖6.68亿!海口这个顶级教育红盘,引爆海口楼市!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

解密福建舰电磁弹射背后的硬核支撑

无障碍浏览 进入关怀版