网易首页 > 网易号 > 正文 申请入驻

Meta 翻译大杀器NLLB200登上Nature:翻译质量提高44%

0
分享至

今天,Meta在《自然》(@Nature)杂志发表了一篇文章推出一种AI模型:No Language Left Behind (NLLB) ,能够在 200 种语言之间直接提供高质量的翻译


No Language Left Behind (NLLB) 模型架构详解

No Language Left Behind (NLLB) 项目旨在通过先进的神经机器翻译技术,实现对200种语言的高质量支持,尤其关注低资源语言的翻译。本文将详细介绍NLLB模型的架构设计及其技术创新,展示其在多语言翻译中的突破性进展

翻译质量

NLLB-200模型相比之前的最先进系统,在翻译质量上取得了显著提升。平均而言,NLLB-200模型的翻译质量提升了44%。这一提升在多个语言方向上均有体现,尤其是低资源语言

使用NLLB-200翻译的文章具有最低的删除率(0.13%)和最高的修改保留率(10%以下)

模型架构

NLLB模型采用了稀疏门控专家混合(Sparsely Gated Mixture of Experts, MoE)架构。这种架构通过稀疏激活机制,实现了高效的参数利用和计算资源分配,大幅提升了模型在处理多语言任务时的性能

稀疏门控专家混合架构

基础原理: 稀疏门控专家混合架构的核心理念是将模型的计算资源分配给不同的专家网络(专家层),每个专家专注于处理特定语言或语言组。通过门控机制,模型能够在处理不同输入时激活相应的专家,从而提高翻译效果

专家网络的设计: NLLB模型中的专家网络是多个并行的子网络,每个子网络由若干层的神经单元组成。这些子网络通过共享的参数和独立的参数相结合,在共享知识的同时,保留了对特定语言的专门优化

门控机制: 门控机制通过动态选择激活哪些专家网络来处理输入数据。具体来说,门控网络根据输入的语言特征和上下文信息,决定激活哪些专家网络。这样,模型能够根据不同语言的需求,灵活调整计算资源的分配

数据挖掘与预处理

NLLB项目在数据挖掘和预处理方面也采用了创新的方法,以解决低资源语言的数据匮乏问题。项目团队利用多种数据源,包括网络爬虫、文档库以及社区贡献,收集了大量平行语料。同时,利用先进的数据清洗和对齐技术,确保数据的高质量和多样性

模型训练与优化

多语言训练: 在模型训练过程中,NLLB采用了多语言联合训练的方法,即在一个统一的模型中同时训练多种语言。这样可以充分利用高资源语言的数据,提升低资源语言的翻译性能。通过共享多语言的知识,模型能够更好地泛化到不同语言的翻译任务上

优化策略: 为了进一步提升模型的性能,NLLB团队采用了多种优化策略,包括学习率调节、梯度裁剪、正则化等技术。同时,利用分布式训练和混合精度训练,显著加快了模型的训练速度,并有效降低了计算资源的消耗

性能评估与测试

NLLB项目开发了一套综合评估工具,用于测试和验证模型在不同语言上的翻译性能。这些工具包括:

FLORES-200:一套自动评估基准,覆盖了200种语言的测试数据,用于衡量翻译质量

XSTS:人工评估指标,通过人类评审员对翻译结果的质量进行主观打分

有害内容检测:针对所有支持语言,模型还集成了有害内容检测器,以确保翻译结果的安全性和可靠性

paper:‍‍‍

https://www.nature.com/articles/s41586-024-07335-x/tables/3

⭐星标AI寒武纪,好内容不错过

用你的在看告诉我~

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1-0到1-4!斯诺克中国德比:斯佳辉兵败如山倒,肖国栋逆转冲4强

1-0到1-4!斯诺克中国德比:斯佳辉兵败如山倒,肖国栋逆转冲4强

刘姚尧的文字城堡
2026-02-06 14:56:26
宗教活动不得扰乱公共秩序:当街礼拜涉嫌违反《宗教事务条例》

宗教活动不得扰乱公共秩序:当街礼拜涉嫌违反《宗教事务条例》

西域都护
2026-02-05 13:01:14
4000场里程碑!文班29+11马刺送独行侠6连败 弗拉格连4场30+

4000场里程碑!文班29+11马刺送独行侠6连败 弗拉格连4场30+

醉卧浮生
2026-02-06 11:55:16
至少14人被拍到!女大学生从广州坐高铁回家,网友:看着看着就哭了

至少14人被拍到!女大学生从广州坐高铁回家,网友:看着看着就哭了

环球网资讯
2026-02-06 14:06:36
国共论坛结束,大陆宣布重要决定,给郑丽文面子,发布一项通行令

国共论坛结束,大陆宣布重要决定,给郑丽文面子,发布一项通行令

大鱼简科
2026-02-05 22:07:25
1962 年朱德视察井冈山,见女团长被安排挑粪,怒责当地地委书记

1962 年朱德视察井冈山,见女团长被安排挑粪,怒责当地地委书记

磊子讲史
2026-02-03 15:52:57
小杨哥拿下无语哥,定40亿美元带货目标!双方公司被67亿收购……

小杨哥拿下无语哥,定40亿美元带货目标!双方公司被67亿收购……

柴狗夫斯基
2026-02-06 11:52:16
南阳市人民政府关于魏新旗等3人任职的通知

南阳市人民政府关于魏新旗等3人任职的通知

大象新闻
2026-02-06 15:25:39
现货白银收跌20.06%,报70.902美元/盎司

现货白银收跌20.06%,报70.902美元/盎司

每日经济新闻
2026-02-06 06:26:13
新血压标准已公布,高血压不再是120/80mmHg,愿你的血压在它之下

新血压标准已公布,高血压不再是120/80mmHg,愿你的血压在它之下

熊猫医学社
2026-02-06 11:35:03
一月份的3.2万辆,让零跑的100万幻想破灭

一月份的3.2万辆,让零跑的100万幻想破灭

DearAuto
2026-02-05 09:33:24
乌克兰:悔到肠子青,当年卖给中国三架“废铁”,今成大国重器?

乌克兰:悔到肠子青,当年卖给中国三架“废铁”,今成大国重器?

素衣读史
2026-01-26 18:51:48
孟子义现身4S店,提7万块新车给员工当年终奖,网友:不如发现金

孟子义现身4S店,提7万块新车给员工当年终奖,网友:不如发现金

疯说时尚
2026-02-06 09:25:31
央视主持人大洗牌:3人晋升2人调岗1人离职,海霞龙洋在列

央视主持人大洗牌:3人晋升2人调岗1人离职,海霞龙洋在列

月下守候
2026-02-04 02:30:57
晚饭七分饱被推翻了?医生调查:过了56岁,吃饭尽量要做到这5点

晚饭七分饱被推翻了?医生调查:过了56岁,吃饭尽量要做到这5点

蜉蝣说
2026-02-03 15:00:19
时下我国庞大失业大军都去哪里了?主要有6个去处,你认同吗?

时下我国庞大失业大军都去哪里了?主要有6个去处,你认同吗?

慧翔百科
2026-02-05 10:05:22
春节期间上海地铁3/4号线部分区段因改造停运,其间提供免费接驳

春节期间上海地铁3/4号线部分区段因改造停运,其间提供免费接驳

澎湃新闻
2026-02-06 14:02:15
公积金缴纳等级,你在几级?

公积金缴纳等级,你在几级?

新浪财经
2026-02-04 05:17:52
东风奕派发布情况声明:eπ007事故监控视频在网络平台传播,视频记录的事故发生于2025年,事故是车辆与货车高速碰撞后引发

东风奕派发布情况声明:eπ007事故监控视频在网络平台传播,视频记录的事故发生于2025年,事故是车辆与货车高速碰撞后引发

大风新闻
2026-02-05 17:48:02
“长得好看就行了”,女儿不写作业母亲要打,网友劝人走弯路

“长得好看就行了”,女儿不写作业母亲要打,网友劝人走弯路

六目先生
2026-01-23 08:39:15
2026-02-06 15:55:00
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1032文章数 396关注度
往期回顾 全部

科技要闻

独角兽版图巨变:SpaceX奔万亿 中美差在哪

头条要闻

长和巴拿马港口遭接管 百亿美元全球港口出售计划生变

头条要闻

长和巴拿马港口遭接管 百亿美元全球港口出售计划生变

体育要闻

西甲射手榜第2,身价不到姆巴佩1/40

娱乐要闻

微博之夜红毯好精彩,堪比婚礼现场

财经要闻

爱尔眼科卷入骗保疑云 公司回应

汽车要闻

这颜值真的可以!方程豹首款轿车叫"镁7"还是"方程"?

态度原创

房产
手机
本地
教育
艺术

房产要闻

新春三亚置业,看过这个热盘再说!

手机要闻

苹果终于开窍!国行5000mAh+2nm A20 Pro,续航直接拉满

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

教育要闻

取消中高考?讲讲为孩子、为国家,教育该往哪走#高考 #教育

艺术要闻

Kristin Vestgard:挪威当代画家

无障碍浏览 进入关怀版