网易首页 > 网易号 > 正文 申请入驻

ACL 2026 | 不训练LLM也能支持未见语言问答?中科院计算所团队让多语言能力「外挂式」加载

0
分享至

来源:市场资讯


一个直观的解释是训练数据不足,但更本质的问题在于表示空间不匹配。已有研究表明,LLM 已经在统一的语义空间中编码了丰富的跨语言知识,并且在处理多语言文本时会专门「经过」这个统一语义空间(如英语表示空间)。这意味着,LLM 的多语言瓶颈不在缺乏知识,而是难以将已有的知识正确映射到多语言表示空间中。

与此同时,多语言神经机器翻译(NMT)模型在跨语言表示建模方面表现出色。这些 NMT 模型通过 encoder-decoder 架构构建了一个统一的跨语言语义空间,实现上百种语言之间稳定的语义转换。这启发我们:能否将 LLM 的知识处理能力和多语言 NMT 模型的多语言能力组合,实现优势互补?

基于这一思路,中国科学院计算技术研究所 NLP 团队提出了一种新的多语言扩展范式 XBridge:组合 LLM 以英文为中心的通用能力,以及现有多语言 NMT 模型的多语言理解和生成能力,实现二者的能力互补,组合成一个多语言通用模型。换言之,将多语言理解和生成卸载到外部 NMT 模型,LLM 进行以英文为中心的通用知识处理。


  • 论文:https://arxiv.org/abs/2603.17512

  • 代码:https://github.com/ictnlp/XBridge

  • 模型:https://huggingface.co/collections/ICTNLP/xbridge

该成果已被 ACL 2026 主会接收。

XBridge:模型组合的多语言扩展方案

XBridge 的核心思想是,将多语言能力卸载到 NMT 模型,同时保留 LLM 作为知识处理和推理的核心。


1. 模型架构

XBridge 采用 encoder-LLM-decoder 三段式架构,模块之间用 MLP 架构的轻量映射层连接:

  • NMT encoder:将多语言输入映射到共享语义空间。

  • LLM:以英语为中心的知识处理和推理核心。

  • NMT decoder:生成目标语言输出。

直观来看,多语言输入首先被 encoder 编码成共享语义表示,再由 LLM 进行知识处理和推理,最后 decoder 映射到目标语言输出,实现完整的多语言「理解 - 处理 - 生成」闭环。

2. 最优运输对齐

由于不同模型之间的表示空间天然不一致,例如 token 粒度上严重错位,单纯利用 MLP 进行跨模型表示映射难以实现语义一致的转换。为解决这一问题,我们引入最优运输(Optimal Transport, OT)对齐目标,自适应地学习 token 粒度的软匹配,从而在不同长度、不同分词方式的异构表示空间之间建立细粒度的语义对齐关系,实现稳定的语义转换和高质量的多语言生成。

3. 三阶段训练策略

为在不同模型之间建立稳定对齐,XBridge 设计三阶段训练策略,LLM 全程无需训练:

  • 跨模型对齐阶段:学习 encoder-LLM-decoder 之间的基础语义映射关系。

  • 编码器适配阶段:让 LLM 学会利用 encoder 表示完成下游任务。

  • 解码器适配阶段:进一步提升 decoder 多语言生成质量。

分阶段的训练设计能够有效避免不同优化目标之间的冲突,使模型能够逐步建立稳定的跨模型映射,并适配下游任务。

实验结果:

不训练 LLM 即可支持高质量未见语言问答

1. 多语言能力成功卸载到 NMT 模型

在 FLORES-101 翻译任务上,XBridge 显著提升了 LLM 在低资源语言或未见语言(如孟加拉语、斯瓦西里语等)上的理解和生成能力,性能接近或超越外部 NMT 模型。这表明 LLM 的多语言能力是可以卸载到外部 NMT 模型的。


2. 下游任务显著提升

在多语言数学推理(MGSM)和摘要生成(XL-Sum)任务上,XBridge 在低资源语言上获得显著提升,显著缩小高资源、低资源语言的性能差距,同时保持或提升高资源语言性能。值得注意的是,这个过程不需要训练 LLM。


3. 可泛化、语言无关的跨模型映射

XBridge 在未训练的语言上仍表现出良好的泛化能力,性能甚至接近外部 NMT 模型,这表明 XBridge 学到的是一种语言无关的跨模型映射。此外,OT 任务对语言生成的泛化具有重要作用。


4. 可控语言生成与无损语言切换

通过控制 decoder 输入语言标签,XBridge 可以灵活指定输出语言,实现任意语言对之间的跨语言生成,同时保持无损的多语言切换。


以下是一个语言切换示例。


5. 系统演示

我们借助一阶段的泛化性,直接在 50 种语言的通用指令遵循数据上训练 XBridge。以下是一个 demo,展示了 XBridge 多语言问答能力和语言切换的效果。

总结与展望

通过将多语言能力卸载到外部 NMT 模型,XBridge 在不训练 LLM 的前提下,实现了对低资源和未见语言的高质量支持。除了性能的提升,XBridge 更重要的价值在于为 LLM 的多语言扩展提供了一个新思路:扩展 LLM 的多语言能力,或许不再需要依赖大规模、高质量、多任务的多语言训练数据,而是可以通过组合现有模型,实现低成本扩展。

作者介绍

卜梦煜,中国科学院计算技术研究所博士研究生,导师为冯洋研究员。主要研究方向为多语言大模型。在 ACL、EMNLP 等自然语言处理领域顶级国际会议发表多篇论文。

冯洋,中国科学院院计算技术研究所研究员、博士生导师,担任国际计算语言学学会执委(ACL Secretary)以及 ACL/EMNLP 等多个国际会议高级领域主席,获 ACL 2019 唯一最佳长文奖。主导研发了百聆大模型和 LLaMA-Omni 即时交互语音大模型(曾位列 Huggingface 连续一周模型下载量前十)。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中美联合国激烈交锋,美逼中国买单,中方拒绝接受,对美反将一军

中美联合国激烈交锋,美逼中国买单,中方拒绝接受,对美反将一军

南宗历史
2026-04-23 15:52:11
步枪+冲锋枪将近20000支!整编第74师的战斗兵这么多吗?

步枪+冲锋枪将近20000支!整编第74师的战斗兵这么多吗?

战风
2026-04-24 19:27:05
长相一般又怎样?这“姐们”把大衣穿成了人间极品

长相一般又怎样?这“姐们”把大衣穿成了人间极品

飛娱日记
2026-02-04 09:19:18
四川一妈妈带儿子买高铁票,结果相隔14个车厢,“距离远还不相通”,12306回应:余票不足时才会被分开,可在上车后协商换座

四川一妈妈带儿子买高铁票,结果相隔14个车厢,“距离远还不相通”,12306回应:余票不足时才会被分开,可在上车后协商换座

台州交通广播
2026-04-24 23:52:56
“少女胯”和“妈妈胯”有啥区别?看钟丽缇和谢娜产后身材,秒懂

“少女胯”和“妈妈胯”有啥区别?看钟丽缇和谢娜产后身材,秒懂

菁妈育儿
2026-04-25 11:04:17
CBA数据王出炉:外援5项第一 李添荣三分王周琦本土篮板王

CBA数据王出炉:外援5项第一 李添荣三分王周琦本土篮板王

醉卧浮生
2026-04-25 10:12:21
场均20.3分4.4板4.8助2.6断,贺希宁当选CBA四月最佳国内球员

场均20.3分4.4板4.8助2.6断,贺希宁当选CBA四月最佳国内球员

懂球帝
2026-04-25 20:47:23
汽车保有量超400万辆的城市PK,苏州交通健康指数以67.66%位列全国第一

汽车保有量超400万辆的城市PK,苏州交通健康指数以67.66%位列全国第一

现代快报
2026-04-25 15:06:34
伊朗最高领袖或与普京首次会晤!被曝“身负重伤”:一条腿已手术3次将安假肢,面部烧伤说话困难,与官员通信靠信使接力传递信件

伊朗最高领袖或与普京首次会晤!被曝“身负重伤”:一条腿已手术3次将安假肢,面部烧伤说话困难,与官员通信靠信使接力传递信件

每日经济新闻
2026-04-25 13:48:05
一觉醒来,美总统连做两大让步,伊朗安全了,古巴也安全了

一觉醒来,美总统连做两大让步,伊朗安全了,古巴也安全了

梦想的现实
2026-04-25 05:26:51
涵盖染发剂、化妆品、牙膏等 今年我国拟新增27项化妆品标准

涵盖染发剂、化妆品、牙膏等 今年我国拟新增27项化妆品标准

极目新闻
2026-04-25 11:15:26
副司令员下连队视察,看到一老兵后被吓了一跳,连忙上前向他敬礼

副司令员下连队视察,看到一老兵后被吓了一跳,连忙上前向他敬礼

云霄纪史观
2026-04-25 19:56:31
“被吓到!”AI生图已经这么逼真了?网友:以后还能信吗?

“被吓到!”AI生图已经这么逼真了?网友:以后还能信吗?

鲁中晨报
2026-04-24 16:56:11
爆大冷!中超荡气回肠1战:国安2:4不敌副班长,基莱斯堪称真苦主

爆大冷!中超荡气回肠1战:国安2:4不敌副班长,基莱斯堪称真苦主

话体坛
2026-04-25 22:06:39
江西两市市委书记,同日调整

江西两市市委书记,同日调整

上观新闻
2026-04-25 17:56:07
奔驰快养不起北京汽车了

奔驰快养不起北京汽车了

汽车K线
2026-04-24 07:30:06
印媒纳闷了:中印明明都没买到苏-33,为什么中国就能造出歼-15?

印媒纳闷了:中印明明都没买到苏-33,为什么中国就能造出歼-15?

健身狂人
2026-04-25 20:19:12
项羽为何被评为千古无二?他创造的3个世界第一,至今无人能超越

项羽为何被评为千古无二?他创造的3个世界第一,至今无人能超越

文史达观
2026-03-22 16:48:03
与人交往,尽量少说这4件事(太深刻了!)

与人交往,尽量少说这4件事(太深刻了!)

诗词天地
2026-04-03 14:08:57
别卷985了!税务局招了2.4万人,77%是本科,这些“双非”才是体制内亲儿子

别卷985了!税务局招了2.4万人,77%是本科,这些“双非”才是体制内亲儿子

老满说高考
2026-04-25 20:04:01
2026-04-25 23:39:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3010677文章数 6925关注度
往期回顾 全部

教育要闻

不以移民为目的的留学,都是阉割版的!

头条要闻

媒体:美军在中东罕见高密度集结 伊朗开始调整战术

头条要闻

媒体:美军在中东罕见高密度集结 伊朗开始调整战术

体育要闻

那一刻开始,两支球队的命运悄然改变了

娱乐要闻

《我们的爸爸2》第一季完美爸爸翻车了

财经要闻

90%订单消失,中东旺季没了

科技要闻

DeepSeek V4发布!黄仁勋预言的"灾难"降临

汽车要闻

2026款乐道L90亮相北京车展 乐道L80正式官宣

态度原创

亲子
房产
健康
数码
军事航空

亲子要闻

发生率仅十万分之一!这种稀有血型跨省紧急调配,只为守护母婴安全

房产要闻

新一轮教育大爆发来了!海口,开始疯狂建学校!

干细胞如何让烧烫伤皮肤"再生"?

数码要闻

联发科亮相2026北京车展:主动式智能体座舱解决方案

军事要闻

美防长:战事不会“没完没了”

无障碍浏览 进入关怀版