网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

0.1%参数换来BLEU涨1.2分：机器翻译的加权注意力新思路

2026-05-14 07:12:00　来源: 像素与芯片

北京举报

0

分享至

注意力机制统治NLP多年，但一个细节始终没解决：所有注意力头真的该平等对待吗？

研究人员提出了一种加权变体。核心改动很简单——给不同的注意力头分配可学习的权重系数，让模型自己决定哪些"视角"更重要。不是改网络结构，而是改信息融合方式。

实验结果有意思。在WMT英德翻译任务上，BLEU分数提升了0.8-1.2个点。数字不大，但胜在改动极小：参数量只增加了不到0.1%，推理速度几乎不变。

这个思路的巧妙之处在于"不折腾"。当所有人都在堆层数、扩维度时，它回到注意力机制本身，问了一个被忽略的问题：多头注意力里，每个头的话语权该怎么定？

目前代码已开源。对于正在做翻译系统优化的团队，这或许是个低成本的尝试方向。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

不是幻觉！Claude自下指令甩锅人类，百万上下文沦为降智重灾区

新智元 2026-05-14 13:08:29
11 跟贴 11
国产GPU首获全球顶级推理框架「原生门票」：MUSA合入SGLang主线

机器之心Pro 2026-05-14 16:03:08
0 跟贴 0

一个视频带你了解猫头鹰身上的逆天机制！

归环 2026-05-10 00:30:37
1287 跟贴 1287

销冠光环下的建发灏云：双河半岛之上，七大维度透视福州改善"一哥"的真实价值坐标

乐居财经官方 2026-05-14 10:57:48
0 跟贴 0
熊妈妈带四只幼崽过马路，网友：嘴里那只一定最调皮

南阳日报 2026-05-13 19:44:30
634 跟贴 634

男孩一个月弄丢九次书包，妈妈偷偷跟着发现了真相

南阳日报 2026-05-13 19:40:39
106 跟贴 106

请一定多读书：书读多了，内耗就少了

字里行间遇见 2026-05-14 16:59:16
0 跟贴 0
九寨沟将实行“双向检票”？工作人员：出园检票并非新政策，一直严禁沟内住宿

上游新闻 2026-05-11 15:40:24
2983 跟贴 2983

约0.01飞米！中国科学家重要发现，将改写教科书

上观新闻 2026-05-14 06:48:04
2558 跟贴 2558
安装空调怎么排空和抽真空？方法很简单，师傅教你一看就会

阿兵电器维修 2026-05-12 18:42:49
8 跟贴 8
在巴基斯坦的农村是如何打井的，看完之后觉得这效率真的太牛了

燕三嘤 2026-05-14 06:33:08
3 跟贴 3
娘家真的待不住，几个女婿一起回娘家，唯独老公不合群！

搞笑者大联盟 2026-05-14 09:59:16
9 跟贴 9
特朗普政府调查由美国纳税人资助的30多国的生物实验室

月满楼熊安全 2026-05-14 17:06:01
0 跟贴 0
训练数据枯竭怎么办？首篇「数据价值密度」综述理清思路

机器之心Pro 2026-05-14 18:10:09
0 跟贴 0
广东队无缘四强，杜峰表示并无遗憾，宏远老板娘却公开支持

铿锵格斗 2026-05-14 18:23:24
1 跟贴 1
为什么越来越多的人，开始不买房了？原因其实很简单

芳姐侃社会 2026-05-14 18:16:48
1 跟贴 1
大轮盘带动弹簧往复运动，看似永动机，实则巧妙机械模型

木子奇趣 2026-05-13 10:48:00
4 跟贴 4
清华学霸杨奇函学霸不是教出来的，普娃拼的是有效注意力！

周周怪与哈基米 2026-05-14 02:43:38
0 跟贴 0
Swatch与爱彼联名推出皇家橡树怀表系列

碳基打工人 2026-05-13 06:14:29
2 跟贴 2
美国在台湾省问题上，被中国挤掉了多少话语权？

沙溪解说 2026-05-14 17:17:49
0 跟贴 0
俄总统新闻秘书：只要美国不再把经贸合作与乌克兰问题挂钩，俄愿同美开展商业往来

极目新闻 2026-05-14 09:58:58
1084 跟贴 1084
一个家庭真的会影响孩子的一生

仙仙看影 2026-05-14 12:13:54
1 跟贴 1
生态治理还是高价钓鱼？西昌邛海4000元钓鱼年卡引质疑律师：如此收费无法律依据

封面新闻 2026-05-13 20:48:03
595 跟贴 595
“小马云”范小勤成年后直播首秀，在线人数突破7万，礼物刷屏

星视频 2026-05-14 15:29:30
18 跟贴 18
杨国福麻辣烫开到了巴黎，当地华人：味道不错，经常去吃

极目新闻 2026-05-14 18:39:07
0 跟贴 0
草鱼怎么做才好吃？很简单的电饭锅做法，草鱼不腥肉质还特别鲜嫩

九月家的厨房 2026-05-11 16:00:00
0 跟贴 0
Netflix把角色名印错，周边T恤紧急下架

Ping值焦虑 2026-05-14 07:28:53
1 跟贴 1
一次洞穴探险中，研究人员在地下深处发现了一个巨大的黑色球体

愣娃看世界 2026-05-13 11:18:30
1 跟贴 1
Steam差评到底回不回？这位老哥的观点有点意思

晚星归航2 2026-05-14 18:29:46
0 跟贴 0
不比高端和参数比什么？懂消费者才是生存之道！星海V6解析

三个司机 2026-05-11 15:28:15
6 跟贴 6
《社会发展研究》2026年第2期目录

社会学研究杂志 2026-05-14 18:19:31
0 跟贴 0
河南舞钢：“小网格＋微积分” 让基层治理“一路生花”

金台资讯 2026-05-14 17:50:43
0 跟贴 0
【基层传真 · 西部法治报】岐山深化“法官+商会”沟通联络机制

宝鸡市中级人民法院 2026-05-14 18:07:13
0 跟贴 0
产业里的年轻人｜脚踏实地做好每一次参数优化、试验验证

国资小新 2026-05-14 17:26:48
0 跟贴 0
乐高 11377白城专属促销赠品公布 |6月GWP |11374弹珠机

积木圈子 2026-05-14 16:38:36
0 跟贴 0
15套百元内穿搭套装：懒人时髦的终极解法

野生运营 2026-05-14 09:46:27
0 跟贴 0
AI游戏生成迎来「机制觉醒」：可自我进化的玩法设计师

AI科技评论 2026-05-14 18:19:03
0 跟贴 0
14.98万起，华境S让高阶智驾开进寻常百姓家

买车大师 2026-05-14 17:21:29
0 跟贴 0
真正困住你的，是大脑没完没了的谎言（强烈建议阅读！！）

Kris在路上 2026-05-14 17:29:48
0 跟贴 0
雨雨雨雨雨雨！北京明起6天多雨，气温会降吗？

BRTV新闻 2026-05-14 14:24:33
0 跟贴 0

鲁比奥来了，制裁还在！

梳子姐

2026-05-14 12:21:34

中央巡视组已亮剑！这5类问题是重点 , 老百姓福音来了！

中央巡视组已亮剑！这5类问题是重点 , 老百姓福音来了！

细说职场

2026-05-13 13:42:26

立夏后，少买黄瓜茄子，多吃4种碱性菜，鲜嫩正当时，好吃还不贵

立夏后，少买黄瓜茄子，多吃4种碱性菜，鲜嫩正当时，好吃还不贵

秀厨娘

2026-05-14 15:38:40

炸翻全网！湖人25号签捡漏新星，两大内线适配东契奇，争冠有戏了

炸翻全网！湖人25号签捡漏新星，两大内线适配东契奇，争冠有戏了

体育大朋说

2026-05-14 14:10:07

特朗普乘车抵达欢迎宴会现场

财闻

2026-05-14 17:50:08

现在有多少存款，才相当于80年代的“万元户”，看看你达标了吗？

现在有多少存款，才相当于80年代的“万元户”，看看你达标了吗？

猫叔东山再起

2026-05-14 08:20:11

一个家庭最大的灾难，不是穷，而是父母六七十了，还存在3种情况

一个家庭最大的灾难，不是穷，而是父母六七十了，还存在3种情况

热心市民小黄

2026-05-14 19:05:42

教育改革，正在成为“毒草”毁掉基础教育

教育改革，正在成为“毒草”毁掉基础教育

现实的声音

2026-05-12 08:23:50

国际足联代表团到访北京工人体育场

国际足联代表团到访北京工人体育场

新京报

2026-05-14 17:55:19

外媒：乌克兰军队中出现东大FN-16便携式防空导弹，真实来源成疑

外媒：乌克兰军队中出现东大FN-16便携式防空导弹，真实来源成疑

零度Military

2026-05-14 05:49:57

编外人员“清退”开始，城管协管、辅警、护士教师都在其中

编外人员“清退”开始，城管协管、辅警、护士教师都在其中

巢客HOME

2026-05-14 05:55:06

兄妹勇救4名落水者后遭拉黑，被告知“被救者身份不便公开”；哥哥系盐城公交车司机，大气发声：救人是自愿的；官方：不影响见义勇为认定

兄妹勇救4名落水者后遭拉黑，被告知“被救者身份不便公开”；哥哥系盐城公交车司机，大气发声：救人是自愿的；官方：不影响见义勇为认定

扬子晚报

2026-05-14 12:13:49

警方通报河北无极一男子持刀杀害女子当地商户：事发地为火锅店，几天前关门停业

警方通报河北无极一男子持刀杀害女子当地商户：事发地为火锅店，几天前关门停业

红星新闻

2026-05-14 14:47:17

胡雪岩临终顿悟：这世上最不能得罪的不是达官显贵，而是这三类人

胡雪岩临终顿悟：这世上最不能得罪的不是达官显贵，而是这三类人

史之铭

2026-05-14 15:53:49

64岁陈秀雯近况曝光，“消失”6年变了模样，那么美却被婚姻毁了

64岁陈秀雯近况曝光，“消失”6年变了模样，那么美却被婚姻毁了

文刀贰

2026-05-13 23:25:20

刚删完中文就慌了！国际足联，耍的那点小聪明，竟捅了天大的篓子

刚删完中文就慌了！国际足联，耍的那点小聪明，竟捅了天大的篓子

西楼知趣杂谈

2026-05-13 14:16:55

医生忠告：不想得脑梗，吃完晚饭后，一定不要马上去做这几件事！

医生忠告：不想得脑梗，吃完晚饭后，一定不要马上去做这几件事！

岐黄传人孙大夫

2026-05-06 09:05:08

两次嫁给梁靖崑，退圈安心照顾两个儿子，如今丈夫成为大学教授

两次嫁给梁靖崑，退圈安心照顾两个儿子，如今丈夫成为大学教授

笑饮孤鸿非

2026-05-13 18:59:58

她放弃200万美元年薪，只因 NBC 把位置给了梅根·凯利

她放弃200万美元年薪，只因 NBC 把位置给了梅根·凯利

影视情报室

2026-05-13 09:12:51

回首才发现，原来马斯克早就在中国埋下“重磅炸弹”，且效果显著

回首才发现，原来马斯克早就在中国埋下“重磅炸弹”，且效果显著

青烟小先生

2026-04-04 10:18:44

像素与芯片

有态度网友ytd

3862文章数 24关注度

往期回顾全部

科技要闻

马斯克说会谈很顺利黄仁勋点赞库克比耶

头条要闻

外媒询问中方对鲁比奥的制裁是否已经解除外交部回应

头条要闻

外媒询问中方对鲁比奥的制裁是否已经解除外交部回应

体育要闻

争议抽象天王山，和季后赛最稳定中锋

娱乐要闻

何九华官宣当爸！全程不提孩子妈

财经要闻

李强会见美国工商界代表

汽车要闻

双零重力座椅/AI智能体/调光天幕启境GT7内饰发布

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戏

时尚

家居

房产

军事航空

LPL第二赛段：不拖的涅槃，就是好涅槃！LNG零封LGD

T恤+低腰阔腿裤、衬衫+低腰半裙，今年夏天最时髦的搭配，谁穿谁好看！

家居要闻

精神奢享对话塔尖需求

房产要闻

海南楼市新政要出！拟调公积金贷款额度，最高可贷168万！

军事要闻

美以伊战争期间以总理密访阿联酋

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版