网易首页 > 网易号 > 正文 申请入驻

AI字幕慢半拍,不知道大家笑什么?新方法让同传性能直逼离线翻译

0
分享至

本文第一作者是徐婷,是香港中文大学博士生,主要研究兴趣是大模型的后训练;通讯作者分别是黄志超和程善伯,来自字节跳动Seed团队。

你是否经历过这样的场景:观看一场激动人心的全球发布会,AI 字幕却总是慢半拍,等你看到翻译,台上的梗已经冷掉了。

或者,在跨国视频会议上,机器翻译的质量时好时坏,前言不搭后语,让人啼笑皆非。

这就是同声传译(Simultaneous Machine Translation, SiMT)领域一直以来的核心技术挑战:“质量 - 延迟” 权衡问题(Quality-Latency Trade-off)

现在,这些问题迎来了新的解决方案。来自香港中文大学、字节跳动 Seed 和斯坦福大学的研究团队联手提出了一种面向同声传译的序贯策略优化框架 (Sequential Policy Optimization for Simultaneous Machine Translation, SeqPO-SiMT)

该方法将同传任务巧妙地建模为序贯决策过程,通过优化完整的决策序列,显著提升了翻译质量,同时有效控制了延迟,其性能直逼、甚至在某些方面超越了同等大小的离线翻译模型。

  • 论文标题: SeqPO-SiMT: Sequential Policy Optimization for Simultaneous Machine Translation
  • 论文链接:https://arxiv.org/pdf/2505.20622

研究背景

同声传译的核心在于机器需要动态地决定 “继续听”(READ)还是 “开始说”(WRITE)。这个决策直接影响最终的翻译效果。例如,当模型接收到英文单词 “bark” 时,它面临一个困境:如果立即翻译,可能会译为 “狗叫”,但若后文出现 “of the tree”,则正确翻译应为 “树皮”。

传统的同传方法,它每一步决策(是继续听,还是开始翻译)都是孤立的。它可能会因为眼前的 “小利”(比如翻译出一个词)而牺牲掉全局的 “大利”(整个句子的流畅度和准确性)。

核心方法

针对这一难点,该论文提出了 SeqPO-SiMT 框架。其核心思想是将同声传译任务建模为一个序贯决策问题,综合评估整个翻译流程的翻译质量和延迟,并对整个决策序贯进行端到端的优化。

该方法的主要特点是:它不再孤立地评估每一步决策的好坏,而是将一整句话的翻译过程(即一个完整的决策序贯)视为一个整体,更符合人类对同传的评估过程。

其中,λ 是一个超参数,用于权衡质量与延迟的重要性。

实验结果与分析

为了验证方法的有效性,研究者们在多个公开的英汉互译测试集上进行了实验,并与多种现有的同传模型进行了对比。实验结果显示:在低延迟水平下,SeqPO-SiMT 框架生成的译文质量相较于基线模型有明显提升。

本文将 SeqPO-SiMT 的实时同传结果与多个高性能模型的离线翻译结果进行对比。结果显示,SeqPO-SiMT 的翻译质量不仅优于监督微调(SFT)的离线模型及 LLaMA-3-8B,其表现甚至能媲美乃至超越 Qwen-2.5-7B 的离线翻译水平。这表明该方法在 70 亿参数(7B)规模上实现了业界顶尖(SoTA)的性能。

总结与讨论

总的来说,SeqPO-SiMT 这项工作的主要贡献在于,为解决同声传译中的质量 - 延迟权衡问题提供了一个新的视角。它强调了对决策 “序贯” 进行整体优化的重要性。该研究提出的方法,对于需要进行实时、连续决策的自然语言处理任务具有一定的参考意义,并为未来开发更高效、更智能的同声传译系统提供了有价值的探索。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李湘终于回应了!辟谣因洗钱被禁言,律师维权声明曝光!

李湘终于回应了!辟谣因洗钱被禁言,律师维权声明曝光!

古希腊掌管月桂的神
2026-01-26 15:58:43
哈萨克斯坦是一个很奇怪的国家。

哈萨克斯坦是一个很奇怪的国家。

南权先生
2026-01-26 15:42:25
董路:杨毅说40分钟收6块8 我苦哈哈聊4小时才收8块8 回头我涨价

董路:杨毅说40分钟收6块8 我苦哈哈聊4小时才收8块8 回头我涨价

风过乡
2026-01-27 07:06:46
“让我睡一次,不然死给你看!”17岁少年持刀,威胁舅妈发生关系

“让我睡一次,不然死给你看!”17岁少年持刀,威胁舅妈发生关系

有书
2026-01-09 21:30:59
庾澄庆牵老婆看演唱会,张嘉欣皱纹多,瘦又矮,却被夸完胜伊能静

庾澄庆牵老婆看演唱会,张嘉欣皱纹多,瘦又矮,却被夸完胜伊能静

白面书誏
2026-01-26 16:24:56
93年粮站来了个女劳改犯,我辞职下海那天,她拉着我:带我走

93年粮站来了个女劳改犯,我辞职下海那天,她拉着我:带我走

萧竹轻语
2026-01-22 14:58:10
日本新首相人选正式出炉,对华政策引人关注

日本新首相人选正式出炉,对华政策引人关注

风干迷茫人
2026-01-26 12:08:00
支持率暴跌后,高市这下慌了,日本商界发声:绝不能离开中国

支持率暴跌后,高市这下慌了,日本商界发声:绝不能离开中国

娱乐督察中
2026-01-27 07:51:49
做完手术人就废了,这5种手术不需要做,别让无知害了自己

做完手术人就废了,这5种手术不需要做,别让无知害了自己

华庭讲美食
2026-01-19 14:27:13
外交部和中国驻日本使领馆提醒:中国公民春节期间避免前往日本;49条中日航线取消全部航班

外交部和中国驻日本使领馆提醒:中国公民春节期间避免前往日本;49条中日航线取消全部航班

每日经济新闻
2026-01-26 19:13:15
日本K杯偶像发视频呼吁2月8日一起去投票,粉丝大赞

日本K杯偶像发视频呼吁2月8日一起去投票,粉丝大赞

随波荡漾的漂流瓶
2026-01-26 18:40:03
马内回归救主,利雅得胜利3连胜

马内回归救主,利雅得胜利3连胜

体坛周报
2026-01-27 07:41:09
成都西岭雪山景区就“围雪收费”致歉:已新增3个免费项目区

成都西岭雪山景区就“围雪收费”致歉:已新增3个免费项目区

黄河新闻网吕梁频道
2026-01-22 09:36:52
国台办果然没看错,郑丽文真面目被彻底揭露!小算盘到此为止了

国台办果然没看错,郑丽文真面目被彻底揭露!小算盘到此为止了

比利
2026-01-23 12:41:53
美军向伊朗调集重兵,中方平淡回应,伊朗只剩唯一的选择

美军向伊朗调集重兵,中方平淡回应,伊朗只剩唯一的选择

南权先生
2026-01-26 15:38:11
凤姐,能否逃过美国斩杀线,大概率很难了

凤姐,能否逃过美国斩杀线,大概率很难了

月满大江流
2025-12-28 09:47:42
俄乌打了三年,打穷了三个国家,富了三个国家,中国也在其中

俄乌打了三年,打穷了三个国家,富了三个国家,中国也在其中

林子说事
2026-01-26 12:49:07
李湘和老燕子夫妻的“H南帮”!

李湘和老燕子夫妻的“H南帮”!

八卦疯叔
2026-01-26 11:45:10
央视披露:太原舰遭美舰高速逼近,全舰拉响警报导弹进入待命状态

央视披露:太原舰遭美舰高速逼近,全舰拉响警报导弹进入待命状态

阿龙聊军事
2026-01-26 20:40:50
远藤航:对输球感到失望,我觉得我们下半场踢得还不错

远藤航:对输球感到失望,我觉得我们下半场踢得还不错

懂球帝
2026-01-26 17:30:13
2026-01-27 09:07:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12193文章数 142550关注度
往期回顾 全部

科技要闻

理想开始关店“过冬”,否认“百家”规模

头条要闻

牛弹琴:韩国人万万没想到在睡梦中 特朗普突然下手了

头条要闻

牛弹琴:韩国人万万没想到在睡梦中 特朗普突然下手了

体育要闻

叛逆的大公子,要砸了贝克汉姆这块招牌

娱乐要闻

张雨绮被抵制成功!辽视春晚已将她除名

财经要闻

金价狂飙 “牛市神话”未完待续

汽车要闻

宾利第四台Batur敞篷版发布 解锁四项定制创新

态度原创

手机
数码
本地
公开课
军事航空

手机要闻

iQOO 15、一加15、REDMI K90 PM周销量分析

数码要闻

苹果发布 iOS 26.2.1:支持其2026年首款新硬件AirTag 2

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

委代总统称遭美威胁:马杜罗已死

无障碍浏览 进入关怀版