网易首页 > 网易号 > 正文 申请入驻

鹅厂造了个AI翻译公司:专攻网络小说,真人和GPT-4看了都说好

0
分享至

  • 克雷西 发自 凹非寺
    量子位 | 公众号 QbitAI

鹅厂搞了个150多人的“翻译公司”,从老板到员工都是AI智能体

主营业务是翻译网络小说,质量极高,参与评价的读者认为比真人翻译得还要好

而且相比于雇佣真人,用它来翻译文学作品,成本降低了近80倍

公司名为TransAgents,每个岗位都配备了30个不同的职工,能够根据语言、体裁和目标受众适配不同的翻译风格。

相比于传统的翻译,产出的译文更加灵活多样,也更符合目标语言的表达习惯,文学性也更强。

所以,TransAgents虽然在以相似度为基础的自动评估中“失败”,却赢得了读者和专业人士的大力肯定。

这样的表现甚至让人感叹说,或许人类对人工智能生成的内容更加青睐的时代,就要来了。

还有人表示,TransAgents是证明自己错看了人工智能的又一证据——本以为由于模型限制,小说的翻译对AI会极其困难,结果AI智能体把这个任务完成得非常好。

所以,TransAgents到底有没有那么神呢?

真人和GPT-4都说好

为了评估TransAgents的翻译质量,作者选择了WMT2023数据集,需要对其进行篇章级的文学翻译。

该数据集从12部网络小说中各截取了20个连续的章节,涉及如下八种类型:

  • 游戏类(Video Games,VG)
  • 东方玄幻类(Eastern Fantasy,EF)
  • 科幻爱情类(Sci-fi Romance,SR)
  • 当代爱情类(Contemporary Romance,CR)
  • 玄幻类(Fantasy,F)
  • 科幻类(Science Fiction,SF)
  • 恐怖惊悚类(Horror & Thriller,HT)
  • 玄幻爱情类(Fantasy Romance,FR)

起初,作者使用d-BLEU进行了自动评估,该方法会与参考样本进行相似度计算,相似度越高得分也就越高。

具体到本项目当中,参考样本一共有两组,样本一是人工给出的翻译结果,样本二是对网络中的双语文本进行对齐后得到。

结果,TransAgents的得分并不理想,只有25分,连SOTA的一半都不到。

但这并不意味着TransAgents的翻译质量不行,而是因为用相似度来衡量文学作品翻译的表现,本身就有失偏颇。

文学翻译不是逐字对照,而是需要在语义、语气、风格等方面进行创造性的转换,这些转换可能导致译文与参考译文在表面上差异较大,相似度不高自然就不意外了。

所以,作者干脆直接让真人(至少10人)来评价翻译的质量,顺便也让GPT-4(0125-Preview)来看了看,在TransAgents、GPT-4(1106-Preview)和真人当中,谁的翻译最好。

测评者会看到针对同一段原文的不同翻译,其中真人只看译文,GPT-4则是原文译文都看。

结果,真人测评者有超过一半都认为TransAgents比人类翻译得更好,8.4%认为两者质量相当,GPT-4也认为TransAgents比自己(和人类)的翻译质量高。

除了这些大众评审之外,两名专业的翻译也认为,虽然人工翻译更加忠实于原文,但TransAgents给出的翻译明显更有文学色彩,更加简洁、在遣词用句上体现出了语言天赋和深厚的文学表现力。

MATTR和MTLD测试指标也证明了这一点,尤其是在MTLD上,TransAgents的语言多样性比真人和GPT-4高出了三分之一左右。

在作者展示的案例中,TransAgents会根据目标语言的习惯对翻译内容做出调整,真人(Ref1)和GPT-4虽然翻的也没错,但相比之下不如TransAgents符合语言习惯。

另外在前后一致性上,TransAgents也超过了单纯使用GPT-4,对相同的原文保持使用一样的译文。

当然,也不是说所有类型它都擅长,在前面提到的8种类型中,TransAgents在游戏、科幻爱情等类型上的表现突出,而在恐怖惊悚等类型上就比较平庸了。

同时作者也发现,TransAgents在翻译时并非“照单全收”,而是会出现一定程度的遗漏现象。

不过从测试中未看过原文的读者给出的评分来看,这样的遗漏似乎没有影响到他们的阅读体验。

所以,这家“翻译公司”是如何运行的呢?

多智能体分工协作

在这个公司当中,不同的智能体分别扮演着CEO、初/高级编辑、真·翻译、本地化专家和校对(Proofreader)这些不同的职位,除CEO外每个职位各有30人,每个人擅长的领域也有所不同,另外还有一个Ghost Agent。

这些智能体由GPT-4-Turbo驱动,每个角色都包含姓名、年龄、职位、工作年限及掌握的语言等多维度的设定。

接到“客户”的翻译要求后,CEO会综合分析原文和目标语言、体裁、目标受众等信息,从几位高级编辑中选择擅长领域最匹配的一位。

此时,Ghost Agent会对CEO的选择进行评估,告知其人选是否合适,从而减少选择失当的现象。

被选定的高级编辑会与CEO合作,再次结合任务需求和个人特点,从公司人才库中进一步选择初级编辑、翻译、本地化专家和校对等团队成员。

团队组建好后,首先由初级编辑逐章节识别所有潜在的关键术语,生成初始术语表,交由高级编辑审查,删除其中的通用术语,生成修订后的术语表,反复迭代直到不需要进一步修改。

然后,结合术语在不同语境下的意义,高级编辑会将术语表中的关键术语翻译为目标语言。

有了术语表后,初级编辑会为每一章生成详细的章节摘要,尽可能保留关键信息和细节,然后还是让高级编辑来审查,并删除冗余或不必要的信息,让章节摘要更加简明扼要。

接着,高级编辑根据修订后的章节摘要编写全书的摘要,概括主要情节、人物和主题,并随机选择书中的一章,分析其语气、风格和目标受众,制定翻译风格指南。

翻译风格指南会发送给项目团队所有成员,以确保译文风格的一致性。

根据风格指南,公司中的真·译员会逐章节进行初步翻译,把初稿交给初级编辑审查,检查是否遵循翻译风格指南,并提出改进意见。

在此基础之上,高级编辑会评估经过修改的译文质量,决定是否需要进一步修改,译员、初级编辑和高级编辑反复迭代,直到译文质量满足要求。

但此时得到的翻译文本并不是终稿,还要交给本地化专家进行调整。专家会识别可能需要文化调适的内容,如习语、隐喻等等,并对这些内容进行调整,使其在保留原文意图的基础之上更贴近目标语言和文化。

调整后的文本会让初级编辑和高级编辑再次审查,确保译文在文化适应性和忠实度之间取得平衡。

这之后,还有校对人员再次检查语法、拼写、标点和格式错误,如果有修改,还要再让编辑进一步审核。

这些流程都走完后,高级编辑会进行最后的终审,重点关注相邻章节之间的连贯性,确保情节、人物、主题等元素在全书范围内保持一致,一旦发现问题则发回给前面的团队成员进行修改,直到形成最终的译本。

如果客户对译本有修改意见,则会再次由高级编辑牵头,组织相关人员进行修改,直到定稿。

不仅是在工作流程上极其严格规范,在客户对译本满意后,高级编辑还会组织项目团队“开会”进行项目总结,分享经验教训。

过程中积累的有价值的术语、翻译技巧、文化调适策略等知识会被整理归纳,上传至公司的知识库,供后续项目参考。

One More Thing

TransAgents已经不是第一个由智能体组成的“公司”了,去年就有来自清华的“游戏公司”ChatDev爆红网络,背后所运用的核心技术就是多智能体。

如果把视线放宽,不只看“公司”,还有斯坦福的AI小镇、清华的AI狼人杀游戏,都在使用多智能体进行着真实人类社会的模拟。

总之随着大模型研究的深入,智能体和群体智能实验已成AI研究最热门方向之一,而且从这次的TransAgents来看,多智能体协同已经开始显现出了实际效益。

(顺便提一句,有网友发现,从斯坦福小镇到ChatDev,再到这次的TransAgents,多智能体研究的作者是真的喜欢《星露谷物语》式的绘画风格。)

当然,也有人对此表示了担忧,认为由AI来主导翻译,会导致语言的同质化,让各种语言中独特的表达消失。

更有甚者,已经跳出TransAgents本身,想到Ilya对大规模Agent合作的恐惧了……

那么你认为在群体智能这条路上还能创造出什么新奇的成果呢?欢迎在评论区晒出你的脑洞。

论文地址:
https://arxiv.org/abs/2405.11804

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
石门692、佛一689!佛山71所高中录取分数线曝光

石门692、佛一689!佛山71所高中录取分数线曝光

佛山楼市发布
2025-07-20 11:06:41
全红婵养伤捕鱼!全妈视察在建新房开心大笑,暖心给工人送龙眼

全红婵养伤捕鱼!全妈视察在建新房开心大笑,暖心给工人送龙眼

李喜林篮球绝杀
2025-07-19 17:42:14
国外有专家评价:毛泽东之所以打仗厉害,主要有3大“看家本领”

国外有专家评价:毛泽东之所以打仗厉害,主要有3大“看家本领”

南书房
2025-07-07 22:35:03
时机已到,该收拾冯德莱恩了!中国一道禁令封锁,必须杀鸡儆猴

时机已到,该收拾冯德莱恩了!中国一道禁令封锁,必须杀鸡儆猴

快看张同学
2025-07-20 09:25:37
睡完首富睡首相:从厂妹到顶级名媛,靠男人捞到百亿,她凭什么

睡完首富睡首相:从厂妹到顶级名媛,靠男人捞到百亿,她凭什么

不写散文诗
2025-07-17 20:26:05
惨遭打脸!宫鲁鸣曾喊话日本女篮主帅:希望你们拿出干劲不要无能

惨遭打脸!宫鲁鸣曾喊话日本女篮主帅:希望你们拿出干劲不要无能

雷速体育
2025-07-19 21:54:06
女篮首节大胜韩国!罗欣棫大爆发,替补3将主导局势,专注度拉满

女篮首节大胜韩国!罗欣棫大爆发,替补3将主导局势,专注度拉满

篮球资讯达人
2025-07-20 16:54:23
NBA高管:詹姆斯执行球员选项是错误的决定 他应以自由身签约骑士

NBA高管:詹姆斯执行球员选项是错误的决定 他应以自由身签约骑士

直播吧
2025-07-19 20:50:07
郭德纲一家三口罕见同框,王惠胖出新高度,10岁郭汾阳目测150斤

郭德纲一家三口罕见同框,王惠胖出新高度,10岁郭汾阳目测150斤

娱乐团长
2025-07-20 16:39:46
没有他,中国历史或被改写,他被判死刑,毛主席大怒:立即放人

没有他,中国历史或被改写,他被判死刑,毛主席大怒:立即放人

小莜读史
2025-07-13 20:06:43
没苦硬吃!女儿想做韩国练习生,黄奕坚持劝退,网友评论更扎心

没苦硬吃!女儿想做韩国练习生,黄奕坚持劝退,网友评论更扎心

娱乐看阿敞
2025-07-19 14:47:53
男子冒充外卖员入户,与女主播发生6次关系,女子哭诉:还带道具

男子冒充外卖员入户,与女主播发生6次关系,女子哭诉:还带道具

书画艺术收藏
2025-07-02 19:10:03
林徽因落选的国徽方案,网友看完感慨:审美一骑绝尘,但真不合适

林徽因落选的国徽方案,网友看完感慨:审美一骑绝尘,但真不合适

国学聚焦
2025-06-02 16:28:28
大爆冷!中国女篮输球原因揭晓,评分一目了然,宫鲁鸣脸色铁青

大爆冷!中国女篮输球原因揭晓,评分一目了然,宫鲁鸣脸色铁青

大秦壁虎白话体育
2025-07-19 22:15:32
中国运气有多好?我国低调要回被侵占的土地,发现大量稀有资源

中国运气有多好?我国低调要回被侵占的土地,发现大量稀有资源

历来纵横
2025-07-13 19:27:05
处理来了!香奈儿柜姐打后续:通报已发,知情人爆内情,情有可原

处理来了!香奈儿柜姐打后续:通报已发,知情人爆内情,情有可原

鋭娱之乐
2025-07-19 23:01:58
中国女篮三大败因:弃用奇兵,错用控卫,韩旭张子宇背锅

中国女篮三大败因:弃用奇兵,错用控卫,韩旭张子宇背锅

体娱荒原
2025-07-19 23:04:59
47岁女高管与23岁男助理爬山,双双坠崖后,警方打开其帐篷愣住

47岁女高管与23岁男助理爬山,双双坠崖后,警方打开其帐篷愣住

悬案解密档案
2025-07-18 15:54:04
WTT冠军赛横滨站8月7日至11日赛程,林诗栋王楚钦等11人参赛

WTT冠军赛横滨站8月7日至11日赛程,林诗栋王楚钦等11人参赛

乒乓球球
2025-07-19 21:45:25
汽车巨头,集体“反水”

汽车巨头,集体“反水”

中国新闻周刊
2025-07-18 11:38:56
2025-07-20 17:43:00
量子位 incentive-icons
量子位
追踪人工智能动态
10893文章数 176192关注度
往期回顾 全部

科技要闻

Manus"跑路新加坡"后,创始人首次复盘

头条要闻

极氪被指卖"0公里二手车"虚增销量 官方:正常商业行为

头条要闻

极氪被指卖"0公里二手车"虚增销量 官方:正常商业行为

体育要闻

零成本搞定艾顿斯马特 湖人还有大动作?

娱乐要闻

肖战改名官宣!彻底不装了,要自由

财经要闻

夹缝中的芯片之王:黄仁勋能守住4万亿吗?

汽车要闻

辅助驾驶五维测评 蔚来世界模型:大智小糙

态度原创

本地
教育
艺术
房产
公开课

本地新闻

换个城市过夏天 | 谁打翻了潍坊的调色盘?

教育要闻

浦口、江宁、六合、高淳…发布2025中招第二批次投档线!

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

房产要闻

海南中学江东校区学区划片重磅出炉!这些项目赢麻了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版