网易首页 > 网易号 > 正文 申请入驻

改变传统,吴恩达开源了一个机器翻译智能体项目

0
分享至

机器之心报道

编辑:Panda

吴恩达:拜托了大家,一起让翻译智能体变得更好。

前段时间,随着 GPT-4o、Sora 的陆续问世,多模态模型在生成式方面取得的成绩无可否认,而人工智能的下一个革命性突破将从何处涌现,引起了大量学者和相关人士的关注。

人工智能著名学者、斯坦福大学教授吴恩达一直非常推崇智能体。此前他曾在个人博客着重指出「AI 智能体工作流将会在今年推动人工智能取得长足进步」,AI 智能体的未来潜力愈加被看好,吸睛无数。

近日,吴恩达延续他之前的脚步,开源了一个 AI 智能体机器翻译项目。

项目链接:https://github.com/andrewyng/translation-agent

他分享了关于 AI 智能体机器翻译对改进传统神经机器翻译方面的看法:「具有巨大潜力,尚未被完全发掘」,并发布了一个他一直在周末玩的翻译智能体演示。该翻译智能体以 MIT 许可证形式发布。用户可以自由使用、修改和分发该代码,无论是商业用途还是非商业用途。

在研究团队有限的测试中,吴恩达团队开源的翻译智能体有时能够与领先的商业提供商进行同等水平的竞争,有时则不如它们。但它仍提供了一个高度可控的翻译系统,只需简单更改 prompt,使用者就可以指定语气(正式 / 非正式)、地区变体(例如:使用者想要在西班牙本地说的西班牙语,还是在拉丁美洲说的),并确保术语的翻译一致性(通过提供词汇表)。这个应用程序虽然目前仍稍显稚嫩,但鉴于反思工作流已经展现出不错的成果,吴恩达认为智能体翻译仍有很大的提升空间。

在吴恩达分享的开源项目中,具体介绍了 AI 智能体翻译项目的工作流。

翻译智能体:使用反思工作流进行智能体翻译

这是一个使用 Python 演示的反思智能体工作流的机器翻译示例。主要步骤如下:

1. 输入 prompt,使大型语言模型(LLM)将文本从 source_language 翻译成 target_language;

2. 让 LLM 反思翻译结果,并提出建设性的改进建议;

3. 利用这些建议改进翻译。

自定义能力

通过使用 LLM 作为翻译引擎的核心,该系统具有高度可控性。

例如:通过更改 prompt,这种工作流比传统的机器翻译(MT)系统更容易实现以下功能:

修改输出的风格,如正式 / 非正式。

指定如何处理习语和特殊术语,如名字、技术术语和缩写。例如,在 prompt 中包含术语表,可以确保特定术语(如开源、H100 或 GPU)翻译的一致性。

指定特定区域的语言使用或特定方言,以服务目标受众。例如,拉丁美洲的西班牙语与西班牙的西班牙语不同;加拿大的法语与法国的法语不同。

通过 BLEU(Bilingual Evaluation Understudy)分数进行翻译质量的评估作为有别于传统机器翻译的后起之秀,同样也是衡量 AI 智能体翻译的必由之路。

根据使用传统翻译数据集的 BLEU 分数进行评估的结果:这种工作流有时能与领先的商业产品竞争,但有时表现也不如它们。不过,它偶尔也能够得到非常好的结果,甚至优于商业产品。

他们认为这只是智能体翻译的起点,这一方向在翻译方面很有前景,并且有很大的改进空间。因此,作者团队发布这一演示,以鼓励更多的讨论、实验、研究和开源贡献。

如果相比于更快且更便宜的传统架构(例如输入文本并直接输出翻译的端到端 Transformer 架构),智能体翻译能够有更好的结果,那么它就 neng 提供一种自动生成训练数据(平行文本语料库)的方法,可以用于进一步训练和改进传统算法。

启动

为使 translation-agent 启动,需要遵循以下步骤。

安装:

安装需要 Poetry 管理器。根据安装环境,安装 Poetry 可能需要执行以下步骤:

pipinstallpoetry

git clone https://github.com/andrewyng/translation-agent.gitcd translation-agentpoetry installpoetry shell # activates virtual environment

运行工作流需要一个包含 OPENAI_API_KEY 的 .env 文件,使用者可以参考 .env.sample 文件作为示例。

Usage:

import translation_agent as tasource_lang, target_lang, country = "English", "Spanish", "Mexico"translation = ta.translate(source_lang, target_lang, source_text, country)

使用:

import translation_agent as tasource_lang, target_lang, country = "English", "Spanish", "Mexico"translation = ta.translate(source_lang, target_lang, source_text, country)

查看 examples/example_script.py 获取一个示例脚本并进行尝试。

翻译智能体的进一步发展

吴恩达在最后还分享了几点希望开源社区能够尝试的想法,希望凭借众家之力将翻译智能体的巨大潜力归为实处。

尝试其他语言生成模型。此项目主要使用 gpt-4-turbo 进行原型开发。其他人可以尝试其他 LLM,以及其他超参数选择,并查看是否有些大模型可以对特定语言更好地翻译。

术语表的创建。使用 LLM 也许可以更高效地建立术语表。例如,许多企业使用的是互联网上不常用的专业术语,而 LLM 可能不知道这些术语。此外,还有许多术语可能有多种翻译方式。例如,「open source」在西班牙语中可以是「Código abierto」或「Fuente abierta」;两者都可以,但最好选择一个并在单个文档中坚持长期使用。

术语表的使用和实施。将术语表包含在 prompt 中最好的方式是什么?

在不同语言上进行评估。翻译智能体在不同语言中的表现会发生怎样的变化?有没有通过一些变动,使其在特定源语言或目标语言上表现更好的方法?(请注意,对于 MT 系统正在接近的较高性能水平,BLEU 是否是一个很好的度量标准仍是不确定的。)此外,对于资源较少的语言,它的性能表现仍需要进一步研究。

错误分析。吴恩达团队发现此应用程序对于一些指定语言和国家 / 地区(例如,「在墨西哥作为普通话的西班牙语」)来说效果很好。除此之外,当前方法在哪些方面仍存有不足?翻译智能体在专业主题(如法律、医学)或特殊文本类型(如电影字幕)上的性能表现如何?存在怎样的限制?

更好的评估指标。吴恩达认为对 AI 智能体翻译进行更好的评估是一个巨大且重要的研究课题。与其他生成自由文本的 LLM 应用程序一样,当前的评估指标似乎并不足够评估翻译智能体的表现。例如,他们发现:即使在主动型工作流程在捕捉上下文和术语方面表现更好的文档上,仍会导致人类评分者更喜欢当前的商业产品,但是在句子级别进行评估(使用 FLORES 数据集)时,主动型系统的 BLEU 得分则较低。在设计出更好的度量标准(也许使用 LLM 评估翻译?)以在文档水平上更好地实现与人类偏好相关的翻译质量仍需更多的努力。

值得注意的是,一些学术研究小组也开始关注基于 LLM 和主动型翻译的研究。

对于 AI 翻译智能体的前景,吴恩达认为这个领域还处于起步阶段,并分享了一些相关的学术论文供大家参考。

论文标题:ChatGPT MT: Competitive for High- (but not Low-) Resource Languages

论文地址:https://arxiv.org/pdf/2309.07423

论文标题:How to Design Translation Prompts for ChatGPT: An Empirical Study

论文地址:https://arxiv.org/pdf/2304.02182v2

论文标题:Beyond Human Translation: Harnessing Multi-Agent Collaboration for Translating Ultra-Long Literary Texts

论文地址:https://arxiv.org/pdf/2405.11804

吴恩达此次开源的翻译智能体仍处于初级阶段,但已在机器翻译数据集上有了较好的表现,为 AI 智能体的下一步发展注入了又一剂强心针。

参考链接:https://github.com/andrewyng/translation-agent

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
马航370并非意外失联,前美中情局特工说出真相后,车祸身亡

马航370并非意外失联,前美中情局特工说出真相后,车祸身亡

南冥那只猫
2025-03-05 21:11:34
健身圈最火的56张图,简单科学!健身房再也不用问人了

健身圈最火的56张图,简单科学!健身房再也不用问人了

健身S叔
2026-03-29 10:19:59
西班牙宣布与以色列断绝外交关系。

西班牙宣布与以色列断绝外交关系。

阿七说史
2026-04-01 15:51:46
毛主席写给周总理的书信曝光,钢笔字风采依旧!

毛主席写给周总理的书信曝光,钢笔字风采依旧!

书画相约
2026-03-31 08:34:23
比塔泽害人不浅!兰代尔被他拉倒造成脚踝高位扭伤:至少缺阵两周

比塔泽害人不浅!兰代尔被他拉倒造成脚踝高位扭伤:至少缺阵两周

罗说NBA
2026-04-03 05:56:30
河南帅哥“小根”去世!年仅37岁,因感情染上酒瘾,妈妈酒中兑水

河南帅哥“小根”去世!年仅37岁,因感情染上酒瘾,妈妈酒中兑水

离离言几许
2026-04-02 14:56:50
国足前队长:我们很难学到日本足球的精髓!差距太大 别自欺欺人

国足前队长:我们很难学到日本足球的精髓!差距太大 别自欺欺人

念洲
2026-04-02 11:56:43
意大利、挪威、西班牙、比利时、瑞典等15国,发表联合声明

意大利、挪威、西班牙、比利时、瑞典等15国,发表联合声明

鲁中晨报
2026-04-03 06:57:18
孙颖莎击败蒯曼,球迷暖心鼓励,温瑞博将淘汰?王楚钦战小勒布伦

孙颖莎击败蒯曼,球迷暖心鼓励,温瑞博将淘汰?王楚钦战小勒布伦

七七自驾游
2026-04-03 09:53:15
张雪和陈光标杠上了!自曝太多资本找上门,让他们支持造国产飞机

张雪和陈光标杠上了!自曝太多资本找上门,让他们支持造国产飞机

何嗀爱捕渔
2026-04-03 10:04:28
排队一个半小时仍无法进入景区,游客大喊“退票”!湖州龙之梦景区回应

排队一个半小时仍无法进入景区,游客大喊“退票”!湖州龙之梦景区回应

齐鲁壹点
2026-04-02 19:13:29
孙颖莎2-7为何还能大逆转?内情曝光,赛后一番话听着太揪心

孙颖莎2-7为何还能大逆转?内情曝光,赛后一番话听着太揪心

体育就你秀
2026-04-03 08:08:55
美FBI局长、陆军部长、劳工部长,恐被解职

美FBI局长、陆军部长、劳工部长,恐被解职

新浪财经
2026-04-03 10:33:07
内维尔:爵爷曾让我邀杰拉德来曼联,那是我听过最礼貌的滚蛋

内维尔:爵爷曾让我邀杰拉德来曼联,那是我听过最礼貌的滚蛋

懂球帝
2026-04-03 02:09:02
傲慢出圈!姆巴佩无视老将尊严,指示队友夺坎特袖标,球迷:败人品

傲慢出圈!姆巴佩无视老将尊严,指示队友夺坎特袖标,球迷:败人品

侧身凌空斩
2026-04-03 03:33:12
莫雷托:巴斯托尼已同意加盟巴萨,正在谈个人合同

莫雷托:巴斯托尼已同意加盟巴萨,正在谈个人合同

懂球帝
2026-04-03 06:24:06
日本人妻直播与榜一大粉亲密互动2年,竟意外发现对方是老公养的小三,连孩子都生俩了…

日本人妻直播与榜一大粉亲密互动2年,竟意外发现对方是老公养的小三,连孩子都生俩了…

东京新青年
2026-04-02 18:24:00
林青霞亲口爆料:当年我全裸给他看,他却吓得扭头就跑!

林青霞亲口爆料:当年我全裸给他看,他却吓得扭头就跑!

达文西看世界
2026-03-04 15:07:30
杨小伟被逮捕!

杨小伟被逮捕!

农民日报
2026-04-02 10:16:33
飙升第4!深圳8连胜大胜终结广厦7连胜 王浩然32分创生涯新高

飙升第4!深圳8连胜大胜终结广厦7连胜 王浩然32分创生涯新高

醉卧浮生
2026-04-02 21:26:07
2026-04-03 11:16:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12668文章数 142605关注度
往期回顾 全部

科技要闻

SpaceX冲刺2万亿美元估值,马斯克野心太大

头条要闻

郑丽文顶住压力毅然访陆 洪秀柱表态发文力挺

头条要闻

郑丽文顶住压力毅然访陆 洪秀柱表态发文力挺

体育要闻

冲击世界杯失败,80岁老帅一气之下病倒了

娱乐要闻

田亮一家新年全家福!森碟变清纯少女

财经要闻

全球石油危机或将蔓延

汽车要闻

大众严选 何惧"定终身"

态度原创

健康
家居
数码
本地
公开课

干细胞抗衰4大误区,90%的人都中招

家居要闻

温馨多元 爱的具象化

数码要闻

部分三星Bespoke洗烘一体机出现故障,海外用户更新后无法洗衣服

本地新闻

从学徒到世界冠军,为什么说张雪的底气在重庆?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版