网易首页 > 网易号 > 正文 申请入驻

腾讯开源混元MT翻译模型系列

0
分享至

腾讯控股有限公司今天开源了一个新的语言模型系列——混元MT系列,该系列专门针对翻译任务进行了优化。

这家中国科技公司表示,该算法在一个流行的人工智能翻译基准测试中显著超越了谷歌翻译的表现。

混元MT系列包含四个模型。两个旗舰模型混元MT-7B和混元MT-Chimera-7B都拥有70亿个参数。此外还有两个量化或压缩版本的算法,这些版本通过牺牲一些输出质量来降低内存使用量。

腾讯使用四个不同的数据集对模型进行初始训练。前两个数据集包含33种语言编写的文本片段,但不包含任何关于如何执行翻译的信息。另外两个数据集包含数百万个所谓的配对数据,这些记录各自包含一个文本片段和对应的翻译。

根据腾讯的介绍,训练流程不仅为其混元MT模型配备了翻译能力,还提供了大量的通用知识。该公司使用名为MMLU-Pro的通用知识基准测试对算法进行了测试。混元MT显著超越了拥有80亿参数的Llama-3-8B-Base模型。

腾讯在初始训练后进行了强化学习阶段。在项目的这一部分,公司为混元MT模型提供了一系列训练任务,并对其响应质量提供反馈。模型利用这些反馈来提高输出质量。

这种试错学习过程由一个定制的AI模型监督。该模型根据混元MT生成的翻译与原文的语义相似性来评分,同时还考虑其他因素,包括算法处理特定领域术语的能力。

混元MT系列中的第一个AI——混元MT-7B,基于标准的语言模型架构。混元MT-Chimera-7B使用了一种更复杂的处理方法,称为集成学习。

与专家混合模型类似,集成学习算法包含多个神经网络。但专家混合模型只使用其中一个神经网络来处理用户提示,而集成学习使用所有神经网络。它为提示生成多个答案,然后将它们组合成一个更高质量的单一响应。

腾讯使用名为WMT25的AI翻译基准将混元MT与谷歌翻译进行了比较。根据该公司的说法,其模型系列在测试评估的31个语言对中的30个表现更好。在某些情况下,混元MT的得分高出65%。

该模型系列还超越了其他几家AI提供商的算法。腾讯表示,混元MT在WMT25基准测试的大多数语言对中得分高于GPT-4.1和Anthropic公司的Claude 4 Sonnet。

Q&A

Q1:混元MT系列包含哪些模型?

A:混元MT系列包含四个模型。两个旗舰模型混元MT-7B和混元MT-Chimera-7B都拥有70亿个参数,此外还有两个量化或压缩版本的算法,这些版本通过牺牲一些输出质量来降低内存使用量。

Q2:混元MT在翻译基准测试中表现如何?

A:腾讯使用WMT25基准将混元MT与谷歌翻译进行比较,其模型系列在测试评估的31个语言对中的30个表现更好,在某些情况下得分高出65%。同时在大多数语言对中得分也高于GPT-4.1和Claude 4 Sonnet。

Q3:混元MT-Chimera-7B与混元MT-7B有什么区别?

A:混元MT-7B基于标准的语言模型架构,而混元MT-Chimera-7B使用了更复杂的集成学习处理方法。集成学习使用所有神经网络为提示生成多个答案,然后将它们组合成一个更高质量的单一响应。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1-0、2-1,訾晶晶神了:率中国女足连克两大欧洲劲旅,临场调度封神

1-0、2-1,訾晶晶神了:率中国女足连克两大欧洲劲旅,临场调度封神

侧身凌空斩
2026-04-02 04:00:38
北京男篮15分完败,辽宁男篮完胜新疆,山东力克福建重返四强

北京男篮15分完败,辽宁男篮完胜新疆,山东力克福建重返四强

金风说
2026-04-02 00:13:59
澳门世界杯:周启豪2-3被逆转出局,国乒男单多位大将小组赛出局

澳门世界杯:周启豪2-3被逆转出局,国乒男单多位大将小组赛出局

乒谈
2026-04-01 22:52:17
全球飞机WiFi免费潮,中国为何不跟?

全球飞机WiFi免费潮,中国为何不跟?

旅界Pro
2026-04-01 07:47:24
“余生好好走”,知名央视主持人王小丫,病床上的留言字字催泪

“余生好好走”,知名央视主持人王小丫,病床上的留言字字催泪

近史谈
2026-03-31 18:57:49
税收数据显示:今年我国经济发展开局良好、向“新”发展

税收数据显示:今年我国经济发展开局良好、向“新”发展

新华社
2026-04-01 15:53:03
武汉多辆百度萝卜快跑行驶中突然停车,交警通报:系统故障导致

武汉多辆百度萝卜快跑行驶中突然停车,交警通报:系统故障导致

识礁Farsight
2026-04-01 09:34:04
上海交大校庆宣传片踩雷 宝妈性别对比文案翻车 校方一夜删片

上海交大校庆宣传片踩雷 宝妈性别对比文案翻车 校方一夜删片

快科技
2026-04-01 07:26:09
雍正王朝穿帮镜头:康熙戴劳力士忍了,乔引娣穿球鞋真忍不了

雍正王朝穿帮镜头:康熙戴劳力士忍了,乔引娣穿球鞋真忍不了

杰丝聊古今
2026-03-29 07:16:55
现役豪赌最成功球员,没进过全明星,却敢拒绝8000万,今赚到3亿

现役豪赌最成功球员,没进过全明星,却敢拒绝8000万,今赚到3亿

大西体育
2026-04-01 22:22:18
罗伯逊胜霍金斯,特鲁姆普战平墨菲晋级四强

罗伯逊胜霍金斯,特鲁姆普战平墨菲晋级四强

章民解说体育
2026-04-02 01:42:15
感人,湖人队雷迪克取得执教生涯第100场胜利后收到儿子们的祝福

感人,湖人队雷迪克取得执教生涯第100场胜利后收到儿子们的祝福

好火子
2026-04-02 05:22:03
韩国:3月30日起,对北京14个城市中国居民签发十年多次往返签证

韩国:3月30日起,对北京14个城市中国居民签发十年多次往返签证

南权先生
2026-04-01 15:42:41
地方附加税法加速制定 专家:地方政府急需新税种

地方附加税法加速制定 专家:地方政府急需新税种

经济观察报
2026-04-01 17:02:21
随着周瑾彤世界波+比分2-1,中国女足胜英格兰之后,再胜欧洲劲旅

随着周瑾彤世界波+比分2-1,中国女足胜英格兰之后,再胜欧洲劲旅

侧身凌空斩
2026-04-02 03:22:38
炸锅!皇马或出售核心天才,阿森纳火速介入,三大豪门疯抢

炸锅!皇马或出售核心天才,阿森纳火速介入,三大豪门疯抢

澜归序
2026-04-02 04:00:03
今麦郎董事长回应“手打挂面的‘手打’是商标”:该商标已用了20年,4月2日凌晨起停产相关产品

今麦郎董事长回应“手打挂面的‘手打’是商标”:该商标已用了20年,4月2日凌晨起停产相关产品

封面新闻
2026-04-02 05:07:12
部分期货品种夜盘收盘 几乎全线下跌

部分期货品种夜盘收盘 几乎全线下跌

财联社
2026-04-01 23:07:05
张小雷涉案1554亿,为4情妇挥霍2亿自食恶果

张小雷涉案1554亿,为4情妇挥霍2亿自食恶果

徐云流浪中国
2026-02-16 16:07:51
早期孟子义长这样,这谁还能认得出?

早期孟子义长这样,这谁还能认得出?

木子爱娱乐大号
2026-04-01 10:19:03
2026-04-02 06:23:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
17345文章数 49696关注度
往期回顾 全部

科技要闻

甲骨文血洗3万人,47人团队仅留3人

头条要闻

伊朗自杀无人机突进北印度洋 逼退“林肯”号航母

头条要闻

伊朗自杀无人机突进北印度洋 逼退“林肯”号航母

体育要闻

NBA扩军,和篮球无关?

娱乐要闻

张婉婷已决定离婚 找律师讨论婚变事宜

财经要闻

电商售械三水光针 机构倒货or假货猖獗?

汽车要闻

三电可靠 用料下本 百万公里的蔚来ES6 拆开看

态度原创

家居
数码
亲子
手机
公开课

家居要闻

经典配色 昼色银河

数码要闻

小米路由器BE7000获1.1.38版本升级,新增专属网络等功能

亲子要闻

女性易孕体质的5个特征,了解一下你中几条?

手机要闻

反向操作:有人给iPhone 17 Pro加回Lightning接口

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版