网易首页 > 网易号 > 正文 申请入驻

史上最全的AI 翻译模型来了!支持 1600 种语言

0
分享至

在这个AI大航海时代,我们似乎每天都在见证新的奇迹,但一个现实却鲜少被提及:全球7000多种语言中,绝大多数在AI的世界里是隐形的。当下的语音识别系统,大多只偏爱那些拥有海量数据的主流语言。


现在,Meta的基础人工智能研究(FAIR)团队决定做点不一样的。他们近日正式推出了Omnilingual ASR,一个雄心勃勃的自动语音识别系统。

它的目标简单粗暴:听懂这个星球上的大多数人。


Omnilingual ASR的第一个数字就足够震撼:它能够转录超过1600种口语语言。

让我们花点时间消化一下这个数字。大多数人甚至无法在地图上指出1600种语言的分布地。更关键的是,Meta指出,在这1600种语言中,有整整500种,以前从未被任何人工智能系统覆盖过。

这不仅仅是量变,这是在AI版图上点亮了500个全新的、此前完全黑暗的区域。FAIR团队明确表示,他们的目标是迈向一个真正的“通用转录系统”,弥合现有AI工具在语言覆盖上的巨大鸿沟。


当然,科技圈的看客们都是老江湖了,覆盖面广不代表体验好。如果一个系统能听懂1600种语言,但每种都错得离谱,那也只是个昂贵的玩具。

Omnilingual ASR的性能数据看起来相当扎实:

在它支持的1600种语言中,有高达78%的语言实现了低于10个字符的错误率(CER)。这是一个在实际应用中基本可用的标准。

对于那些资源丰富的语言(拥有至少10小时的训练音频),这个标准(低于10 CER)的覆盖率达到了惊人的95%。

真正的考验在于低资源语言(音频时长不足10小时)。即便如此,Omnilingual ASR依然为其中36%的语言提供了低于10 CER的可用转录,这对于那些几乎被数字世界遗忘的群体来说,意义重大。


Omnilingual ASR的杀手锏,是一种被称为“自带语言”的选项。

这个功能巧妙地借鉴了大型语言模型(LLM)中流行的“情境学习”(In-context Learning)技术。这意味着用户不再需要祈祷Meta的下一次更新能包含自己的母语。

相反,用户只需提供极少量的音频和文本配对样本——比如几分钟的录音和对应的文字——系统就能直接从这些样本中“现场学习”一门新语言。整个过程不需要伤筋动骨的重新训练,也不需要消耗海量的计算资源。

Meta表示,从理论上讲,这种方法有望将Omnilingual ASR的覆盖范围从1600种一举扩展到超过5400种。这几乎是在向全球7000多种语言的终极目标发起了冲锋。


按照FAIR团队的传统,这么好的东西,当然要开源。Meta这次提供了一个完整的“开源生态位”:

模型开源:Omnilingual ASR基于PyTorch的fairseq2框架构建,以Apache 2.0许可证发布。这意味着什么?意味着从研究人员到开发者,甚至商业公司,都可以自由使用、修改和构建自己的应用。模型提供了从3亿参数(适用于低功耗设备)到70亿参数(追求“顶级准确度”)的多种版本,任君选择。

数据集发布:Meta同步推出了“全语言自动语音识别语料库”(Omnilingual ASR Corpus)。这是一个包含了350种代表性不足语言的大型转录语音数据集,以CC-BY(知识共享署名许可)协议发布。

Meta此举,无异于向全球开发者社区发出邀请:工具和数据都在这里了,请尽情发挥,为你们的本地社区构建真正好用的工具。

总而言之,Omnilingual ASR的推出,是打破全球语言壁垒的重要一步。它不仅是技术上的炫技,更是在AI普惠化和全球语言平等方面,投下了一块沉甸甸的压舱石。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
11天抗议无效,高市更猖狂,自卫队发布挑衅视频,还搬来救兵!

11天抗议无效,高市更猖狂,自卫队发布挑衅视频,还搬来救兵!

科普100克克
2025-11-19 00:49:23
日本一飞机坠毁,机上人员全部遇难

日本一飞机坠毁,机上人员全部遇难

中国基金报
2025-11-18 21:21:51
“反华”声再开始?G7撑不住了,7国连开2天大会,联手审判中国

“反华”声再开始?G7撑不住了,7国连开2天大会,联手审判中国

通文知史
2025-11-17 23:00:03
张博恒单杠失误瞬间一裁判鼓掌大笑遭质疑,官方回应:涉事裁判员终止比赛执裁资格

张博恒单杠失误瞬间一裁判鼓掌大笑遭质疑,官方回应:涉事裁判员终止比赛执裁资格

台州交通广播
2025-11-18 23:35:12
这菜再贵也要吃,现正大量上市,通便排毒、杀菌消炎,别不懂吃!

这菜再贵也要吃,现正大量上市,通便排毒、杀菌消炎,别不懂吃!

阿龙美食记
2025-11-17 13:59:43
乘客:“师傅,平台说你车发生故障”,司机听后秒懂一切!

乘客:“师傅,平台说你车发生故障”,司机听后秒懂一切!

吃货的分享
2025-11-19 00:41:43
亚洲杯预选赛:1-2,中国香港遭世界第155逆转,首败+丢榜首宝座

亚洲杯预选赛:1-2,中国香港遭世界第155逆转,首败+丢榜首宝座

侧身凌空斩
2025-11-18 21:57:20
21分钟破万台!又一王炸新车上市

21分钟破万台!又一王炸新车上市

汽车工程师
2025-11-19 00:07:03
16名台湾游客点披萨被骂“狗屎中国人”!市政府“灭火”

16名台湾游客点披萨被骂“狗屎中国人”!市政府“灭火”

意烩
2025-11-18 01:35:04
李连杰风波后再发声,动作奇怪口音都变了,外媒披露基因疗法

李连杰风波后再发声,动作奇怪口音都变了,外媒披露基因疗法

古希腊掌管月桂的神
2025-11-17 13:59:26
学霸人设崩塌?离婚玩失联、转移财产,真相不止是渣!

学霸人设崩塌?离婚玩失联、转移财产,真相不止是渣!

毒舌八卦
2025-11-18 20:49:45
日本,拿出诚意再来!

日本,拿出诚意再来!

国是直通车
2025-11-18 21:10:04
人社部:技能等级挂钩薪资

人社部:技能等级挂钩薪资

每日经济新闻
2025-11-18 13:23:13
初婚人口跌破1000万

初婚人口跌破1000万

谭谈投研
2025-11-17 12:17:54
61岁香港知名演员赌博输光家产,欠百亿巨债跑路?本人现身回应

61岁香港知名演员赌博输光家产,欠百亿巨债跑路?本人现身回应

枫尘余往逝
2025-11-17 21:49:36
11月18日俄乌:高达1357亿欧元的乌克兰融资方案

11月18日俄乌:高达1357亿欧元的乌克兰融资方案

山河路口
2025-11-18 15:44:42
前拉玛西亚队友:梅西做的那些动作,他在小时候就能做

前拉玛西亚队友:梅西做的那些动作,他在小时候就能做

懂球帝
2025-11-19 00:22:18
陈海强出任浙商银行党委书记,拟任董事长

陈海强出任浙商银行党委书记,拟任董事长

鲁中晨报
2025-11-18 19:03:04
医生发现:天冷坚持戴帽子的人,过不了半年,身体或会出现4大变化

医生发现:天冷坚持戴帽子的人,过不了半年,身体或会出现4大变化

感觉会火
2025-11-17 12:13:41
江门市一个占地228亩的造纸厂拍卖,被成立一周的新公司1.2亿竞得

江门市一个占地228亩的造纸厂拍卖,被成立一周的新公司1.2亿竞得

天天话事
2025-11-18 12:01:27
2025-11-19 01:59:00
PConline太平洋科技 incentive-icons
PConline太平洋科技
深度剖析未来趋势,实用解答科技疑惑,趣味呈现科技魅力!
37518文章数 864563关注度
往期回顾 全部

科技要闻

谷歌CEO警告:若AI泡沫破裂,没公司能幸免

头条要闻

孟加拉国前总理哈西娜被判死刑 中方回应

头条要闻

孟加拉国前总理哈西娜被判死刑 中方回应

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

宋佳夺影后动了谁的奶酪

财经要闻

中美机器人爆发了一场论战

汽车要闻

硬核配置旗舰气场 岚图泰山售37.99万起

态度原创

教育
时尚
亲子
手机
游戏

教育要闻

TTS新传论文带读:是什么样伟大的前程,值得我们把四季都错过...

秋天穿衣暂时没灵感?赶紧看看这27套穿搭,舒适自然又大方

亲子要闻

最能干活的那批人回来了 孟婆汤的质量越来越差了

手机要闻

红米K90至尊版突然被确认:大屏高刷+超帧生态,是否值得期待?

猎魂世界:尘心列传活动及打法分析!披的这层袈裟还得再修炼!

无障碍浏览 进入关怀版