网易首页 > 网易号 > 正文 申请入驻

Meta开源史上最强语音“基座模型”:一口气支持1600+种语言

0
分享至


刚刚,Meta AI FAIR团队发布了其在自动语音识别(ASR)领域的最新成果:Omnilingual ASR

这是一个模型套件,能为超过1600种语言提供自动语音识别能力,其规模和质量都达到了新的水平。

值得关注的是,该框架被设计为社区驱动,世界各地的人们只需提供少量自己的样本,就能将Omnilingual ASR扩展到新的语言

同时开源的,还有一系列相关:

Omnilingual ASR Corpus:一个包含350种服务欠缺语言的转录语音的大型数据集

Omnilingual wav2vec 2.0:一个扩展到70亿参数的、大规模多语言语音表征模型

语言探索Demo:一个可供人们探索模型所覆盖语言的演示

目前,大多数ASR系统都集中在互联网上资源丰富的一小部分语言上,这加剧了低资源语言使用者面临的数字鸿沟

Meta FAIR团队推出的Omnilingual ASR,旨在通过一个通用转录系统,让高质量的语音转文本技术能够惠及代表性最不足的语言社区。其最终目标是打破语言障碍,实现跨语言和文化背景的交流

下载:

https://github.com/facebookresearch/omnilingual-asr

语言探索demo:

https://aidemos.atmeta.com/omnilingualasr/language-globe


转录工具:

https://huggingface.co/spaces/facebook/omniasr-transcriptions

paper:

https://ai.meta.com/research/publications/omnilingual-asr-open-source-multilingual-speech-recognition-for-1600-languages/

前所未有的语言覆盖范围与性能

尽管ASR技术近年来在许多高资源语言上已接近完美,但扩大语言覆盖范围一直是一项资源密集型任务,现有AI架构对数据的需求过高,难以实现通用扩展。

Omnilingual ASR通过引入两种架构变体来解决这一研究瓶颈。

首先,团队首次将其wav2vec 2.0语音编码器扩展到70亿参数,从原始、未转录的语音数据中生成了丰富的、大规模多语言语义表征。

接着,团队构建了两种解码器变体,将这些表征映射到字符序列:

1.一种依赖传统的连接主义时间分类(CTC)目标。
2.另一种利用了在LLM中常见的传统Transformer解码器。

这种被称为LLM-ASR的方法,在ASR性能上实现了阶段性提升,尤其是在长尾语言上。

结果显示,其7B-LLM-ASR系统在超过1600种语言上达到了SOTA性能,其中78%的语言字符错误率(CER)低于10


自带语言(Bring Your Own Language)

除了扩展到1600多种语言外,Omnilingual ASR还改变了引入新语言的范式。

在大多数现有系统中,添加新语言需要专家驱动的微调。而Omnilingual ASR引入了首个能够仅凭少量上下文示例就扩展到全新语言的大规模ASR框架

这得益于其受LLM启发的系统,该系统从大语言模型领域引入了上下文学习能力

在实践中,这意味着一个使用不支持语言的用户,只需提供少数几个成对的音频-文本样本,就能获得可用的转录质量——无需大规模训练数据、专业知识或高端计算资源


一套面向不同用例的模型

此次,Meta发布了一整套模型和一个数据集,为利益相关者扩展和改进任何语言的语音技术提供了所需的一切。

模型家族:提供两种解码器变体,从专为低功耗设备设计的轻量级300M版本,到为各种用例提供顶级精度的强大7B模型

基础模型:通用语音基础模型wav2vec 2.0也提供多种尺寸,可用于ASR之外的其他语音相关任务。

所有模型均在许可宽松的Apache 2.0许可下发布,数据则在CC-BY许可下提供。这些资产基于FAIR的开源fairseq2框架构建

与全球合作伙伴共建

Omnilingual ASR的训练语料库在数量和语言多样性上都是为ASR组建的最大语料库之一,整合了公开可用的数据集和通过多个合作伙伴关系收集的社区来源语音记录。

为了覆盖那些几乎没有数字足迹的语言,团队与当地组织合作,招募并补偿母语者,通常是在偏远或记录不足的地区。这部分委托收集的训练语料库作为Omnilingual ASR Corpus发布。迄今为止,这是有史以来最大的超低资源自然语音ASR数据集,覆盖了数百种ASR系统前所未见的语言。

此外,通过语言技术合作伙伴计划,团队与Mozilla基金会的Common Voice和Lanfrica/NaijaVoices等组织合作,直接与当地社区协作。这些合作关系为Omnilingual ASR注入了深厚的语言学知识和文化理解,确保技术能满足当地需求

参考:

https://ai.meta.com/blog/omnilingual-asr-advancing-automatic-speech-recognition/?utm_source=twitter&utm_medium=organic_social&utm_content=video&utm_campaign=omnilingual

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
81年我提干当了排长,回家探亲去看望公社书记,他把女儿许配给我

81年我提干当了排长,回家探亲去看望公社书记,他把女儿许配给我

人间百态大全
2025-12-06 06:40:03
1950 年胡兰成获北京任职邀,北上上海想通后偷渡日本保命

1950 年胡兰成获北京任职邀,北上上海想通后偷渡日本保命

唠叨说历史
2026-01-30 14:29:18
蒂格:没人能防住41岁詹姆斯!约翰逊:詹姆斯统治NBA二十年!

蒂格:没人能防住41岁詹姆斯!约翰逊:詹姆斯统治NBA二十年!

氧气是个地铁
2026-02-03 18:34:47
仅6分钟19个导弹连全军覆没,82架战机被击落给我们敲响警钟

仅6分钟19个导弹连全军覆没,82架战机被击落给我们敲响警钟

阿光的技巧课堂
2026-02-02 23:59:53
随着比分定格1-0,沙特联榜首易主:C罗的主队豪取5连胜升至第一

随着比分定格1-0,沙特联榜首易主:C罗的主队豪取5连胜升至第一

侧身凌空斩
2026-02-03 01:39:51
7岁女孩吃完自助餐,衣兜撑满,店员怀疑偷拿!翻开衣兜后,在场所有人哭了…

7岁女孩吃完自助餐,衣兜撑满,店员怀疑偷拿!翻开衣兜后,在场所有人哭了…

品读时刻
2026-02-03 09:08:37
舒畅举报了两人:除了郝伟,另一人吴志东在20年前就被举报黑哨

舒畅举报了两人:除了郝伟,另一人吴志东在20年前就被举报黑哨

姜大叔侃球
2026-02-02 23:06:50
章泽天带宝贝女儿参加伦敦音乐节,母女俩秀发靓丽漂亮得体太可爱

章泽天带宝贝女儿参加伦敦音乐节,母女俩秀发靓丽漂亮得体太可爱

草莓解说体育
2026-02-03 16:55:36
炸场!iPhone18系列终极确认:全系不涨价+发布时间敲定

炸场!iPhone18系列终极确认:全系不涨价+发布时间敲定

小柱解说游戏
2026-02-02 00:14:37
结束!一球前锋险成标王,曼联三进三出零收获,曼城两新援冲四冠

结束!一球前锋险成标王,曼联三进三出零收获,曼城两新援冲四冠

嗨皮看球
2026-02-03 18:38:12
Siegel:国王在谈判中提出蒙克&德罗赞,但对勇士毫无吸引力

Siegel:国王在谈判中提出蒙克&德罗赞,但对勇士毫无吸引力

林子说事
2026-02-03 13:13:07
1996年张万年冒大雪到五台山,问一小和尚:你原来哪部队,咋来这

1996年张万年冒大雪到五台山,问一小和尚:你原来哪部队,咋来这

云霄纪史观
2026-02-02 05:34:41
国共智库论坛,探索“一国两制”中的“一国一制”

国共智库论坛,探索“一国两制”中的“一国一制”

观察者网
2026-02-02 11:39:05
中国女篮公布热身赛14人名单:张子宇王思雨加入 李月汝韩旭缺席

中国女篮公布热身赛14人名单:张子宇王思雨加入 李月汝韩旭缺席

醉卧浮生
2026-02-03 11:53:17
大S事件重演?73岁赵雅芝突传去世噩耗,晒照报平安却被扒是库存照

大S事件重演?73岁赵雅芝突传去世噩耗,晒照报平安却被扒是库存照

八星人
2026-02-01 23:25:21
山东小伙娶只有8岁智商的新娘,笑的合不拢嘴,网友:赚大了!

山东小伙娶只有8岁智商的新娘,笑的合不拢嘴,网友:赚大了!

观察鉴娱
2026-02-01 15:02:49
上观:莱昂纳多膝盖受伤,海港可能找一个救火外援

上观:莱昂纳多膝盖受伤,海港可能找一个救火外援

懂球帝
2026-02-03 13:25:10
国投白银LOF今日复牌再度跌停

国投白银LOF今日复牌再度跌停

财联社
2026-02-03 10:34:28
OpenClaw+Kimi K2.5+Moltbook保姆级部署指南,确实可以封神了!

OpenClaw+Kimi K2.5+Moltbook保姆级部署指南,确实可以封神了!

苍何
2026-02-02 19:16:14
新疆发布谈赵睿言论:粉丝撑起你,别伤了他们的心

新疆发布谈赵睿言论:粉丝撑起你,别伤了他们的心

懂球帝
2026-02-03 15:11:05
2026-02-03 20:19:00
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1032文章数 396关注度
往期回顾 全部

科技要闻

1.25万亿美元!xAI员工赢麻了

头条要闻

浙江一对夫妻"网购娃娃菜中毒":合谋意图骗赔

头条要闻

浙江一对夫妻"网购娃娃菜中毒":合谋意图骗赔

体育要闻

“也许我的一小步,会成为中国足球的一大步”

娱乐要闻

小S致词:感谢具俊晔陪伴大S的最后3年

财经要闻

中央一号文件:扎实推进乡村全面振兴

汽车要闻

上汽决定不再等那个“正确答案”了

态度原创

房产
亲子
手机
时尚
公开课

房产要闻

大盘最低杀到8000+/㎡!海口59盘,最新房价曝光!

亲子要闻

当娃会开门后,天天上厕所来凑热闹,网友:给娃熏的脸通红!

手机要闻

掌机电池“缩水”背后,官方补偿了一台新机

冬天还是“羽绒服”最保暖!看看这些穿搭,简单舒适又不老气

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版