网易首页 > 网易号 > 正文 申请入驻

谷歌研究人员通过更多数据集提升语音识别准确率

0
分享至

如果提高语音识别准确率的关键是简单地将所有可用的语音数据集混合在一起训练一个大型的人工智能模型呢?这就是谷歌Research和谷歌Brain下属的一个研究团队最近发表的一项研究背后的假设。他们声称,一个名为SpeechStew的AI模型在一系列语音语料上进行训练,在各种语音识别基准上达到了最先进或接近最先进的结果。

在更多的数据上训练模型往往是困难的,因为收集和注释新数据是昂贵的,特别是在语音领域。此外,对AI社区的许多成员来说,训练大型模型是昂贵和不切实际的。

为了寻求解决方案,谷歌的研究人员将社区多年来策划的所有可用的有标签和无标签的语音识别数据进行了整合。他们借鉴了AMI,一个包含约100小时会议录音的数据集,以及包括Switchboard(约2000小时的电话)、Broadcast News(50小时的电视新闻)、Librispeech(960小时的有声读物)和Mozilla的众包Common Voice在内的语料库。他们的综合数据集有超过5000小时的语音,没有一个是在原始形式下进行调整的。

研究人员利用组装好的数据集,使用谷歌云TPU来训练SpeechStew,得出了一个拥有超过1亿个参数的模型。在机器学习中,参数是模型在训练过程中学习到的数据属性。研究人员还训练了一个10亿参数的模型,但它的性能下降了。

一旦团队有了一个通用的SpeechStew模型,他们在一些基准上进行了测试,发现它不仅优于之前开发的模型,而且表现出了适应挑战性新任务的能力。利用Chime-6这个由麦克风记录的40小时家庭远距离对话数据集,研究人员对SpeechStew进行了微调,以达到与更复杂的模型一致的准确性。

迁移学习需要用较少的数据将知识从一个领域转移到另一个领域,它在人工智能的许多子领域显示出了希望。比如,通过使用一个旨在理解一般语音的模型,并在边缘处进行改进,人工智能就有可能理解不同口音和环境下的语音。

当记者通过电子邮件询问像SpeechStew这样的语音模型如何在生产中使用——比如在消费设备或云API中——研究人员拒绝猜测。但他们设想这些模型可以作为通用的表示,可以转移到任何数量的下游语音识别任务中。

研究人员说:”这种对通用模型进行微调以适应新的下游语音识别任务的简单技术简单、实用,但效果惊人。重要的是要认识到,其他数据源的分布并不完全匹配感兴趣的数据集。但只要有一些共同的表示方式需要解决这两个任务,我们就可以希望通过结合这两个数据集来实现改进结果。“

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
9分+9分+13分!CBA争议内线给机会就爆发,或成杜锋抗辽奇兵

9分+9分+13分!CBA争议内线给机会就爆发,或成杜锋抗辽奇兵

老陆侃球
2024-04-26 15:18:42
中国的出生率,永远都不会回来了

中国的出生率,永远都不会回来了

请辩
2024-04-23 13:50:49
按现在的背包扩容速度,2045年时魔兽的背包就是这么大了

按现在的背包扩容速度,2045年时魔兽的背包就是这么大了

苹果牛看游戏
2024-04-26 10:04:23
今日A股紧急通知,刚刚出现一个关键信号,A股重大变盘即将来袭

今日A股紧急通知,刚刚出现一个关键信号,A股重大变盘即将来袭

彩云的夕阳
2024-04-26 04:15:03
三场比赛拉胯两场,湖人在今年夏天可能都不想继续保留拉塞尔了?

三场比赛拉胯两场,湖人在今年夏天可能都不想继续保留拉塞尔了?

稻谷与小麦
2024-04-26 15:32:01
新华社消息|学位法通过,2025年1月1日起施行

新华社消息|学位法通过,2025年1月1日起施行

新华社
2024-04-26 11:28:45
王小洪:中缅联合打击电信网络诈骗犯罪取得标志性重大战果

王小洪:中缅联合打击电信网络诈骗犯罪取得标志性重大战果

新京报
2024-04-25 21:27:43
武统、和统都有难处?台湾军事专家:中国大陆已经走上第三条路

武统、和统都有难处?台湾军事专家:中国大陆已经走上第三条路

懂体育的小吖头
2024-04-25 09:20:29
奥运开幕不足100天,法国有点慌:开幕式阵仗太大,搞不定了

奥运开幕不足100天,法国有点慌:开幕式阵仗太大,搞不定了

路平说
2024-04-25 11:23:08
上海夫妻200万买2000吨大船,在长江上往来运货,船夫生活意想不到

上海夫妻200万买2000吨大船,在长江上往来运货,船夫生活意想不到

今日搞笑分享
2024-04-25 07:35:23
马斯克的猫女机器人要来了,会做家务生孩子

马斯克的猫女机器人要来了,会做家务生孩子

新行情
2024-04-25 17:21:20
CBA最新消息!萨林杰正式离队,周鹏确定续约,许梦君合同到期

CBA最新消息!萨林杰正式离队,周鹏确定续约,许梦君合同到期

体坛瞎白话
2024-04-25 16:14:07
太炸裂!阿尔巴尼亚新闻女主播西装内搭空气出镜,胸前引发争议

太炸裂!阿尔巴尼亚新闻女主播西装内搭空气出镜,胸前引发争议

清欢渡语
2024-04-25 21:49:40
浙江义乌母女三人生不如死 公检法集体失职

浙江义乌母女三人生不如死 公检法集体失职

资说
2024-04-25 22:36:44
曝曼联3700万可签拜仁铁卫,其四天两度染红已失宠!费迪南德推荐

曝曼联3700万可签拜仁铁卫,其四天两度染红已失宠!费迪南德推荐

罗米的曼联博客
2024-04-26 10:50:50
王毅同布林肯举行会谈:美方不要打压中国的发展

王毅同布林肯举行会谈:美方不要打压中国的发展

俄罗斯卫星通讯社
2024-04-26 15:02:10
吴昕,怎么突然火了?

吴昕,怎么突然火了?

宛沐
2024-04-25 14:50:48
比恒大还大的雷区出现了,价值高达10万亿,这回许家印可不孤单了

比恒大还大的雷区出现了,价值高达10万亿,这回许家印可不孤单了

简读视觉
2024-04-13 08:40:03
今日!五大突发利好!

今日!五大突发利好!

中国基金报
2024-04-26 15:45:23
董卿含泪说出孩子的亲生父亲,来头如此之大,难怪不愿公开

董卿含泪说出孩子的亲生父亲,来头如此之大,难怪不愿公开

娱乐圈酸柠檬
2024-04-24 07:10:14
2024-04-26 16:08:49
创作者_14JK
创作者_14JK
提供加美最新高新科技资讯动态
273文章数 29关注度
往期回顾 全部

科技要闻

中国车企“五常”激战北京车展

头条要闻

为抗议美国对加沙政策 美国务院发言人辞职

头条要闻

为抗议美国对加沙政策 美国务院发言人辞职

体育要闻

库里当选最佳关键球员 10项数据联盟第一

娱乐要闻

金靖回应不官宣恋情结婚的原因

财经要闻

24年后再产纯净水 农夫山泉为何要打自己脸

汽车要闻

2024北京车展 比亚迪的自驱力让对手紧追猛赶

态度原创

健康
时尚
亲子
游戏
手机

这2种水果可降低高血压死亡风险

减龄又清爽的夏季穿搭!爱美女人照着搭配真好看,优雅显气质

亲子要闻

初三女生遭两次霸凌试图割喉求生引众怒:罚的还是太轻了!

腾讯《剑灵》怀旧服已上线!原汁原味还原经典版本

手机要闻

曝三星即将发布首款折叠屏“Ultra”设备 搭载骁龙8 Gen3

无障碍浏览 进入关怀版