网易首页 > 网易号 > 正文 申请入驻

阿里千问开源Qwen3-ASR语音识别模型,支持52种语种与方言

0
分享至

IT之家 1 月 29 日消息,阿里千问团队今日正式开源 Qwen3-ASR 系列模型,该模型是由 Qwen 开发的一系列功能强大的语音识别模型,包括两个强大且全面的语音识别模型 Qwen3-ASR-1.7B 与 Qwen3-ASR-0.6B,以及一个创新的语音强制对齐模型 Qwen3-ForcedAligner-0.6B。Qwen3-ASR 系列的语音识别模型支持 52 个语种与方言的语种识别与语音识别。

据官方介绍,依托创新的预训练 AuT 语音编码器与 Qwen3-Omni 基座模型的强大多模态能力,Qwen3-ASR 实现了精准与稳定的语音识别,其 1.7B 模型在中文、英文、中文口音与歌唱识别等场景下达到 SOTA,具有复杂文本识别能力以及强噪声下的稳定性;0.6B 模型在性能与效率上实现了均衡,在保证语音识别准确率的情况下,128 并发异步服务推理能够达到 2000 倍吞吐,即 10 秒钟处理五个小时以上的音频。

强制对齐模型 Qwen3-ForcedAligner-0.6B 是基于 NAR LLM 推理的时间戳预测模型,支持 11 个语种的任意位置的灵活精准的强制对齐,其时间戳预测精度超越传统的 WhisperX,Nemo-Forced-Aligner 等模型,单并发推理 RTF 达到了高效的 0.0089。

阿里千问团队称,希望 Qwen3-ASR 系列模型的开源能够推动语音识别与理解的研究与发展,三个模型的结构与权重、以及一个全面易用的推理框架将一并开源。


模型列表:


IT之家附官方介绍如下:

Qwen3-ASR 核心特性 All-in-one: Qwen3-ASR-1.7B 与 Qwen3-ASR-0.6B 均通过单一模型支持 30 个语种的语种识别与语音识别、22 个中文口音与方言语音识别、多个国家与地区的英文口音识别。 准确而快速的语音识别能力:在复杂的声学环境与文本模式的场景下,Qwen3-ASR 系列模型均能保持稳定鲁棒的语音识别能力,包括歌唱识别等。Qwen3-ASR-1.7B 实现了语音识别准确率的全面领先,在开源与闭源自建评测上较主流开源模型与众多商用 API 上更优。0.6B 模型则实现了性能与效率的均衡,在异步推理模式下,128 并发的该模型能够达到 2000 倍的吞吐,处理 5 个小时的音频仅需要 10 秒。Qwen3-ASR-1.7B 与 Qwen3-ASR-0.6B 均支持流式 / 非流式一体化推理,最长一次性处理 20 分钟的音频。 独创且强大的强制对齐模型:我们推出 Qwen3-ForcedAligner-0.6B,一个支持 11 个语种在 5 分钟之内语音的任意单元的时间戳预测,经评测其时间戳精度超越了一众基于传统端到端方案的强制对齐模型,其非自回归的推理逻辑保证了推理的高效性。 全面且易用的推理与微调工具:除了 Qwen3-ASR 系列模型的结构与权重开源,我们一次性推出强大且全面的推理框架,支持基于 vLLM 的 batch 推理、异步服务、流式推理、时间戳预测功能等。 ASR 模型效果 我们对 Qwen3-ASR 系列模型在中文 / 英文、多语种、中文方言、歌声识别,以及复杂声学与复杂语言场景下进行了系统评估。结果显示,Qwen3-ASR-1.7B 在多个维度的公开与内部基准上取得开源 SOTA;同时对比多家商业公司最新的 ASR API,在若干基准上也取得最佳成绩。具体来说: 英文:不仅在常见公开基准上达到最优,我们还在内部构建的覆盖 16 个国家口音的英文测试集上进行评测,整体表现全面优于 GPT-4o Transcribe、Gemini 系列、Doubao ASR 系列,以及综合能力最强的开源模型 Whisper-large-v3。 多语种:最高支持 30 种语言;在 20 个主流语种上,Qwen3-ASR-1.7B 全面超过现有开源模型,取得最佳平均 WER。 中文与方言:在普通话、粤语及 22 种地区方言上,Qwen3-ASR-1.7B 整体领先商业 API 与开源模型;尤其在方言上,相比 Doubao-ASR 平均错误率再降 20%(15.94 vs 19.85)。 复杂声学 / 语言场景:面对老人 / 儿童语音、极低信噪比、鬼畜重复等挑战场景,仍能稳定输出,保持极低的字 / 词错误率。 歌唱识别:支持带 BGM 的整首歌中 / 英文转写;中文 / 英文分别达到 13.91% / 14.60% 平均 WER。 Qwen3-ASR-0.6B 在性能与效率之间实现了良好平衡:不仅在多项中英文测试基准上表现稳健,而且无论离线还是在线推理,在高并发场景下都能保持极低 RTF 与极高吞吐。例如:单并发下 100 倍加速比;异步服务 128 并发下 2000 倍加速比,10 秒钟处理五个小时音频。 强制对齐模型效果 强制对齐模型 Qwen3-ForcedAligner-0.6B 支持 11 种语言的高精度强制对齐,可在音频中任意位置进行灵活、精准的时间戳标注。与常用主流对齐工具相比,我们在可支持语种覆盖与时间戳预测精度上均取得更优表现,整体超过 WhisperX、NeMo-ForcedAligner(NFA)等方案。

Qwen3-ASR

Github:

HuggingFace:

ModelScope:

Huggingface Demo:

ModelScope Demo:

论文:

阿里云百炼 API:

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
紧急提醒!2026兵役登记强制执行,年满18岁男性务必完成!

紧急提醒!2026兵役登记强制执行,年满18岁男性务必完成!

达文西看世界
2026-01-29 10:01:04
78岁连路都走不稳还开演唱会,全网骂声一片,她却扬言回馈粉丝

78岁连路都走不稳还开演唱会,全网骂声一片,她却扬言回馈粉丝

冷紫葉
2026-01-28 12:26:21
从文学造诣上来看,《滕王阁序》和《岳阳楼记》,到底谁更胜一筹

从文学造诣上来看,《滕王阁序》和《岳阳楼记》,到底谁更胜一筹

铭记历史呀
2026-01-29 18:29:43
顶流金晨要去踩缝纫机了?疑似肇事逃逸找助理顶包,这得踩几年?

顶流金晨要去踩缝纫机了?疑似肇事逃逸找助理顶包,这得踩几年?

社会酱
2026-01-29 17:40:45
英国首相斯塔默访华期间,英国制药巨头阿斯利康宣布将于2030年前在中国投资超千亿元

英国首相斯塔默访华期间,英国制药巨头阿斯利康宣布将于2030年前在中国投资超千亿元

每日经济新闻
2026-01-29 23:30:42
争议!澳网不和谐一幕:乌克兰名将拒合影 萨巴伦卡赛后霸气回应

争议!澳网不和谐一幕:乌克兰名将拒合影 萨巴伦卡赛后霸气回应

大秦壁虎白话体育
2026-01-30 00:34:40
辽宁男篮13分完败,宁波男篮创造历史,赵继伟14中3正负值-18!

辽宁男篮13分完败,宁波男篮创造历史,赵继伟14中3正负值-18!

中国篮坛快讯
2026-01-29 21:34:59
正部级“老虎”孙绍骋被查

正部级“老虎”孙绍骋被查

界面新闻
2026-01-29 20:43:58
斯塔默尝试中餐后,王毅选择在京接待另一贵宾,中英分歧被摆上桌

斯塔默尝试中餐后,王毅选择在京接待另一贵宾,中英分歧被摆上桌

策前论
2026-01-29 17:23:41
欧盟将伊朗伊斯兰革命卫队列为“恐怖组织”

欧盟将伊朗伊斯兰革命卫队列为“恐怖组织”

新华社
2026-01-29 23:20:11
飘了?牢A直播碰瓷罗翔,质疑法律公平性,被调侃是"智商检测器"

飘了?牢A直播碰瓷罗翔,质疑法律公平性,被调侃是"智商检测器"

派大星纪录片
2026-01-29 16:11:48
天津小伙接29岁离婚表嫂同居后续:表嫂正脸照流出曝更多离婚内幕

天津小伙接29岁离婚表嫂同居后续:表嫂正脸照流出曝更多离婚内幕

削桐作琴
2026-01-28 18:17:22
四川女大学生到东北游玩晕倒雪地冻伤,左手三根手指或面临截肢!2300余名爱心人士伸援手

四川女大学生到东北游玩晕倒雪地冻伤,左手三根手指或面临截肢!2300余名爱心人士伸援手

红星新闻
2026-01-29 16:07:17
唏嘘!44岁前国脚被终身禁足 11天前官宣任新帅 曾率队夺中超冠军

唏嘘!44岁前国脚被终身禁足 11天前官宣任新帅 曾率队夺中超冠军

我爱英超
2026-01-29 13:19:06
女子晒外国男友曾曾祖父遗物,疑八国联军侵华血腥证据!血色婚礼的残片

女子晒外国男友曾曾祖父遗物,疑八国联军侵华血腥证据!血色婚礼的残片

可达鸭面面观
2026-01-29 20:28:01
国际金银价格急转直下 白银、黄金分别重挫8%、6%

国际金银价格急转直下 白银、黄金分别重挫8%、6%

财联社
2026-01-29 23:34:34
一周13人伤亡!建议中国游客春节避免前往俄罗斯旅游

一周13人伤亡!建议中国游客春节避免前往俄罗斯旅游

基本常识
2026-01-28 22:17:24
3元续面大结局:民警致电道歉,面馆关了、招牌拆了、生意也没了

3元续面大结局:民警致电道歉,面馆关了、招牌拆了、生意也没了

阿纂看事
2026-01-29 09:36:34
逼急了?网约车司机将车子开到几百公里外深山,公司找到车时已被钢筋插土、胶水粘牢!

逼急了?网约车司机将车子开到几百公里外深山,公司找到车时已被钢筋插土、胶水粘牢!

网约车观察室
2026-01-29 10:13:36
重磅打虎!孙绍骋被查

重磅打虎!孙绍骋被查

新京报政事儿
2026-01-29 18:15:03
2026-01-30 04:24:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
327225文章数 606925关注度
往期回顾 全部

科技要闻

周亚辉的AI新赌局:国内太卷 出海另起炉灶

头条要闻

金晨被指肇事逃逸让助理顶包 律师:顶包者或被判刑

头条要闻

金晨被指肇事逃逸让助理顶包 律师:顶包者或被判刑

体育要闻

詹姆斯哭了!骑士视频致敬41岁超巨

娱乐要闻

曝金晨涉嫌交通肇事逃逸 本人尚未回应

财经要闻

崔东树:中国汽车未来年销或达5000万辆

汽车要闻

车长超5米还带后轮转向 比亚迪海豹08/海狮08将亮相

态度原创

房产
本地
时尚
家居
公开课

房产要闻

寰岛学校卖楼,二次流拍!

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

她穿一身大红参加葬礼,浪漫又感人?真是活久见哪

家居要闻

极简轻奢 家的无限可能

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版