网易首页 > 网易号 > 正文 申请入驻

阿里深夜炸场:首个端到端全模态 AI 模型 Qwen3-Omni 发布开源

0
分享至

IT之家 9 月 23 日消息,又是熟悉的深夜,阿里云今日发布并开源了全新的 Qwen3-Omni、Qwen3-TTS,以及对标谷歌 Nano Banana 图像编辑工具的 Qwen-Image-Edit-2509。

Qwen3-Omni 是业界首个原生端到端全模态 AI 模型,能够处理文本、图像、音频和视频多种类型的输入,并可通过文本与自然语音实时流式输出结果,解决了长期以来多模态模型需要在不同能力之间进行权衡取舍的难题。


Qwen3-Omni 是原生端到端的多语言全模态基础模型,其核心特性主要包括:

  • 跨模态最先进表现:通过早期以文本为核心的预训练和混合多模态训练,模型具备原生多模态能力。在实现强大音频与音视频性能的同时,单模态的文本与图像效果保持不降。在 36 项音频 / 视频基准测试中,22 项达到了最新水平,其中 32 项在开源范围内处于领先;在自动语音识别(ASR)、音频理解与语音对话方面表现可与 Gemini 2.5 Pro 相当。
  • 多语言:支持 119 种文本语言、19 种语音输入语言以及 10 种语音输出语言。
  • 语音输入语言:英语、中文、韩语、日语、德语、俄语、意大利语、法语、西班牙语、葡萄牙语、马来语、荷兰语、印尼语、土耳其语、越南语、粤语、阿拉伯语、乌尔都语。
  • 语音输出语言:英语、中文、法语、德语、俄语、意大利语、西班牙语、葡萄牙语、日语、韩语。
  • 创新架构:基于 MoE(专家混合)的“思考者–表达者”设计,并结合 AuT 预训练以获得强大的通用表征能力,同时采用多码本设计以将延迟降至最低。
  • 实时音频 / 视频交互:低延迟流式交互,支持自然的轮流对话和即时的文本或语音响应。
  • 灵活控制:可通过系统提示词自定义行为,实现细粒度控制与轻松适配。
  • 精细音频描述: Qwen3-Omni-30B-A3B-Captioner 已开源,这是一个通用型、细节丰富、低幻觉率的音频描述模型,填补了开源社区在该领域的空白。


IT之家附官方地址:

  • GitHub:https://github.com/QwenLM/Qwen3-Omni
  • 抱抱脸:https://huggingface.co/collections/Qwen/qwen3-omni-68d100a86cd0906843ceccbe
  • 魔塔:https://modelscope.cn/collections/Qwen3-Omni-867aef131e7d4f
  • Demo:https://huggingface.co/spaces/Qwen/Qwen3-Omni-Demo


TTS 即文本转语音,阿里云此次发布的 TTS 支持 17 种音色选择,每一种音色均支持 10 种语言。其中不仅包含多国语言,有:普通话、英语、法语、德语、俄语、意大利语、西班牙语、葡萄牙语、日语、韩语;还支持了更多中国方言:闽南语、吴语、粤语、四川话、北京话、南京话、天津话和陕西话。



此外,Qwen3-TTS-Flash 在多项评估基准上均取得了 SoTA 的表现,超越 SeedTTS、MiniMax、GPT-4o-Audio-Preview、Elevenlabs,特别是在语音稳定性和音色相似度。

延迟对比Qwen3-TTS-FlashQwen-TTS并发数双卡 12 并发双卡 6 并发首包延迟(单并发)97ms200ms首包延迟(满并发)420ms733ms首包大小(满并发且越大越好)320ms190msRTF(单并发)0.300.43RTF(满并发)0.510.72

官方地址:

  • Demo:https://huggingface.co/spaces/Qwen/Qwen3-TTS-Demo
  • 博客:https://qwen.ai/blog?id=b4264e11fb80b5e37350790121baf0a0f10daf82&;amp;amp;amp;amp;amp;from=research.latest-advancements-list


Qwen-Image-Edit-2509 是 Qwen-Image 月度迭代升级版本,和字节前几天发布的即梦 4.0 图像模型一样主要是一致性上巨大提升。

与 8 月份发布的 Qwen-Image-Edit 相比,Qwen-Image-Edit-2509 的主要改进包括:

  • 多图像编辑支持:对于多图像输入,Qwen-Image-Edit-2509 基于 Qwen-Image-Edit 架构,并通过图像拼接进一步训练,以实现多图像编辑。它支持各种组合,如“人 + 人”、“人 + 产品”和“人 + 场景”。目前在 1 到 3 张输入图像时表现最佳。
  • 增强的单图像一致性:对于单图像输入,Qwen-Image-Edit-2509 显著提高了编辑的一致性,特别是在以下方面:
  • 改进的人像编辑一致性:更好地保留面部身份,支持各种肖像风格和姿势变换;
  • 改进的产品编辑一致性:更好地保留产品身份,支持产品海报编辑;
  • 改进的文字编辑一致性:除了修改文字内容外,还支持编辑文字字体、颜色和材质;
  • 原生支持 ControlNet:包括深度图、边缘图、关键点图等。


官方地址:

  • 博客:https://qwen.ai/blog?id=7a90090115ee193ce6a7f619522771dd9696dd93&;amp;amp;amp;amp;from=research.latest-advancements-list
  • 魔塔:https://modelscope.cn/models/Qwen/Qwen-Image-Edit-2509
  • 抱抱脸:https://huggingface.co/Qwen/Qwen-Image-Edit-2509
  • GitHub:https://github.com/QwenLM/Qwen-Image

另外,Qwen3-Next-80B-A3B-Instruct-FP8 和 Qwen3-Next-80B-A3B-Thinking-FP8 也已经开源:

  • 抱抱脸:https://huggingface.co/collections/Qwen/qwen3-next-68c25fd6838e585db8eeea9d
  • 魔塔:https://modelscope.cn/collections/Qwen3-Next-c314f23bd0264a

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
狂胜27分!火箭完爆绿军斩获3连胜!这一战,我不得不承认5个事实

狂胜27分!火箭完爆绿军斩获3连胜!这一战,我不得不承认5个事实

篮球扫地僧
2025-11-02 12:04:46
很“友好”!东契奇和里夫斯赛后互相竖中指

很“友好”!东契奇和里夫斯赛后互相竖中指

雷速体育
2025-11-01 12:42:26
伯克希尔现金储备创历史新高,连续五个季度未回购股票

伯克希尔现金储备创历史新高,连续五个季度未回购股票

界面新闻
2025-11-02 09:48:10
中午12点30开赛的英超,为何仍会有数万球迷到场观赛?

中午12点30开赛的英超,为何仍会有数万球迷到场观赛?

懂球帝
2025-11-02 12:17:09
郑丽文正式就职国民党主席,朱立伦率队离任,卢秀燕、侯友宜缺席

郑丽文正式就职国民党主席,朱立伦率队离任,卢秀燕、侯友宜缺席

策略述
2025-11-01 15:25:35
打捞一艘沉船花掉三亿人民币,打开船舱后所有人都呆了!

打捞一艘沉船花掉三亿人民币,打开船舱后所有人都呆了!

阿器谈史
2025-10-30 18:57:22
去大陆先想着见谁,郑丽文回答先想见爸爸!

去大陆先想着见谁,郑丽文回答先想见爸爸!

凌风的世界观
2025-10-27 09:47:56
蒋介石唯独不敢动周恩来?如果动他:估计老蒋整个嫡系都得反!

蒋介石唯独不敢动周恩来?如果动他:估计老蒋整个嫡系都得反!

品茗谈史论世事
2025-10-31 14:48:40
米莱的胜利被最小化了

米莱的胜利被最小化了

寰宇大观察
2025-11-01 18:55:03
张勋的最后六年:远离政坛,生活阔绰,死后溥仪还赐谥号“忠武”

张勋的最后六年:远离政坛,生活阔绰,死后溥仪还赐谥号“忠武”

普览
2025-11-01 21:23:29
全红婵放弃全运单人角逐系顶层决策,并不仅仅是保护身体那么简单

全红婵放弃全运单人角逐系顶层决策,并不仅仅是保护身体那么简单

杨华评论
2025-11-01 19:30:01
曹操墓前堆成山的布洛芬,是这届年轻人最野的"历史梗"

曹操墓前堆成山的布洛芬,是这届年轻人最野的"历史梗"

小豫讲故事
2025-10-27 11:50:08
俄军围攻红军城,泽连斯基:局势严峻

俄军围攻红军城,泽连斯基:局势严峻

环球时报新闻
2025-11-01 22:13:18
拒绝认生父21年,却花费五百万为母亲购置豪宅,撕下所有的体面

拒绝认生父21年,却花费五百万为母亲购置豪宅,撕下所有的体面

仙味少女心
2025-10-27 20:47:26
6旬富豪专好''吃阴枣'',包养4个19岁女学生,民警破门后:禽兽不如

6旬富豪专好''吃阴枣'',包养4个19岁女学生,民警破门后:禽兽不如

悬案解密档案
2025-10-22 09:26:05
许家印为保命爆出三大靠山!百亿房东浮出水面,抱得美人归引热议

许家印为保命爆出三大靠山!百亿房东浮出水面,抱得美人归引热议

诗意世界
2025-09-26 10:31:06
俄乌战争告诉我们:中国,只有两个盟友。

俄乌战争告诉我们:中国,只有两个盟友。

老白观天下
2025-11-01 14:23:31
“穿个内衣就出来跑步,还要不要脸?”36岁女子晨跑,被大爷怒骂

“穿个内衣就出来跑步,还要不要脸?”36岁女子晨跑,被大爷怒骂

马拉松跑步健身
2025-11-02 06:35:03
不丹为什么不愿意和中国建交?原因非常简单

不丹为什么不愿意和中国建交?原因非常简单

凡人侃史
2025-10-28 09:40:55
“苏超”夺冠,泰州市委书记、市长感谢球队

“苏超”夺冠,泰州市委书记、市长感谢球队

极目新闻
2025-11-02 07:56:44
2025-11-02 12:43:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
313066文章数 606695关注度
往期回顾 全部

科技要闻

10月零跑突破7万辆,小鹏、蔚来超4万辆

头条要闻

万斯一句话让印度裔美国人炸锅 遭铺天盖地批评后回应

头条要闻

万斯一句话让印度裔美国人炸锅 遭铺天盖地批评后回应

体育要闻

李大林获2025北马国内男子组冠军

娱乐要闻

离世的他曾是刘德华张学友御用班底

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

神龙汽车推出“发动机终身质保”政策

态度原创

本地
手机
教育
数码
公开课

本地新闻

全网围观,到底多少人被这个野人大学生笑疯了

手机要闻

销量同比增长100%,iQOO Neo11热卖背后

教育要闻

粉丝采访录(二):普通劳动者怎样培养子女

数码要闻

樱桃推出 CHERRY STREAM ULTIMATE 外设,含可自定义电磁滚轮鼠标

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版