网易首页 > 网易号 > 正文 申请入驻

阿里发布Qwen3.5-Omni,多模态能力超越Gemini-3.1 Pro

0
分享至

3月30日,阿里发布千问新一代全模态大模型Qwen3.5-Omni,在音视频理解、识别、交互等215项任务中取得SOTA(性能最佳),超越Gemini-3.1 Pro,成为目前全球最强的全模态大模型之一。新模型拥有极强的音视频理解与实时交互能力,能够对音视频内容生成详细且可控的结构化描述,可识别语言和方言数量多达113种,还惊喜地涌现出了音视频Vibe Coding能力,用户对着镜头阐述需求,就能让模型自主生成APP、网页、游戏等复杂产品代码。目前,阿里云百炼已上新Qwen3.5-Omni的Plus、Flash、Light三种API,可广泛应用于短视频/直播平台、游戏、自媒体等行业。

Qwen3.5-Omni采用混合注意力MoE架构,在海量文本、视觉以及超过1亿小时的音视频数据上进行了原生多模态预训练,可实现图片、视频、语音、文字等全模态内容的输入与输出。新模型在音视频理解、跨模态推理、Agent方面实现了性能飞跃,在音视频理解、语音识别、多语种翻译、对话等215项第三方性能测试任务中取得SOTA。比如,在聚焦视听交互能力的DailyOmni、QualcommInteractive、Omni Cloze等测试中,Qwen3.5-Omni得分大幅领先Gemini-3.1 Pro;在检测嘈杂环境抗干扰能力的WenetSpeech测试中,Qwen3.5-Omni错误率远低于Gemini,识别准确率极高;在考察多语言语音生成质量的Multi-Lingual (30lang) 测试中,Qwen3.5-Omni同样显著优于Gemini-2.5-Pro-TTS。



图说:Qwen3.5-Omni跑分图

Qwen3.5-Omni拥有极强的语言能力,支持113种语言及方言的语音识别和36种语言及方言的语音生成,就连使用人数不足一百万的毛利语和国内的海南方言,也能精准识别。新模型还大幅增强了实时交互体验,能高情商听懂用户对话意图,准确区分有效回应和随口附和,就像和真人聊天一样。同时,模型还可以根据指令自由调节语音、语调,并基于创新的ARIA技术,使生成的语音更自然、更稳定。 在面对类似“今天的天气怎样”的实时提问时,模型还能自主判断并调用工具,确保回复内容准确且时效性强。

基于一系列技术创新,Qwen3.5-Omni将Vibe Coding推入下一阶段。与纯文本或图片驱动的Vibe Coding不同,千问可以实现音视频编程:打开摄像头,用户对着草图口述需求,哪怕是包括复杂产品逻辑的描述,模型也能直接生成带有复杂UI的产品原型界面,真正实现“动动嘴即可编程”。这一能力并非刻意设计,而是模型在原生多模态能力持续扩展过程中自然涌现出的结果。

Qwen3.5-Omni顶尖的全模态能力,还能为专业领域带来超级生产力。新模型可对画面主体、人物关系、对话逻辑、乃至人物情绪起伏进行极细的拆解,并自动完成视频章节切片与时间戳标注,支持超过10小时的音频输入,将繁琐的视频后期梳理工作缩短至秒级,大幅降低了企业的内容管理成本,在视频创作、内容审核等领域具有极高的落地价值。

目前,普通用户也可前往Qwen Chat免费体验,开发者和企业可通过阿里云百炼平台调用Qwen3.5-Omni模型,每百万Tokens输入不到0.8元,比Gemini-3.1 Pro的1/10还低。据了解,千问稳居中国企业级大模型调用市场第一,服务涵盖互联网、金融、消费电子及汽车等重点行业超100万家客户。

附:



图说:Qwen3.5-Omni跑分图

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
集体发病?北京车展成了嚼过的槟榔渣:没感觉自己病了才完蛋

集体发病?北京车展成了嚼过的槟榔渣:没感觉自己病了才完蛋

道哥说车
2026-04-26 18:58:56
舟山小李买了107箱茅台,全是假的!

舟山小李买了107箱茅台,全是假的!

都市快报橙柿互动
2026-04-26 22:25:35
赵心童:我就算拿5个世锦赛冠军也无法超越丁俊晖 他是开山之人

赵心童:我就算拿5个世锦赛冠军也无法超越丁俊晖 他是开山之人

念洲
2026-04-27 06:59:45
G4战,湖人大概率会放水,原因如下

G4战,湖人大概率会放水,原因如下

毒舌NBA
2026-04-27 08:54:11
对美元的重大误判,正在深度误导我们

对美元的重大误判,正在深度误导我们

世界灵敏度赵灵敏
2026-04-26 18:36:10
国产第一渣女,逆袭成《浪姐》最大黑马?网友:人美心狠!

国产第一渣女,逆袭成《浪姐》最大黑马?网友:人美心狠!

橙星文娱
2026-04-27 08:59:28
女子白天睡老公,晚上睡男同事,2019年上夜班的老公将她同事杀死

女子白天睡老公,晚上睡男同事,2019年上夜班的老公将她同事杀死

汉史趣闻
2026-04-26 16:27:51
人性何在?伊朗宣布服兵役的年龄低至12岁了,少年征兵引发争议

人性何在?伊朗宣布服兵役的年龄低至12岁了,少年征兵引发争议

吃瓜局
2026-04-26 14:50:58
结束了!杜兰特退出G4!曝火箭已经内部动荡

结束了!杜兰特退出G4!曝火箭已经内部动荡

篮球实战宝典
2026-04-27 05:37:34
Shams:约基奇最后在更衣室找到了自己的内裤

Shams:约基奇最后在更衣室找到了自己的内裤

懂球帝
2026-04-27 11:55:50
2859.2克黄金制品被警方扣押三十年:公安已约当事人面谈

2859.2克黄金制品被警方扣押三十年:公安已约当事人面谈

新京报
2026-04-26 21:05:03
上海地铁互殴最新后续!双双被行拘,客服发声,知情人曝更多细节

上海地铁互殴最新后续!双双被行拘,客服发声,知情人曝更多细节

爱写的樱桃
2026-04-26 21:38:12
皮蛋再次成为关注对象!研究发现:高血脂吃皮蛋,身体或有6改善

皮蛋再次成为关注对象!研究发现:高血脂吃皮蛋,身体或有6改善

健康科普365
2026-04-25 09:27:08
结束了!再见爱德华兹!NBA最惨季后赛球队

结束了!再见爱德华兹!NBA最惨季后赛球队

篮球实战宝典
2026-04-26 19:48:57
南方黑芝麻创始人,被立案调查

南方黑芝麻创始人,被立案调查

第一财经资讯
2026-04-27 09:28:28
北大教授:中国AI比美国还差得远,而且差距正在拉大

北大教授:中国AI比美国还差得远,而且差距正在拉大

六子吃凉粉
2026-04-27 11:35:16
逝者 | 《我在故宫修文物》导演叶君:“笨小孩”与他的孤独宇宙

逝者 | 《我在故宫修文物》导演叶君:“笨小孩”与他的孤独宇宙

新京报
2026-04-27 07:53:16
假空姐大闹亚航后续:知情人士透露真实身份,这下轮到女子老实了

假空姐大闹亚航后续:知情人士透露真实身份,这下轮到女子老实了

离离言几许
2026-04-26 07:28:42
海军宣传片暗藏004核航母舷号19,命名或为浙江广东

海军宣传片暗藏004核航母舷号19,命名或为浙江广东

浮光惊掠影
2026-04-26 22:44:54
华晨宇哭了损失大了,在云南投资上亿拿下地皮,如今紧急叫停

华晨宇哭了损失大了,在云南投资上亿拿下地皮,如今紧急叫停

以茶带书
2026-04-25 16:22:06
2026-04-27 12:08:49
ITBear科技资讯
ITBear科技资讯
提供有意思的科技资讯
2560文章数 232关注度
往期回顾 全部

科技要闻

打1折!DeepSeek输入缓存降价

头条要闻

被问"枪击发生后为何万斯先撤离" 特朗普回应了

头条要闻

被问"枪击发生后为何万斯先撤离" 特朗普回应了

体育要闻

最抽象的天才,正在改变瓜迪奥拉

娱乐要闻

《奔跑吧14》刚播就把一手好牌打稀烂

财经要闻

DeepSeek融资、字节加码 AI开始真烧钱了

汽车要闻

在不确定中寻找确定性:大众汽车的中国解法

态度原创

教育
房产
手机
时尚
健康

教育要闻

9月首招!川师附中新校区来了

房产要闻

新一轮教育大爆发来了!海口,开始疯狂建学校!

手机要闻

规格大升级 苹果iPhone 18运存容量将提升50%

比起买大件,这些“小装备”更派得上用场!

干细胞如何让烧烫伤皮肤"再生"?

无障碍浏览 进入关怀版