网易首页 > 网易号 > 正文 申请入驻

阿里除夕开源千问3.5:性能媲美Gemini 3 Pro,实现原生多模态模型代际跃迁

0
分享至

2月16日除夕当天,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,性能媲美Gemini 3 Pro。千问3.5实现了底层模型架构的全面革新,此次发布的Qwen3.5-Plus版本总参数为3970亿,激活仅170亿,以小胜大,性能超过万亿参数的Qwen3-Max模型,部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API价格每百万Token低至0.8元,仅为Gemini 3 Pro的1/18。

据介绍,与前几代的千问大语言模型不同,千问3.5实现了从纯文本模型到原生多模态模型的代际跃迁。千问3预训练在纯文本Tokens上进行,而千问3.5则基于视觉和文本混合token上预训练,并大幅新增中英文、多语言、STEM和推理等数据,以不到40%的参数量获得超万亿的Qwen3-Max基座模型的顶尖性能:千问3.5在MMLU-Pro知识推理评测中得分87.8分,超越GPT-5.2;在博士级难题GPQA测评中斩获88.4分,高于Claude 4.5;在指令遵循IFBench以76.5分刷新所有模型纪录;而在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中,千问3.5表现均超越Gemini 3 Pro、GPT-5.2。

千问3.5性能跃升的背后,是对Transformer经典架构的重大创新突破。


图注:千问3.5推理效率大幅提升

此外,基于顶级视觉能力,千问3.5也实现了从Agent框架到Agent应用的新突破。千问3.5可自主操作手机与电脑,高效完成日常任务,在移动端支持更多主流APP与指令,在PC端可处理更复杂的多步骤操作,如跨应用数据整理、自动化流程执行等,显著提升操作效率。

同时,千问团队构建了一个可扩展的Agent异步强化学习框架,端到端可加速3到5倍,并将插件式智能体Agent支持扩展至百万级规模。

和阿里发布于2025年9月的最强基础模型Qwen3-Max相比,通过训练稳定优化以及多token预测等系列技术,Qwen3.5性能与Qwen3-Max模型持平,并进一步提升了推理效率:在常用的32K上下文场景中,千问3.5推理吞吐量可提升8.6倍;在256K超长上下文情况下,Qwen3.5推理吞吐量最大提升至19倍,推理效率大幅提升。

目前,千问APP、PC端已第一时间接入Qwen3.5-Plus模型。阿里很快将继续开源不同尺寸、不同功能的千问3.5系列模型,性能更强的旗舰模型Qwen3.5-Max不久也将发布。

最近春节档AI大战愈发激烈,不仅仅是多家AI应用“撒钱”吸引用户,多个国产大模型也频频上新。

字节跳动旗下AI视频生成模型Seedance2.0凭借多模态输入、文本/图片生成电影级视频等出色能力引爆网络,吸引全球关注。马斯克转发评论Seedance 2.0相关推文,并表示:模型发展速度太快(It's happening fast),导演贾樟柯在社交平台发文表示:“Seedance 2.0确实厉害,我准备用它做个短片。”

“目前在AI视频生成领域,Seedance可谓是遥遥领先。”业内人士向澎湃新闻记者介绍,“在技术能力上,它确实已经超过Sora(OpenAI旗下视频大模型)和Google Veo3.1、NanoBanana(谷歌旗下图像视频大模型),这是国产大模型第一次在真正意义上做到世界第一,具有标志性意义。”

2月14日,字节跳动宣布推出豆包大模型2.0(Doubao-Seed-2.0)系列。豆包2.0针对大规模生产环境的使用需求进行系统性优化,旨在更好地完成真实世界的复杂任务。

在技术细节上,豆包方面披露,在语言模型基础能力上,豆包2.0 Pro旗舰版取得IMO、CMO数学竞赛和ICPC编程竞赛金牌成绩,也超越了Gemini 3 Pro在Putnam基准测试上的表现,数学和推理能力达到世界顶尖水平。

阿里千问C端事业群总裁吴嘉披露,2月6日,阿里千问APP“春节30亿大免单”正式上线,发起奶茶攻势,请全国人民用AI一句话免费点奶茶,在阿里历史上的春节活动中投入最大。第一天的实际订单达到1500万单,是原来预计的15倍,一度火到用户无法下单,2月14日,千问启动第二波免单活动,将AI大战推向高潮。

吴嘉表示,千问做这件事的初衷,并不是为了和谁卷,从来没有想过内卷,真正想的是让AI融进老百姓的日常生活场景中,“这是未来一定会发生的事情。”他坚信这一波的AI应用,中国一定会走在世界的最前列,模型则会在各家之间的你追我赶中,不断往前发展。

2月12日,智谱正式上线并开源其新一代旗舰模型GLM-5,这个新模型正是此前在全球模型服务平台OpenRouter登顶热度榜首、引发圈内疯狂猜测的神秘模型“Pony Alpha”。

2月13日,MiniMax正式上线新一代文本模型MiniMax M2.5,在编程能力方面,M2.5在权威榜单SWE-Bench Verified得分80.2%、Multi-SWE-Bench得分51.3%,较上一代显著提升。

2月13日,据DeepSeek官方披露,DeepSeek网页/ APP正在测试新的长文本模型结构,支持1M上下文,其API 服务不变,仍为V3.2,仅支持128K上下文。也被外界认为,DeepSeek或将在今年春节再次“炸场”发布新模型,复刻去年春节现象级轰动。

澎湃新闻记者 胡含嫣 范佳来

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2026年变压器十大品牌推荐:安全与长寿是核心,精准选型指南

2026年变压器十大品牌推荐:安全与长寿是核心,精准选型指南

中关村在线
2026-03-06 10:22:41
美专家:美国仅凭轰炸无法实现对伊朗目标

美专家:美国仅凭轰炸无法实现对伊朗目标

参考消息
2026-03-07 15:04:14
美军准备发起“灭国大轰炸”,9千万伊朗人进入最艰难时刻

美军准备发起“灭国大轰炸”,9千万伊朗人进入最艰难时刻

别人都叫我阿腈
2026-03-06 20:51:16
半导体再迎大利空?

半导体再迎大利空?

格隆汇
2026-03-07 18:09:12
伊朗集装箱船改造的航母被击沉? 伊军指挥官:这几天只是清库存,会亮从未公开的大杀器

伊朗集装箱船改造的航母被击沉? 伊军指挥官:这几天只是清库存,会亮从未公开的大杀器

红星新闻
2026-03-06 14:00:17
湖人大胜!东契奇44+9+5,最后2秒,老詹起身走入球员通道

湖人大胜!东契奇44+9+5,最后2秒,老詹起身走入球员通道

担酒
2026-03-07 13:58:32
塔帅:被淘汰感觉很糟糕我们不想经历;萨利巴出战存疑

塔帅:被淘汰感觉很糟糕我们不想经历;萨利巴出战存疑

懂球帝
2026-03-07 07:10:06
中国人民解放军国防部突然改口,不再称台军,直接定性为台独武装

中国人民解放军国防部突然改口,不再称台军,直接定性为台独武装

Ck的蜜糖
2026-03-06 19:21:36
澳大利亚惊现封闭乱伦家族:4代人近亲繁衍38名成员全是乱伦产物

澳大利亚惊现封闭乱伦家族:4代人近亲繁衍38名成员全是乱伦产物

第7情感
2026-02-23 20:45:16
莫雷加德谈国乒实力:世界第1,希望自己能成为足够强大的对手

莫雷加德谈国乒实力:世界第1,希望自己能成为足够强大的对手

乒谈
2026-03-07 12:50:34
1965年飞行员高长吉违令击落对岸侦察机,主席批示后结局令人感慨

1965年飞行员高长吉违令击落对岸侦察机,主席批示后结局令人感慨

唠叨说历史
2026-03-04 10:46:38
上海男子爱上江西51岁老太,相差18岁恋爱九年不结婚

上海男子爱上江西51岁老太,相差18岁恋爱九年不结婚

浩舞纆画
2026-03-05 18:41:23
央八首播!34集谍战巨制来袭,仅播出一天,收视率直接登顶

央八首播!34集谍战巨制来袭,仅播出一天,收视率直接登顶

乐枫电影
2026-03-07 15:39:58
悲报:或因中日关系紧张,木村拓哉原定出演《九龙城寨》续集,开拍前突然被临时换掉!

悲报:或因中日关系紧张,木村拓哉原定出演《九龙城寨》续集,开拍前突然被临时换掉!

日本物语
2026-03-07 20:35:30
下一周(3.9)持有这些个股的要小心了!(附个股)

下一周(3.9)持有这些个股的要小心了!(附个股)

股市皆大事
2026-03-07 14:23:53
事实的真相:一个从不焦虑的人,往往生活在极度的浅薄中。

事实的真相:一个从不焦虑的人,往往生活在极度的浅薄中。

松果正念袁老师
2026-02-25 19:45:39
2战三分10中1,宫鲁鸣用29岁花瓶替代李缘?球迷:不会是关系户吧

2战三分10中1,宫鲁鸣用29岁花瓶替代李缘?球迷:不会是关系户吧

弄月公子
2026-03-06 22:53:05
莲花CEO回应戴摄像头讽刺车顶激光雷达设计丑陋争议

莲花CEO回应戴摄像头讽刺车顶激光雷达设计丑陋争议

蓝鲸新闻
2026-03-07 09:38:05
首战贡献2助攻,王东升:可以继续否定我,我会继续做我自己

首战贡献2助攻,王东升:可以继续否定我,我会继续做我自己

懂球帝
2026-03-07 13:50:07
教育部部长怀进鹏:要让孩子身上有汗眼里有光健康第一

教育部部长怀进鹏:要让孩子身上有汗眼里有光健康第一

极目新闻
2026-03-07 11:45:50
2026-03-07 21:51:01
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
881028文章数 5088666关注度
往期回顾 全部

科技要闻

OpenClaw爆火,六位"养虾人"自述与AI共生

头条要闻

特朗普:伊朗今天将遭到极其猛烈的打击

头条要闻

特朗普:伊朗今天将遭到极其猛烈的打击

体育要闻

塔图姆298天走完这段路 只用27分钟征服这座城

娱乐要闻

田亮一家新年全家福!森碟变清纯少女

财经要闻

针对"不敢休、不让休"怪圈 国家出手了

汽车要闻

逃离ICU,上汽通用“止血”企稳

态度原创

艺术
健康
家居
本地
游戏

艺术要闻

2025年天津市第十届油画双年展 | 人物油画选刊

转头就晕的耳石症,能开车上班吗?

家居要闻

暖棕撞色 轻法奶油风

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

良性竞争比互黑重要!Arc玩家主动声援失落星船马拉松

无障碍浏览 进入关怀版