网易首页 > 网易号 > 正文 申请入驻

阿里除夕开源千问3.5:性能媲美Gemini 3 Pro, 实现原生多模态模型代际跃迁

0
分享至

来源:市场资讯

(来源:澎湃新闻)

2月16日除夕当天,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,性能媲美Gemini 3 Pro。千问3.5实现了底层模型架构的全面革新,此次发布的Qwen3.5-Plus版本总参数为3970亿,激活仅170亿,以小胜大,性能超过万亿参数的Qwen3-Max模型,部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API价格每百万Token低至0.8元,仅为Gemini 3 Pro的1/18。

据介绍,与前几代的千问大语言模型不同,千问3.5实现了从纯文本模型到原生多模态模型的代际跃迁。千问3预训练在纯文本Tokens上进行,而千问3.5则基于视觉和文本混合token上预训练,并大幅新增中英文、多语言、STEM和推理等数据,以不到40%的参数量获得超万亿的Qwen3-Max基座模型的顶尖性能:千问3.5在MMLU-Pro知识推理评测中得分87.8分,超越GPT-5.2;在博士级难题GPQA测评中斩获88.4分,高于Claude 4.5;在指令遵循IFBench以76.5分刷新所有模型纪录;而在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中,千问3.5表现均超越Gemini 3 Pro、GPT-5.2。

千问3.5性能跃升的背后,是对Transformer经典架构的重大创新突破。


图注:千问3.5推理效率大幅提升

此外,基于顶级视觉能力,千问3.5也实现了从Agent框架到Agent应用的新突破。千问3.5可自主操作手机与电脑,高效完成日常任务,在移动端支持更多主流APP与指令,在PC端可处理更复杂的多步骤操作,如跨应用数据整理、自动化流程执行等,显著提升操作效率。

同时,千问团队构建了一个可扩展的Agent异步强化学习框架,端到端可加速3到5倍,并将插件式智能体Agent支持扩展至百万级规模。

和阿里发布于2025年9月的最强基础模型Qwen3-Max相比,通过训练稳定优化以及多token预测等系列技术,Qwen3.5性能与Qwen3-Max模型持平,并进一步提升了推理效率:在常用的32K上下文场景中,千问3.5推理吞吐量可提升8.6倍;在256K超长上下文情况下,Qwen3.5推理吞吐量最大提升至19倍,推理效率大幅提升。

目前,千问APP、PC端已第一时间接入Qwen3.5-Plus模型。阿里很快将继续开源不同尺寸、不同功能的千问3.5系列模型,性能更强的旗舰模型Qwen3.5-Max不久也将发布。

最近春节档AI大战愈发激烈,不仅仅是多家AI应用“撒钱”吸引用户,多个国产大模型也频频上新。

字节跳动旗下AI视频生成模型Seedance2.0凭借多模态输入、文本/图片生成电影级视频等出色能力引爆网络,吸引全球关注。马斯克转发评论Seedance 2.0相关推文,并表示:模型发展速度太快(It's happening fast),导演贾樟柯在社交平台发文表示:“Seedance 2.0确实厉害,我准备用它做个短片。”

“目前在AI视频生成领域,Seedance可谓是遥遥领先。”业内人士向澎湃新闻记者介绍,“在技术能力上,它确实已经超过Sora(OpenAI旗下视频大模型)和Google Veo3.1、NanoBanana(谷歌旗下图像视频大模型),这是国产大模型第一次在真正意义上做到世界第一,具有标志性意义。”

2月14日,字节跳动宣布推出豆包大模型2.0(Doubao-Seed-2.0)系列。豆包2.0针对大规模生产环境的使用需求进行系统性优化,旨在更好地完成真实世界的复杂任务。

在技术细节上,豆包方面披露,在语言模型基础能力上,豆包2.0 Pro旗舰版取得IMO、CMO数学竞赛和ICPC编程竞赛金牌成绩,也超越了Gemini 3 Pro在Putnam基准测试上的表现,数学和推理能力达到世界顶尖水平。

阿里千问C端事业群总裁吴嘉披露,2月6日,阿里千问APP“春节30亿大免单”正式上线,发起奶茶攻势,请全国人民用AI一句话免费点奶茶,在阿里历史上的春节活动中投入最大。第一天的实际订单达到1500万单,是原来预计的15倍,一度火到用户无法下单,2月14日,千问启动第二波免单活动,将AI大战推向高潮。

吴嘉表示,千问做这件事的初衷,并不是为了和谁卷,从来没有想过内卷,真正想的是让AI融进老百姓的日常生活场景中,“这是未来一定会发生的事情。”他坚信这一波的AI应用,中国一定会走在世界的最前列,模型则会在各家之间的你追我赶中,不断往前发展。

2月12日,智谱正式上线并开源其新一代旗舰模型GLM-5,这个新模型正是此前在全球模型服务平台OpenRouter登顶热度榜首、引发圈内疯狂猜测的神秘模型“Pony Alpha”。

2月13日,MiniMax正式上线新一代文本模型MiniMax M2.5,在编程能力方面,M2.5在权威榜单SWE-Bench Verified得分80.2%、Multi-SWE-Bench得分51.3%,较上一代显著提升。

2月13日,据DeepSeek官方披露,DeepSeek网页/ APP正在测试新的长文本模型结构,支持1M上下文,其API 服务不变,仍为V3.2,仅支持128K上下文。也被外界认为,DeepSeek或将在今年春节再次“炸场”发布新模型,复刻去年春节现象级轰动。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
彭博称波音我国接近敲定约500架客机订单——如果为真,利弊各半

彭博称波音我国接近敲定约500架客机订单——如果为真,利弊各半

火星宏观
2026-03-07 11:31:48
悬念越来越小!本赛季夺冠热门,大概率锁定四队,6支豪门成陪衬

悬念越来越小!本赛季夺冠热门,大概率锁定四队,6支豪门成陪衬

老梁体育漫谈
2026-03-08 00:33:20
这是目前为止,我见过腰最细的女生,没有之一

这是目前为止,我见过腰最细的女生,没有之一

草莓解说体育
2026-03-03 19:15:05
中国女足30-0狂胜乌兹别克,亚足联认证历史性大捷

中国女足30-0狂胜乌兹别克,亚足联认证历史性大捷

领悟看世界
2026-03-07 00:40:03
阿森纳2-1险胜弱旅,晋级足总杯八强,却迎2坏消息,争冠埋隐患

阿森纳2-1险胜弱旅,晋级足总杯八强,却迎2坏消息,争冠埋隐患

俯身冲顶
2026-03-07 22:09:24
44岁五个娃,眼里还有光:LV太子妃的顶级人生,从不靠水晶鞋

44岁五个娃,眼里还有光:LV太子妃的顶级人生,从不靠水晶鞋

完善法
2026-03-07 19:20:35
90后单亲妈妈摆地摊起家年赚上千万元:创业初期一天只睡三四个小时,今年要完成收入一个亿的“小目标”

90后单亲妈妈摆地摊起家年赚上千万元:创业初期一天只睡三四个小时,今年要完成收入一个亿的“小目标”

南国今报
2026-03-07 18:29:43
俄媒:苏莱曼尼继任者是内鬼,确认哈梅内伊位置,会没开完就溜了

俄媒:苏莱曼尼继任者是内鬼,确认哈梅内伊位置,会没开完就溜了

萧鑟科普解说
2026-03-07 00:30:38
性能注水根本不重要,美媒:印度计划斥资61亿美元再订10套S-400

性能注水根本不重要,美媒:印度计划斥资61亿美元再订10套S-400

啸鹰评
2026-03-06 23:11:56
油价如果冲上100美元,A股最受益的10家公司

油价如果冲上100美元,A股最受益的10家公司

风风顺
2026-03-07 07:32:40
没有人比五粮液更懂脑血栓

没有人比五粮液更懂脑血栓

老斯基财经
2026-03-06 17:18:30
赫子铭直播回应离婚,坦言已再婚,过的十分幸福,比何洁要显年轻

赫子铭直播回应离婚,坦言已再婚,过的十分幸福,比何洁要显年轻

郭蛹包工头
2026-03-07 22:52:47
生涯首次!杨瀚森复出21+9+6+2+3帽创纪录 率混音拒20分逆转

生涯首次!杨瀚森复出21+9+6+2+3帽创纪录 率混音拒20分逆转

醉卧浮生
2026-03-07 12:30:45
A股:紧急提醒2.5亿股民!从下周起,或许牛市历史总是惊人的相似

A股:紧急提醒2.5亿股民!从下周起,或许牛市历史总是惊人的相似

另子维爱读史
2026-03-07 19:02:07
请注意:10日美以将进入伊朗空域全面轰炸,福特号已前往波斯湾

请注意:10日美以将进入伊朗空域全面轰炸,福特号已前往波斯湾

邵旭峰域
2026-03-07 17:50:03
演都不演了,刚复出就开演唱会,票价卖到1280,到底谁给的自信?

演都不演了,刚复出就开演唱会,票价卖到1280,到底谁给的自信?

一娱三分地
2026-03-03 13:51:03
被问爆了!小龙虾用什么电脑装?选哪个模型省钱?这篇“养虾”保姆级教程请收好

被问爆了!小龙虾用什么电脑装?选哪个模型省钱?这篇“养虾”保姆级教程请收好

AI范儿
2026-03-06 20:54:35
写入教科书的一天:F-35在德黑兰完成全球首次实战空对空击杀

写入教科书的一天:F-35在德黑兰完成全球首次实战空对空击杀

斌闻天下
2026-03-06 07:30:03
局长不给我晋升,我没争辩,散会后悄悄断了他每年 60 万的专项资金

局长不给我晋升,我没争辩,散会后悄悄断了他每年 60 万的专项资金

爱下厨的阿酾
2026-03-07 19:18:30
王思聪送珠宝高调表白懒懒:老婆我爱你,两人同框照曝光很恩爱

王思聪送珠宝高调表白懒懒:老婆我爱你,两人同框照曝光很恩爱

娱乐圈圈圆
2026-03-07 20:24:21
2026-03-08 01:15:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2391509文章数 5728关注度
往期回顾 全部

科技要闻

OpenClaw爆火,六位"养虾人"自述与AI共生

头条要闻

伊朗总统:号召所有伊朗人挺身而出 保卫领土

头条要闻

伊朗总统:号召所有伊朗人挺身而出 保卫领土

体育要闻

塔图姆298天走完这段路 只用27分钟征服这座城

娱乐要闻

汪小菲曝亲妈猛料,张兰公开财产分配

财经要闻

针对"不敢休、不让休"怪圈 国家出手了

汽车要闻

逃离ICU,上汽通用“止血”企稳

态度原创

旅游
健康
家居
公开课
军事航空

旅游要闻

陕西延安宝塔山,于东来呼吁矿泉水卖2元一瓶:茶叶蛋卖1.5元一个

转头就晕的耳石症,能开车上班吗?

家居要闻

暖棕撞色 轻法奶油风

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美第三个航母打击群据称准备部署至中东

无障碍浏览 进入关怀版