网易首页 > 网易号 > 正文 申请入驻

千问 3.5:0.8 元的顶级模型,我找不到它的对手

0
分享至

我正对着镜子站立,举起一只手。在我的视野中,这只手出现在镜子画面的左侧。

请问在现实中,我举起的是哪只手?

答案应该是:左手。

一道堪比「9.11 > 9.8」的 AI 陷阱题。

前两天,我拿它测了一圈主流旗舰模型。GPT-5.2 错了,Claude Opus 4.6,也错了。


Gemini 3 Pro、Qwen 3.5 答对了。

阿里在除夕放出了新模型 Qwen 3.5 Plus。

他们选择在农历今年的最后一天,参与 2 月份这个最热闹、拥挤的 AI 春节。

千问 3.5:啊,我成了价格屠夫?

这个月,我们看了太多新模型:


  • 多模态方面,Opus 4.6 把编程与智能拔高到全新水平,Kimi 也端出了 K2.5 非常强的多模态 Agent 模型。
  • 纯文本方面,GLM-5 继续深挖复杂 Agent 场景智能,Minimax M2.5 则卷激活 10B 的轻量智能。

琳琅满目,腥风血雨。

他们的定价是这样的:


国内旗舰模型定价,基本都在百万输入 4 元,输出 20 元。

那么,无奖竞猜,千问 3.5 的定价?

给一点提示:本次发布的是这个系列的 Plus 版本,Qwen3.5-397B-A17B:


  • 原生多模态 Agent 旗舰,能分析图片、视频(甚至比上一代专门的视觉模型 Qwen3-VL 表现更好)
  • 397B 总参数,每次推理仅需激活 17B
  • 响应速度最高达上代的 19 倍(解码速度达到上代 Qwen3-Max 的 8.6 倍/19.0 倍,对应 32k/256k 上下文长度)
  • 上下文窗口高达 1M(当前国内模型大部分都在 200K 左右)
  • 还支持 186 种语言

大水桶,每百万 Token 输入 0.8 元起售,算上阶梯定价,按国内模型上下文上限的 256K 情况,也有一定价格优势。


而且全尺寸 Apache 2.0 开源。

Benchmark 跑分较前代 Max-Thinking 版本全面提升。


看到这只能说:欢迎大模型界的价格屠夫。

“是的,我们有了个新架构”

阿里在 Qwen3 这个版本真的呆了很久。久到我一度想问他们怎么和 G 胖一样不会数数了。

现在有了答案:因为他们在炼新架构。

还记得 Qwen3-Next 架构吗?阿里云千问团队于 2025 年 9 月推出的下一代大规模语言模型架构。


随着该架构提出的 Gated Attention 技术,当时还斩获了全球 AI 顶会 2025 NeurIPS 的最佳论文奖。

2025 年 NeurIPS 总投稿论文 21575 篇,选出「Best Paper Awards」共 4 篇,入选概率为 0.018%。

其中之一则是由千问团队提交的《Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free》。



链接:https://blog.neurips.cc/2025/11/26/announcing-the-neurips-2025-best-paper-awards/

大浪淘沙始见金,获奖难度绝不亚于电影业的奥斯卡最佳影片(2025 年入选率0.48%)。

NeurIPS 评委会对此项技术的评价为:


而在今年除夕,该技术与 Qwen3-Next 架构,终于融入到千问 3.5 系列模型。

混合注意力机制、极致稀疏 MoE 架构、原生多 Token 预测、系统级训练稳定性优化,带来了全面的提升。

Qwen3.5-Plus 以 397B 参数、仅激活 17B,性能超过了自家上一代万亿参数的 Qwen3-Max,多模态能力也优于上代专项视觉模型 Qwen3-VL。

部署成本降了 60%,推理速度大幅提升,训练成本不到同级模型的十分之一。

实测:0.8 元这个价,还给了辆“摩托车”

我无意把 Qwen3.5-Plus 抬得过高。

只是当一个顶级模型的价格下探到 0.8 元百万输入时,你很难不被美丽的价格蒙蔽了眼睛:

——别人家要么没有多模态、没有 1M 上下文,那 0.8 元还开源的千问 3.5,哪里不行了?(要什么自行车)

讲个人实测,Qwen3.5-Plus 给我最大的印象是:均衡、快、多模态。

各方面都较为均衡,均在一流档位,多模态识别能力很强;且在新架构加持下,thinking 速度实在是快。

(先备注,以下 Case 均未经过特挑,为了赶时间过年,都是 1 轮内直出的测试结果)

关于问答推理

先是文章开头那道镜子题。


这道题的陷阱在于:模型实在知道的“太多”,以至于看到镜子题,就会自然想到现实与镜像的左右翻转关系,镜中人之右手对应现实人的左手。

比如次次犯错的 GPT 5.2,是这么回答的 ⬇️


Qwen3.5-Plus 识别到了关键误区,给出了正确答案。


横向对比,首字时延最短,tokens 速度处于更优水平。

关于多模态理解

在多模态这块,我找了 Gemini 3 Pro、GPT 5.2 来一起和千问 3.5 一起参与这项测试。(选它俩的主要原因,纯粹是因为这俩在我心里,是多模态识别的顶尖水平)

先是图片任务,想到用找茬游戏来做对比。刚好放松一刻,你也来一起玩玩 ⬇️

找出图片中的所有不同(小红书水印不算)


Gemini:8 分,找到了 9 处,错误 1 处


GPT-5.2,8 分共 8 处,亮点在唯一个关注到了印章距离桌子的位置不同


而 Qwen 居然有 9.5 分:找到了 10 处,全对,但在描述上有一处我也无法区分它说的是不是对的


光看本 Case 表现:Qwen3.5-Plus 居然能优于 Gemini 3 Pro、GPT-5.2 确实超出预期。

考虑模型回答的概率问题,也不能一概而论断言千问 100% 在多模态任务优于这两家,只能说千问 3.5 的多模态能力相对公认的顶级多模态模型,非常能打。

附:来自小红书的评论区答案,区别在这些地方,你自己找到了几个?⬇️


因为千问 3.5 是支持原生多模态视频的识别能力,官宣能理解长达2小时视频中的时序演变与因果关系。

所以视频识别任务,这个我也找了有趣的测试。

刚好前两天在看 B 站的自制多级火箭鞭炮发射视频,很有意思。

以这个视频为例,我让 AI 来算了算火箭最终的飞行高度⬇️

千问 3.5 的结论是在 1300~2000 米之间。


Gemini 3 Pro 的结论在 500 米到 800 米之间。


我也没有绝对的正确答案。

不过一起看看原始视频评论区的讨论:与 AI 估算发射时间*上升速度的方法不同,他们通过最后一次推进声音的延迟时间*音速,给出了相对统一的置信区间:1000~1300 米。



关于 Coding 能力

这块测试相对简单,主要跑了一个前端任务,一个 CC 的 Agent 任务,还记得我之前在前两篇的测试吗?

一个是让 Qwen3.5-Plus 多模态参考风格海报,生成对应风格的前端网站。

参考这张图片:


Prompt:

你是一个有高度审美的网页设计专家,请基于这张图的设计元素与要求,生成单独的动态网站

这是其给出的结果:

另外也跑了一些其他测试,千问 3.5 前端 Coding 审美水平肯定算不上最好,但多模态 Coding 流程能跑通。

视觉效果虽不出彩,但无功无过,比起 GPT 确实更优些。

另一个是在 Claude Code 里跑日常用的 Agent Skill:多源资讯日报监控。

需要调用 web fetch、playwright、browser MCP 等多个工具,根据每个资讯源的网页实际加载情况,自动选择最轻量、合适的策略,完成新闻的识别、入库、总结与站点更新。

整个跑下来没有什么流程性问题。

另外也试了一些自己的 AI Partner、Writing-Articles Skill。

从 Agent 能力体验上来说,承担简单 Skill Agent 能力留有余裕。高智能要求的 Agent 任务上,会略缺更长程任务的主动探索性,需要再等等他们千问 3.5 系列更大尺寸的模型。

从实测来看,Qwen3.5-Plus 给我印象最深的,无疑是多模态能力。

找茬游戏 9.5 分赢过 Gemini 3 Pro 和 GPT-5.2,火箭视频的高度估算比 Gemini 更接近真实值。

在更换了新架构后,Qwen3.5-Plus 还能集多模态、Agent 能力、1M 上下文长度、更快响应、更低部署成本的进步为一体。

从这个角度来看,一个仅 0.8 元百万 Token 输入起步的模型,在这个时间点,你确实很难在同一价位里匹配的对手。

现在,你已经能在千问 APP、Web 端、阿里云百炼全面体验 Qwen3.5-Plus 这个版本的新模型。


  • 千问 APP、Web 端:切换模型为 Qwen3.5-Plus
  • 阿里云百炼:模型 IDqwen3.5-plus



好了,大家新年快乐。

我用千问点杯奶茶,看春晚去(这次肯定是真休假了……吧)

新年快乐,也感谢你的点赞与分享:)


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
4次挑衅中国!乌克兰名将:取消我同胞资格 国际奥委会是世界耻辱

4次挑衅中国!乌克兰名将:取消我同胞资格 国际奥委会是世界耻辱

念洲
2026-02-16 09:10:30
冯小刚新作!《抓特务》发布新春特别海报

冯小刚新作!《抓特务》发布新春特别海报

草莓解说体育
2026-02-16 21:57:41
中国驻日本使馆发言人就日方所谓交涉答记者问

中国驻日本使馆发言人就日方所谓交涉答记者问

环球网资讯
2026-02-16 21:46:15
突发!集体崩盘,资金连夜出逃…

突发!集体崩盘,资金连夜出逃…

魏家东
2026-02-16 11:13:49
春节到了!成都上演空城计,往日繁忙的路口竟然20辆汽车都没有…

春节到了!成都上演空城计,往日繁忙的路口竟然20辆汽车都没有…

火山詩话
2026-02-16 11:24:30
为啥中国精英盼着中国输?复旦教授:中国一旦追上,绿卡就会贬值

为啥中国精英盼着中国输?复旦教授:中国一旦追上,绿卡就会贬值

大鱼简科
2026-02-15 22:00:23
租个“对象”回家过年

租个“对象”回家过年

经济观察报
2026-02-16 16:34:16
红星专访|王菲春晚唱火《你我经历的一刻》,原创称歌词是倒着写出来的

红星专访|王菲春晚唱火《你我经历的一刻》,原创称歌词是倒着写出来的

红星新闻
2026-02-16 22:22:42
俄罗斯遭大规模袭击

俄罗斯遭大规模袭击

环球时报国际
2026-02-16 09:29:24
最后一圈冲刺失误!刘少昂自责:只能说抱歉,是我的失败,我错了

最后一圈冲刺失误!刘少昂自责:只能说抱歉,是我的失败,我错了

风过乡
2026-02-16 21:05:12
WOW!易建联公开露面!等了整整两年时间

WOW!易建联公开露面!等了整整两年时间

篮球实战宝典
2026-02-16 17:54:12
太安静了!除夕之夜1000多万新上海人纷纷离开,上海回归到50年前

太安静了!除夕之夜1000多万新上海人纷纷离开,上海回归到50年前

火山詩话
2026-02-16 19:54:07
大年初一拜年,别只说“新年快乐”,送您几句祝福语,马年走鸿运

大年初一拜年,别只说“新年快乐”,送您几句祝福语,马年走鸿运

神牛
2026-02-16 09:00:22
春晚飘过40载,今年春晚尤其难看

春晚飘过40载,今年春晚尤其难看

凤眼论
2026-02-16 22:50:18
就为道那声“过年好”

就为道那声“过年好”

北青深一度
2026-02-16 11:06:41
2月16日俄乌最新:惊人的转变

2月16日俄乌最新:惊人的转变

西楼饮月
2026-02-16 17:08:41
收视率破36!央视马年春晚首波口碑出炉,观众的评价“一针见血”

收视率破36!央视马年春晚首波口碑出炉,观众的评价“一针见血”

八卦南风
2026-02-16 23:11:18
女子拒给弟弟20万彩礼,父母告上法庭索赔5倍养育费,节前收到传票

女子拒给弟弟20万彩礼,父母告上法庭索赔5倍养育费,节前收到传票

观世记
2026-02-16 14:14:58
日本首相高市早苗发表贺辞祝贺春节

日本首相高市早苗发表贺辞祝贺春节

东瀛万事通
2026-02-16 18:54:22
央视春晚收视率破40%!王菲出场不到38%,知名乐评人吐槽王菲假唱

央视春晚收视率破40%!王菲出场不到38%,知名乐评人吐槽王菲假唱

古希腊掌管月桂的神
2026-02-16 23:36:38
2026-02-17 02:07:00
一泽Eze
一泽Eze
AI 产品,提示工程师 ? 探索AI应用边界,寻找人与AI共处的答案
43文章数 2关注度
往期回顾 全部

科技要闻

阿里除夕发布千问3.5,性能媲美Gemini 3

头条要闻

日方宣称向中方提出交涉 中使馆驳斥

头条要闻

日方宣称向中方提出交涉 中使馆驳斥

体育要闻

全明星正赛美国星辰队夺冠 爱德华兹MVP

娱乐要闻

王菲六登春晚献唱 水滴钻石耳环再出圈

财经要闻

2025,中国商业十大意外,黄金只排第九

汽车要闻

叫停纯屏操作 工信部拟推车内实体操作件强制国标

态度原创

家居
数码
亲子
游戏
旅游

家居要闻

中古雅韵 乐韵伴日常

数码要闻

B站上架AIPIAIPI洛天依甜甜圈蓝牙耳机礼盒,129元

亲子要闻

笑了半天!妈妈不会带娃,于是去找她妈妈!网友:再往上数没人了

索尼又背刺PS5Pro用户?独占《战神》新作不支持强化

旅游要闻

巨型“彩马”驰骋上海夜空 上千架无人机浪漫烟花交相辉映

无障碍浏览 进入关怀版