网易首页 > 网易号 > 正文 申请入驻

千问推出最强模型,平头哥单飞,阿里AI超级入口大迂回、大包抄

0
分享至



21世纪经济报道记者孔海丽 北京报道

大厂AI之战,激烈度陡然升级。

马化腾在腾讯年会上罕见地公开反思,直言“AI速度慢了”,还点评了“千问全面接入阿里生态”,称腾讯会一体化考虑大模型和AI产品,试图以“元宝派”打开新空间;百度智能云将“2026年AI相关收入增速”上调到200%,全力冲刺AI云市场第一;字节跳动更是激进,豆包手机试图直接抢占硬件终端,二代豆包AI手机正在紧锣密鼓准备中。

就在所有人都以为战局会在春节后进入高潮时,1月26日深夜,甚至没有一场发布会,阿里放出了最强模型。

千问旗舰推理模型Qwen3-Max-Thinking正式发布。

根据披露的数据,Qwen3-Max-Thinking是目前阿里规模最大、能力最强的推理模型,其性能指标媲美GPT-5.2和Gemini 3 Pro,在19个公认的大模型基准测试中,刷新了数项最佳表现(SOTA)纪录。千问PC和网页端随即丝滑接入,支持深度逻辑推演与自我校验。

还有一则有意思的动态。

1月26日,国星宇航披露成功把千问3(Qwen3)大模型部署到了“星算”计划01组太空计算中心,这是全球首次将通用大模型从地面上注至在轨运行的卫星,并执行端到端推理任务。网友调侃,千问这回真“上天”了。

开年以来,在关乎未来输赢的“超级入口”之争上,阿里全面进击,从千问接入阿里生态,到阿里旗下芯片子公司平头哥计划单独上市,再到Qwen模型发布最强版本,芯片层、模型层、应用层动作接连不断。

AI进入下半场,各家策略各异。“谁都知道以后AI重要,不管起步早晚,大厂都在做AI生态了,但现在方向都没定,阿里做生态、腾讯做社交、百度押注云、字节做硬件,还不到分野的时候。”一位AI产业资深观察人士表示。

千问推理再进化

Qwen3-Max-Thinking模型被官方称为“迄今为止最接近国际顶尖模型的国内最强AI大模型”。它的目标非常明确,在推理技术上进行系列创新,最终完成模型性能的大幅飞跃。

根据阿里发布的详细资料,该模型总参数超过万亿,在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19项权威基准测试中刷新了全球纪录。


在关键的模型推理能力提升中,千问新模型采用了一种全新的测试时扩展(Test-time Scaling)机制,推理性能提升的同时更经济。

业界推理时计算,通常是简单增加并行推理路径,重复推导已知结论,造成冗余推理效率低下。千问采用的测试时扩展新机制,可以对此前推理的结果进行“经验提取”式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算,获得更智能的推理结果。

简单理解,就是类似于让AI在解题时不再“一张草稿纸算到底”,而是能像人类一样,对前面的思考步骤进行回顾、提炼“经验”,并在后续步骤中更聪明地调用这些经验,从而实现更高效、更准确的复杂推理。

基于这一推理技术创新,千问推理性能和推理效率有明显提升,比如在被称为“人类最后的测试”HLE测试中,千问得分58.3,超过GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8,录得当前所有模型的最高分。

面向即将到来的智能体Agent时代,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。具体而言,在完成初步的工具使用微调后,通义团队对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练,使得Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。

这种自适应的工具调用能力可以在QwenChat上完整体验,模型自主选用搜索、个性化记忆和代码解释器等三个核心的Agent工具功能,提供专业人士一样水平的回答。同时,模型幻觉也大为降低,为解决真实复杂任务打下基础。

为什么业界如此看重推理和智能体能力?因为这直接关系到AI能否从“聊天玩具”进化为真正的“生产力工具”乃至“个人助理”。一个能进行深度推理、自主调用工具的AI才有能力处理复杂任务,比如规划旅行、编写专业报告、分析数据等。

或许阿里的这个“旗舰推理模型”,目的就是走出“仅对话”阶段,开始为物理AI的“超级入口”做准备。

平头哥独立,千问融入生态

同期,阿里还在做两个看似相反的动作,让芯片独立出去,把千问无缝整合到阿里生态。

平头哥的单飞,是观察中国互联网巨头AI战略纵深的一个切片。作为源自阿里达摩院的芯片公司,平头哥最早是为阿里云及内部生态提供自主算力的,其推出的含光、倚天等系列AI芯片,已经成了阿里云算力基础的一部分。

市场解读阿里推动平头哥独立运营并寻求上市,是希望把芯片从成本中心转化为收入中心。

其实不只阿里,百度也在推动昆仑芯独立上市,这也是一种行业必然。

大模型参数规模进入万亿时代,训练与推理的成本指数级上升,算力成了AI时代的“水电煤”。对于互联网大厂内部来说,自研芯片不仅能优化性能、降低对英伟达等国际巨头的依赖,还能在架构层面与自家的AI框架、模型进行深度协同,形成从底层硬件到上层应用的垂直优化闭环。

而让芯片公司独立出来,则是出于营收的考量。既能通过外部压力倒逼技术迭代,也能通过资本市场为长期的芯片研发“输血”。一方面支撑自家云业务,另一方面向外输出、形成行业标准的基础设施,顺便把外部的资金赚回来,支撑研发。

在算力层、模型层都有积淀之后,阿里最终的目的开始变得清晰,把千问融入庞大的商业生态里,抢夺AI的“超级入口”。

近段时间以来,阿里进行了一系列紧凑的生态调整。2025年12月,集团整合资源,成立了千问C端事业群,直接面向消费者打造AI产品体验。2026年1月15日,千问APP推出重大版本更新,正式宣布从“聊天工具”升级迈入“办事时代”,深度接入淘宝、支付宝、淘宝闪购、高德、飞猪等阿里生态核心业务,实现了点外卖、购物、订机票酒店等AI全流程办事服务,一次性上线超400项AI办事功能,串起了需求表达、任务执行到支付履约的闭环。

比如,用户对千问说“周末我想去郊外露营,预算人均500元”。千问在理解这个模糊意图后,其背后的“智能体”能力可以同时调动多个插件,通过高德查询合适的露营地与实时路况,通过飞猪或本地生活板块预订营地,通过淘宝推荐并比价帐篷、睡袋等装备,再通过支付宝整合优惠套餐并完成支付。用户不需要在多个APP之间频繁操作,通过自然对话可以完成从想法到消费的全流程。

未来千问还将继续接入优酷、大麦、菜鸟驿站、阿里健康、1688、盒马等其他阿里旗下核心业务条线,进一步提升生态协同和场景覆盖度。

也就是说,以千问作为入口,能够无缝串联起“电商交易”、“本地生活”、“文娱内容”、“支付金融”等场景,千问本身可以成为覆盖用户生活的“AI管家”。

国海证券在研报中指出,千问的生态整合模式重新定义了“入口”价值逻辑,促使行业竞争从单一模型能力,转向“模型+生态+场景”全维度比较。

大厂路径各异

同期,其他互联网巨头也在加码进攻。

腾讯,正如马化腾所言,在通用大模型的激进发布上显得谨慎。但其优势在于社交产品矩阵和深厚的产业互联网基础。腾讯的AI战略更倾向于“渗透”与“结合”,把AI能力深度融入微信、QQ、企业微信等国民级应用以及游戏、金融科技等优势业务中。腾讯更喜欢用不打扰用户的方式,做“润物细无声”的生态融合。

百度开年第一个发声是“AI云”,文心大模型是底层模型能力,商业化在于提供AI解决方案,并且业务增速和招投标数据表现很不错。百度的“入口”思维更偏向于B端,成为企业和机构智能化转型的首选合作伙伴。

字节跳动以敏捷和务实著称。豆包在字节内部应用非常广泛,包括抖音的内容推荐、创作工具,飞书的办公协同等等。推出“豆包AI手机”、研发“豆包AI耳机”,显示字节开始触碰硬件层。字节潜在的AI超级入口可能是抖音,可能是豆包,也可能是尚未完全成型的新硬件。

相比之下,阿里从平头哥的底层芯片,到千问的模型层,再到千问APP上层应用、夸克AI眼镜硬件,试图搭建起一个完整闭环。这种模式的优点是自主可控、协同潜力大,但是战线长,每一环都需要巨大的投入,对公司的资源整合与战略定力要求非常高。

尤其在千问宣布全面接入阿里生态之后,外界也有质疑声音,不少用户表示:“我不想被限定在阿里的圈子里,就想有更多选择权。”这对于阿里能否把千问做成“超级入口”是有挑战的,用户意愿和用户习惯往往最难左右。

(21世纪经济报道记者陶力对本文亦有贡献)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
写小说判十年,把生殖器放女孩嘴巴里判两年九个月

写小说判十年,把生殖器放女孩嘴巴里判两年九个月

昊轩看世界
2026-03-24 19:56:42
徐阳点评U23国足2-2泰国:句句实在话,理性看球更懂赛场本质!

徐阳点评U23国足2-2泰国:句句实在话,理性看球更懂赛场本质!

田先生篮球
2026-03-26 06:00:06
利空突袭,全线杀跌!

利空突袭,全线杀跌!

中国基金报
2026-03-26 13:16:51
东契奇43分7助攻湖人战胜步行者,勒布朗23分9板9助里夫斯25分

东契奇43分7助攻湖人战胜步行者,勒布朗23分9板9助里夫斯25分

湖人崛起
2026-03-26 09:32:48
这次下跌不一样,主力跑了?没有利空,连续下跌,跌停开板继续跌

这次下跌不一样,主力跑了?没有利空,连续下跌,跌停开板继续跌

有范又有料
2026-03-26 11:44:17
ATP的灾难:无趣的辛纳和事业心不足的阿尔卡拉斯

ATP的灾难:无趣的辛纳和事业心不足的阿尔卡拉斯

网球之家
2026-03-26 13:25:06
航天少帅谭瑞松被判死缓 不执行死刑和终身监禁

航天少帅谭瑞松被判死缓 不执行死刑和终身监禁

小鹿姐姐情感说
2026-03-26 02:23:54
张雪峰现任妻子遭扒,曝其去年再婚有儿子,年轻漂亮还很清纯

张雪峰现任妻子遭扒,曝其去年再婚有儿子,年轻漂亮还很清纯

古希腊掌管松饼的神
2026-03-25 14:28:44
陪老婆追星坐张凌赫旁边,全网笑称追星天花板

陪老婆追星坐张凌赫旁边,全网笑称追星天花板

可乐谈情感
2026-03-26 11:56:06
没护照没签证,这只叫LV的猫天天跨国走私老鼠,两国海关都拿它没辙!

没护照没签证,这只叫LV的猫天天跨国走私老鼠,两国海关都拿它没辙!

英国那些事儿
2026-03-24 23:16:58
自作自受!欧尔班硬刚欧盟阻援乌,160亿欧元信贷被直接冻结

自作自受!欧尔班硬刚欧盟阻援乌,160亿欧元信贷被直接冻结

老马拉车莫少装
2026-03-26 10:24:28
张雪峰死因:吃外卖撑住了?

张雪峰死因:吃外卖撑住了?

李万卿
2026-03-26 10:48:19
伊朗外长:霍尔木兹海峡只对敌人关闭 中国、俄罗斯等国船只都安全通过了

伊朗外长:霍尔木兹海峡只对敌人关闭 中国、俄罗斯等国船只都安全通过了

闪电新闻
2026-03-26 10:48:55
河南街头用头撞车事件,警方回应后续来了!评论区彻底炸锅

河南街头用头撞车事件,警方回应后续来了!评论区彻底炸锅

奇思妙想草叶君
2026-03-25 13:12:39
越扒越猛!释永信在少林寺有多爽,你根本想不到!终于落到这下场

越扒越猛!释永信在少林寺有多爽,你根本想不到!终于落到这下场

林轻吟
2026-03-26 07:34:21
坚决反对中国任何城市申办奥运会,国际奥委会这次怕是真失算了

坚决反对中国任何城市申办奥运会,国际奥委会这次怕是真失算了

南权先生
2026-03-25 15:25:11
从广东到东北!刘强东游艇版图扩容,150亿元项目进驻大连

从广东到东北!刘强东游艇版图扩容,150亿元项目进驻大连

南方都市报
2026-03-26 14:42:13
谁还敢充长期会员?男子视频VIP充到2028年,被一纸新规一夜返贫

谁还敢充长期会员?男子视频VIP充到2028年,被一纸新规一夜返贫

温读史
2026-03-26 10:41:06
人社部明确:事业编制改革启动,3100万人的“铁饭碗”要变了

人社部明确:事业编制改革启动,3100万人的“铁饭碗”要变了

慧眼看世界哈哈
2026-03-24 06:36:05
1965年,毛主席点名让彭德怀复出,背后有人拼命阻挠,这人后来判了18年

1965年,毛主席点名让彭德怀复出,背后有人拼命阻挠,这人后来判了18年

史海孤雁
2026-03-25 18:31:11
2026-03-26 16:36:49
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
239761文章数 743879关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

长护险谁能享受?享受多少?解答来了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
房产
健康
艺术
公开课

教育要闻

2026湖北高职单招工作启动

房产要闻

质价比标杆!三亚首创浮岛全景舱亮相,还得是万科!

转头就晕的耳石症,能开车上班吗?

艺术要闻

哪一座桥不是风景?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版