世界第一的记录,正在被中国大厂接连刷新。
一个大厂刷完,下一个大厂接着刷。
中国AI正在包揽全球AI竞赛各个赛场上的前三甲。
现在的关键赛点,是到底这些AI,是柯南,还是毛利小五郎。
![]()
26日晚间,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking,在多项关键性能基准测试中,千问表现超过了GPT-5.2、Claude Opus 4.5 和Gemini 3 Pro等顶尖模型,刷新全球纪录,进一步拓展了人工智能系统的推理性能边界。
阿里方面表示,Qwen3-Max-Thinking总参数超万亿,进行了更大规模的强化学习后训练,并通过推理技术的系列创新,最终完成模型性能的大幅飞跃。
其还大幅增强了自主调用工具的原生Agent能力,模型可像专业人士一样边用工具边思考。
同时,模型幻觉也大为降低,为解决真实复杂任务打下基础。
目前,普通用户可通过千问PC端和网页端试用新模型,千问APP也即将接入,所有用户都可免费体验。
此外,28日,全球最大开源社区Hugging Face最新数据显示,阿里千问大模型开源数量突破400个,是全球AI开源社区采用率最高的模型。
麻省理工学院报告指出,2025年,中国研发的开源大模型全球下载量占比达17.1%,首次超越美国(15.8%),跃居世界第一。
值得注意的是,1月15日,阿里在杭州举办了千问产品发布会,宣布全面接入淘宝、支付宝、飞猪、高德、盒马等阿里生态业务。
阿里千问 APP 化身智能体“顾问”,支持一句话点外卖、购物、买机票、订酒店,引发广泛关注。
![]()
Chatbot (聊天机器人)的战争已经基本结束。
下一步竞争的焦点是转向“会干活”的AI Agent(智能体),愈发成为行业共识。
目前,阿里、腾讯、字节等大厂均已布局智能体。
值得注意的是,尽管前景广阔,但行业智能体的规模化应用仍面临多重障碍。
对于Qwen3-Max-Thinking的正式发布,最值得关注的点是什么?
如何看Qwen3-Max-Thinking的行业应用前景?
目前,国内同类产品的发展状况和市场情况是怎样的?
Qwen3-Max-Thinking的面世,是否有助于阿里千问市场拓展?
对此,网联社梁伟和书乐进行了一番交流,本猴以为:
测试世界第一还不是无敌,还需实战和消费场景天下第一。
具体到阿里千问这次破纪录,也不能盲目乐观。
推理能力需要实战检测,仅仅靠跑分不能证明领先。
![]()
推理水平到底是柯南,还是毛利小五郎,都需要大众实践来检验。
同时,这个记录能保持几天,会把哪家中国大厂所打破,还很难说。
真正的崛起,还是要如此前更新去切入电商场景那样,通过大模型推理,让精准消费距离和购物选择的难度再一次扁平化,才是最强。
诚然,阿里的电商大数据,就是千问的私有数据池,也是友商攻不破的护城河。
不过,未来,阿里电商体系的地位,决定了千问核心竞争力的大小,唯有千问通过功能服务反哺阿里电商,才是真正的应用价值。
总体来说,2025年开始,中国人工智能从此前的通用模式的大模型之争,走向垂直细分市场的智能体竞技。
通过对细分功能如绘画、作曲、写作、编程等功能性服务,进行深度定制。
对于阿里千问来说,只有真正能作用于B端或C端,且显著有效,才有市场价值。
或者说,此前融入阿里生态,是阿里为用户直接制作了智能体,即过去的AI竞争是大模型的通用功能竞争。
当下的AI赛点是用大模型打磨出针对化服务的智能体。
此次千问推理模型,则是为智能体提供更好的智力支持,就看这个支持到底能让智商有多大程度提高,则市场就会有多大的拓展空间。
作者 张书乐,人民网、人民邮电报专栏作者,中经传媒智库专家,资深产业评论人
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.