网易首页 > 网易号 > 正文 申请入驻

刷新世界记录!千问推理,小五郎秒变柯南?

0
分享至

张书乐 人民网、人民邮电报专栏作者

测试世界第一还不是无敌,

还需实战和消费场景天下第一。

世界第一的纪录,正在被中国大厂接连刷新。

一个大厂刷完,下一个大厂接着刷。

中国AI正在包揽全球AI竞赛各个赛场上的前三甲。

现在的关键赛点,是到底这些AI,是柯南,还是毛利小五郎。


26日晚间,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking,在多项关键性能基准测试中,千问表现超过了GPT-5.2、Claude Opus 4.5 和Gemini 3 Pro等顶尖模型,刷新全球纪录,进一步拓展了人工智能系统的推理性能边界。

阿里方面表示,Qwen3-Max-Thinking总参数超万亿,进行了更大规模的强化学习后训练,并通过推理技术的系列创新,最终完成模型性能的大幅飞跃。

其还大幅增强了自主调用工具的原生Agent能力,模型可像专业人士一样边用工具边思考。

同时,模型幻觉也大为降低,为解决真实复杂任务打下基础。

目前,普通用户可通过千问PC端和网页端试用新模型,千问APP也即将接入,所有用户都可免费体验。

此外,28日,全球最大开源社区Hugging Face最新数据显示,阿里千问大模型开源数量突破400个,是全球AI开源社区采用率最高的模型。

麻省理工学院报告指出,2025年,中国研发的开源大模型全球下载量占比达17.1%,首次超越美国(15.8%),跃居世界第一。

值得注意的是,1月15日,阿里在杭州举办了千问产品发布会,宣布全面接入淘宝、支付宝、飞猪、高德、盒马等阿里生态业务。

阿里千问 APP 化身智能体“顾问”,支持一句话点外卖、购物、买机票、订酒店,引发广泛关注。


Chatbot (聊天机器人)的战争已经基本结束。

下一步竞争的焦点是转向“会干活”的AI Agent(智能体),愈发成为行业共识。

目前,阿里、腾讯、字节等大厂均已布局智能体。

值得注意的是,尽管前景广阔,但行业智能体的规模化应用仍面临多重障碍。

对于Qwen3-Max-Thinking的正式发布,最值得关注的点是什么?

如何看Qwen3-Max-Thinking的行业应用前景?

目前,国内同类产品的发展状况和市场情况是怎样的?

Qwen3-Max-Thinking的面世,是否有助于阿里千问市场拓展?

对此,网联社梁伟和书乐进行了一番交流,本猴以为:

测试世界第一还不是无敌,还需实战和消费场景天下第一。

具体到阿里千问这次破纪录,也不能盲目乐观。

推理能力需要实战检测,仅仅靠跑分不能证明领先。


推理水平到底是柯南,还是毛利小五郎,都需要大众实践来检验。

同时,这个记录能保持几天,会把哪家中国大厂所打破,还很难说。

真正的崛起,还是要如此前更新去切入电商场景那样,通过大模型推理,让精准消费距离和购物选择的难度再一次扁平化,才是最强。

诚然,阿里的电商大数据,就是千问的私有数据池,也是友商攻不破的护城河。

不过,未来,阿里电商体系的地位,决定了千问核心竞争力的大小,唯有千问通过功能服务反哺阿里电商,才是真正的应用价值。

总体来说,2025年开始,中国人工智能从此前的通用模式的大模型之争,走向垂直细分市场的智能体竞技。

通过对细分功能如绘画、作曲、写作、编程等功能性服务,进行深度定制。

对于阿里千问来说,只有真正能作用于B端或C端,且显著有效,才有市场价值。

或者说,此前融入阿里生态,是阿里为用户直接制作了智能体,即过去的AI竞争是大模型的通用功能竞争。

当下的AI赛点是用大模型打磨出针对化服务的智能体。

此次千问推理模型,则是为智能体提供更好的智力支持,就看这个支持到底能让智商有多大程度提高,则市场就会有多大的拓展空间。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
韩鹏委屈了!海港亲证:青岛海牛这3分,真不是山东泰山在送人情

韩鹏委屈了!海港亲证:青岛海牛这3分,真不是山东泰山在送人情

足球大腕
2026-05-02 23:10:34
海港球迷意难平!不止因为1-3爆冷不敌海牛,更多在于以下五点!

海港球迷意难平!不止因为1-3爆冷不敌海牛,更多在于以下五点!

田先生篮球
2026-05-02 22:17:20
视频生成从"能生成"到"能卖钱",差的是什么?

视频生成从"能生成"到"能卖钱",差的是什么?

硅星人
2026-05-01 10:37:26
平凡岗位上,他们让劳模精神非凡绽放

平凡岗位上,他们让劳模精神非凡绽放

新华社
2026-05-01 16:04:30
范闲妻子剧组睡大佬了

范闲妻子剧组睡大佬了

毒舌扒姨太
2026-05-02 22:37:53
援助乌克兰的民间人士,是暗夜里发出的微光!

援助乌克兰的民间人士,是暗夜里发出的微光!

胖胖说他不胖
2026-04-27 19:18:07
斯诺克世锦赛半决赛:吴宜泽挽回2个赛点,17-16险胜强敌,进决赛

斯诺克世锦赛半决赛:吴宜泽挽回2个赛点,17-16险胜强敌,进决赛

侧身凌空斩
2026-05-03 06:23:49
新型出轨,越来越流行了!

新型出轨,越来越流行了!

黯泉
2026-04-16 21:56:14
比祖比门迪更强!阿森纳 3-0 大胜藏王炸,阿尔特塔找到新扎卡

比祖比门迪更强!阿森纳 3-0 大胜藏王炸,阿尔特塔找到新扎卡

奶盖熊本熊
2026-05-03 03:11:46
杨玉环陵墓出土,专家打开棺椁后发现,千年前的“传言”或被证实

杨玉环陵墓出土,专家打开棺椁后发现,千年前的“传言”或被证实

浩渺青史
2026-05-02 22:49:18
梁朝伟和汤唯在《色戒》里“假戏真做”?网友爆出截图:一目了然

梁朝伟和汤唯在《色戒》里“假戏真做”?网友爆出截图:一目了然

姜糖先生
2025-06-08 19:31:00
上海男篮4分惜败!结束23连胜,洛夫顿正式回归,冲击总冠军

上海男篮4分惜败!结束23连胜,洛夫顿正式回归,冲击总冠军

体坛瞎白话
2026-05-02 08:03:09
北京深圳两场热身结束!一胜一负,威廉姆斯强输出,赵睿打20分钟

北京深圳两场热身结束!一胜一负,威廉姆斯强输出,赵睿打20分钟

篮球资讯达人
2026-05-02 19:30:12
王石“裸泳”再登热搜!网友:身体非常好了,精气神儿不输小年轻

王石“裸泳”再登热搜!网友:身体非常好了,精气神儿不输小年轻

火山詩话
2026-04-30 10:27:30
我们小区就2栋楼50多户,竟有十多个啃老的年轻人,我算看明白了

我们小区就2栋楼50多户,竟有十多个啃老的年轻人,我算看明白了

蝉吟槐蕊
2026-05-02 06:35:50
为啥有人认为开车很耗精力?网友:我开长途会进入一种入定的状态

为啥有人认为开车很耗精力?网友:我开长途会进入一种入定的状态

带你感受人间冷暖
2026-05-02 14:36:51
20球,哲凯赖什是本赛季第三位各项赛事进球20+的英超球员

20球,哲凯赖什是本赛季第三位各项赛事进球20+的英超球员

懂球帝
2026-05-03 01:03:42
母亲和情夫一起10年,父亲默不作声纵容,却在他50岁生日那天反击

母亲和情夫一起10年,父亲默不作声纵容,却在他50岁生日那天反击

白云故事
2025-04-24 10:35:08
奥萨苏纳1-2巴塞罗那,赛后评分出炉:巴塞罗那16号第一

奥萨苏纳1-2巴塞罗那,赛后评分出炉:巴塞罗那16号第一

侧身凌空斩
2026-05-03 04:55:44
广东体育局官宣!19岁全红婵突然退赛,遗憾只是幌子,内情不简单

广东体育局官宣!19岁全红婵突然退赛,遗憾只是幌子,内情不简单

老吴教育课堂
2026-05-02 20:17:34
2026-05-03 07:55:00
书乐吐槽 incentive-icons
书乐吐槽
IT名博张书乐的吐槽地盘
4176文章数 13233关注度
往期回顾 全部

科技要闻

库克罕见"拒答"!苹果正被AI供应链卡脖子

头条要闻

伊朗公布伊方最新谈判方案: 总计14点提议 聚焦终战

头条要闻

伊朗公布伊方最新谈判方案: 总计14点提议 聚焦终战

体育要闻

休赛期总冠军,轮到休斯顿火箭

娱乐要闻

高圆圆赵又廷游三亚 牵手逛街好甜蜜

财经要闻

雷军很努力 小米还是跌破了30港元大关

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

家居
游戏
本地
房产
公开课

家居要闻

灵动实用 生活艺术场

网游圈换了一茬又一茬,唯有这个“异类”,却是越老越能打!

本地新闻

用青花瓷的方式,打开西溪湿地

房产要闻

五一楼市彻底明牌!塔尖人群都在重仓凯旋新世界

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版