网易首页 > 网易号 > 正文 申请入驻

全球AI智商排名今日出炉:Gemini 2.5 Pro登顶,爱因斯坦160分纪录仍未被超越

0
分享至

今日,由独立项目Trackingai.org 发布的全球首份大型语言模型智商测试报告引发广泛关注。该测试摒弃传统技术跑分,首次参照人类智商评估体系,对主流AI模型进行标准化智力测评。结果显示,谷歌Gemini 2.5 Pro以137分位列榜首,OpenAI的GPT-5 Pro与xAI的Grok 4分别获121分和125分,但无一超越爱因斯坦估算值160分的水平。

一、测试方法:双维度量化AI“脑力”

项目采用两种测评体系:

门萨标准测试:沿用人类智商评估标杆,130分以上视为“极超常智力”(即前2%顶尖人群);

AI专用数据集测试:覆盖大规模逻辑推理与模式识别任务,难度更高。

这种设计首次将AI能力转化为公众可理解的“智商数值”,打破了MMLU、HellaSwag等专业术语的认知壁垒。

二、头部模型表现:逻辑能力接近人类天才

(1)门萨测试结果:

Gemini 2.5 Pro(137分) :达到人类“极超常智力”标准,处理复杂逻辑推理与模式识别的能力媲美顶尖科学家群体。其解题路径展现高效的系统化思维,如在九宫格推理题中精准识别旋转对称规律。

Grok 4(125分) :虽分数低于Gemini,但解题过程凸显探索性思维,通过多维度分析(线条主题、数量变化)最终推导正确答案。

GPT-5 Pro(121分) :展现强大抽象能力,但在门萨测试中意外低于前代模型o3(分数未公开),开发者推测因技术路线取舍所致。

爱因斯坦参照系:后世估算其智商约160分,当前AI最高分仅达其85.6%,显示人类顶级智慧仍具优势。

(2)数据集测试排名:

GPT-5 Pro反超至第一,Gemini 2.5 Pro次之,Grok 4第四。这表明AI在专项逻辑任务中的表现更依赖训练数据规模与架构优化。

三、黑马与反思:AI智商的深层启示

DeepSeek R1成最大惊喜:该模型使用5月底旧版数据,仍获102分,超越Meta新一代Llama 4 Maverick。证明算法优化可弥补数据时效性缺陷,为开源社区提供“性价比”路径。

Meta的困境:曾引领开源浪潮的Llama系列此次未进头部,反映闭源模型在资源投入上的压倒性优势。Meta正以高薪争夺谷歌、OpenAI人才试图破局。

四、专家解读:智商测试的边界与意义

Trackingai.org 强调测评本质是“趣味实验”,因当前AI智商仅反映聚合性思维(规则下的逻辑演绎),而人类独有的发散性思维(创造力、社会情感认知)仍难被模仿。

技术意义:137分证明AI已成最强逻辑分析引擎,将重构人机协作范式。例如Gemini可辅助科研突破,Grok或更适配创新探索场景。

公众价值:用“智商”概念降低理解门槛,推动社会理性讨论AI能力边界。

结语

本次排名虽揭示AI在特定认知领域逼近人类顶尖水平,但爱因斯坦的智慧丰碑仍未被撼动。当Gemini们以137分的“超常智力”成为人类得力助手时,我们更需思考:如何培育AI无法替代的创造力与人文精神?这或许才是技术狂潮中坚守人类价值的核心命题。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
明早或发生史上最猛轰炸:川普称不妥协将4小时摧毁伊朗,跟中午·

明早或发生史上最猛轰炸:川普称不妥协将4小时摧毁伊朗,跟中午·

邵旭峰域
2026-04-07 15:15:50
伊朗召开新闻发布会

伊朗召开新闻发布会

澎湃新闻
2026-04-06 23:54:07
陈丽华离世!唐僧的扮演者迟重瑞能拿到100多亿遗产

陈丽华离世!唐僧的扮演者迟重瑞能拿到100多亿遗产

金牌娱乐
2026-04-07 11:39:53
594亿打了水漂!60多国缺席,奥运会仅5200人,中美均未前往

594亿打了水漂!60多国缺席,奥运会仅5200人,中美均未前往

拳击时空
2026-04-07 06:28:37
第2名美军飞行员躲在山岩缝隙里,与伊朗武装人员相距不到3公里

第2名美军飞行员躲在山岩缝隙里,与伊朗武装人员相距不到3公里

桑未落
2026-04-05 20:15:40
14分钟两次离谱错判!U20女足进球被吹,对手后卫手球被无视

14分钟两次离谱错判!U20女足进球被吹,对手后卫手球被无视

奥拜尔
2026-04-07 21:25:48
阿尔忒弥斯2号拍的地球和月球,和我们平时看到的不一样

阿尔忒弥斯2号拍的地球和月球,和我们平时看到的不一样

空天论道
2026-04-06 20:30:03
大学专业死亡潮,川大砍39个专业,全国砍4000个,都有一个共同点

大学专业死亡潮,川大砍39个专业,全国砍4000个,都有一个共同点

潮鹿逐梦
2026-04-07 14:42:03
41岁浙江未婚女子,在网上晒出一人晚餐,网友评论:活通透了

41岁浙江未婚女子,在网上晒出一人晚餐,网友评论:活通透了

小影的娱乐
2026-04-07 11:53:52
特朗普再次点名北约、澳大利亚、日本、韩国:都不帮忙

特朗普再次点名北约、澳大利亚、日本、韩国:都不帮忙

环球网资讯
2026-04-07 08:32:07
史上最卷五一档来了!10 部电影扎堆上映,这部片已提前锁定冠军

史上最卷五一档来了!10 部电影扎堆上映,这部片已提前锁定冠军

乡野小珥
2026-04-06 08:13:28
悲壮绝唱!伊朗关闭所有美外交渠道,1400万人愿赴死,硬刚特朗普最后通牒:决战到底!

悲壮绝唱!伊朗关闭所有美外交渠道,1400万人愿赴死,硬刚特朗普最后通牒:决战到底!

新浪财经
2026-04-08 00:43:15
越南政坛大洗牌!第16届国会开幕,13位重量级人物“意外”落选

越南政坛大洗牌!第16届国会开幕,13位重量级人物“意外”落选

缅甸中文网
2026-04-06 13:13:38
美国要变天了!一个比特朗普更难缠的80后,如今已掌握了共和党

美国要变天了!一个比特朗普更难缠的80后,如今已掌握了共和党

相思赋予谁a
2026-04-08 02:18:59
特朗普:若未能在4月7日晚8点前达成协议,美军可能“在晚上12点前摧毁伊朗境内每一座桥梁”

特朗普:若未能在4月7日晚8点前达成协议,美军可能“在晚上12点前摧毁伊朗境内每一座桥梁”

和讯网
2026-04-07 11:16:26
“专科男生古茗8小时”事件,被全网嘲笑:无知的人连装都不会装

“专科男生古茗8小时”事件,被全网嘲笑:无知的人连装都不会装

妍妍教育日记
2026-02-26 20:37:12
回购增持!上市公司密集出手!

回购增持!上市公司密集出手!

证券时报
2026-04-07 23:02:09
王宝强和女友开京牌大G到青岛,冯清人高马大,衬得宝强像小娇夫

王宝强和女友开京牌大G到青岛,冯清人高马大,衬得宝强像小娇夫

八怪娱
2026-04-07 15:02:12
杨丽萍“专属男舞伴”坠楼自杀,跳得果决,和杨丽萍关系非同一般

杨丽萍“专属男舞伴”坠楼自杀,跳得果决,和杨丽萍关系非同一般

一盅情怀
2026-04-03 07:49:11
她靠“冒牌”出道走红,成央视宠儿,四登春晚,如今靠浪姐又火了

她靠“冒牌”出道走红,成央视宠儿,四登春晚,如今靠浪姐又火了

八斗小先生
2026-04-06 15:43:14
2026-04-08 04:11:00
中科智媒
中科智媒
聚焦新闻前沿,每日热点速递
766文章数 11797关注度
往期回顾 全部

科技要闻

满嘴谎言!OpenAI奥特曼黑料大起底

头条要闻

特朗普:伊朗人愿为自由承受轰炸

头条要闻

特朗普:伊朗人愿为自由承受轰炸

体育要闻

斯洛特:去年我们在巴黎配得上输个0-4,比上周六踢曼城更配

娱乐要闻

女首富陈丽华离世 被曝生前已分好遗产

财经要闻

10万亿财政转移支付,被谁拿走了?

汽车要闻

不止是大 极狐首款MPV问道V9静态体验

态度原创

时尚
艺术
数码
游戏
本地

120元和120分钟,哪个更奢侈?

艺术要闻

深圳最惨地王复活?70亿起拍,曾规划中国第一高楼!

数码要闻

贱驴NV60磁轴键盘上市:显卡主题造型设计,899元

PlayStation全新炸裂计划公开!利好所有玩家

本地新闻

跟着歌声游安徽,听古村回响

无障碍浏览 进入关怀版