网易首页 > 网易号 > 正文 申请入驻

全球AI智商排名今日出炉:Gemini 2.5 Pro登顶,爱因斯坦160分纪录仍未被超越

0
分享至

今日,由独立项目Trackingai.org 发布的全球首份大型语言模型智商测试报告引发广泛关注。该测试摒弃传统技术跑分,首次参照人类智商评估体系,对主流AI模型进行标准化智力测评。结果显示,谷歌Gemini 2.5 Pro以137分位列榜首,OpenAI的GPT-5 Pro与xAI的Grok 4分别获121分和125分,但无一超越爱因斯坦估算值160分的水平。

一、测试方法:双维度量化AI“脑力”

项目采用两种测评体系:

门萨标准测试:沿用人类智商评估标杆,130分以上视为“极超常智力”(即前2%顶尖人群);

AI专用数据集测试:覆盖大规模逻辑推理与模式识别任务,难度更高。

这种设计首次将AI能力转化为公众可理解的“智商数值”,打破了MMLU、HellaSwag等专业术语的认知壁垒。

二、头部模型表现:逻辑能力接近人类天才

(1)门萨测试结果:

Gemini 2.5 Pro(137分) :达到人类“极超常智力”标准,处理复杂逻辑推理与模式识别的能力媲美顶尖科学家群体。其解题路径展现高效的系统化思维,如在九宫格推理题中精准识别旋转对称规律。

Grok 4(125分) :虽分数低于Gemini,但解题过程凸显探索性思维,通过多维度分析(线条主题、数量变化)最终推导正确答案。

GPT-5 Pro(121分) :展现强大抽象能力,但在门萨测试中意外低于前代模型o3(分数未公开),开发者推测因技术路线取舍所致。

爱因斯坦参照系:后世估算其智商约160分,当前AI最高分仅达其85.6%,显示人类顶级智慧仍具优势。

(2)数据集测试排名:

GPT-5 Pro反超至第一,Gemini 2.5 Pro次之,Grok 4第四。这表明AI在专项逻辑任务中的表现更依赖训练数据规模与架构优化。

三、黑马与反思:AI智商的深层启示

DeepSeek R1成最大惊喜:该模型使用5月底旧版数据,仍获102分,超越Meta新一代Llama 4 Maverick。证明算法优化可弥补数据时效性缺陷,为开源社区提供“性价比”路径。

Meta的困境:曾引领开源浪潮的Llama系列此次未进头部,反映闭源模型在资源投入上的压倒性优势。Meta正以高薪争夺谷歌、OpenAI人才试图破局。

四、专家解读:智商测试的边界与意义

Trackingai.org 强调测评本质是“趣味实验”,因当前AI智商仅反映聚合性思维(规则下的逻辑演绎),而人类独有的发散性思维(创造力、社会情感认知)仍难被模仿。

技术意义:137分证明AI已成最强逻辑分析引擎,将重构人机协作范式。例如Gemini可辅助科研突破,Grok或更适配创新探索场景。

公众价值:用“智商”概念降低理解门槛,推动社会理性讨论AI能力边界。

结语

本次排名虽揭示AI在特定认知领域逼近人类顶尖水平,但爱因斯坦的智慧丰碑仍未被撼动。当Gemini们以137分的“超常智力”成为人类得力助手时,我们更需思考:如何培育AI无法替代的创造力与人文精神?这或许才是技术狂潮中坚守人类价值的核心命题。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李湘瘦脱相了,这腰身哪像当妈的,直接跟王诗龄站成了姐妹花。

李湘瘦脱相了,这腰身哪像当妈的,直接跟王诗龄站成了姐妹花。

科学发掘
2026-04-28 08:59:52
存款大局已定下:不出意外的话,2026年起居民储蓄或面临3大变化

存款大局已定下:不出意外的话,2026年起居民储蓄或面临3大变化

青梅侃史啊
2026-04-29 14:37:43
炸裂!北京车展恶性事件!尚界展车惨遭人为损毁,法务部硬核发声

炸裂!北京车展恶性事件!尚界展车惨遭人为损毁,法务部硬核发声

天天热点见闻
2026-04-27 06:27:09
体坛周报名嘴指出广东队问题:教练就像一条鱼,时间长了就发臭

体坛周报名嘴指出广东队问题:教练就像一条鱼,时间长了就发臭

小徐讲八卦
2026-04-29 06:00:00
陈独秀之女为避批斗绑桶漂海,漂十余小时登岸遇警,结局出人意料

陈独秀之女为避批斗绑桶漂海,漂十余小时登岸遇警,结局出人意料

磊子讲史
2026-03-31 16:16:18
突发,金价暴跌!

突发,金价暴跌!

吉刻新闻
2026-04-29 09:41:29
71.5%!历史性暴跌,以贷养贷的泡沫崩了

71.5%!历史性暴跌,以贷养贷的泡沫崩了

月满大江流
2026-04-16 13:54:38
40岁诺伊尔崩溃 全场最低5.2分:0扑救+8数据挂零 巴黎5射正5进球

40岁诺伊尔崩溃 全场最低5.2分:0扑救+8数据挂零 巴黎5射正5进球

风过乡
2026-04-29 06:21:54
NBA敲定反摆烂方案!命名3-2-1乐透规则 将于2027年选秀生效

NBA敲定反摆烂方案!命名3-2-1乐透规则 将于2027年选秀生效

罗说NBA
2026-04-29 06:06:03
收视第一!央视这次又押对宝了,终于有可以看的都市剧了

收视第一!央视这次又押对宝了,终于有可以看的都市剧了

乡野小珥
2026-04-29 15:58:50
没心思打伊朗了!不到24小时,以色列迎来2大麻烦,内塔或将下台

没心思打伊朗了!不到24小时,以色列迎来2大麻烦,内塔或将下台

混沌录
2026-04-28 20:43:05
人民日报:换主食抗炎6周见效!研究发现:肠道菌群是“调节器”

人民日报:换主食抗炎6周见效!研究发现:肠道菌群是“调节器”

肠菌科普
2026-04-29 09:17:59
谁能想到!五届全明星,手握四枚冠军戒指的他,36岁在鱼腩打替补

谁能想到!五届全明星,手握四枚冠军戒指的他,36岁在鱼腩打替补

球毛鬼胎
2026-04-29 12:14:36
79年越军假冒我军用中文下令:炮火打近200米!通讯兵3秒做出选择

79年越军假冒我军用中文下令:炮火打近200米!通讯兵3秒做出选择

卡西莫多的故事
2026-04-16 10:50:52
普京想不到!就连马克龙也想不到!特朗普居然承认:放弃全球霸权

普京想不到!就连马克龙也想不到!特朗普居然承认:放弃全球霸权

安安说
2026-04-28 10:57:18
深圳这天,吴彦祖发福、周润发干瘪,郭富城穿10cm厚底鞋还矮半头

深圳这天,吴彦祖发福、周润发干瘪,郭富城穿10cm厚底鞋还矮半头

秋姐居
2026-04-27 19:35:02
罗马诺:皇马15天前就得知穆里尼奥可以回归

罗马诺:皇马15天前就得知穆里尼奥可以回归

懂球帝
2026-04-28 23:17:24
不出 5 年,中国贬值最快的不是房子和现金,而是这 3 样东西

不出 5 年,中国贬值最快的不是房子和现金,而是这 3 样东西

细说职场
2026-04-26 21:04:20
055发射鹰击20视频,让外媒吓破胆:这是对美日菲军演的回应!

055发射鹰击20视频,让外媒吓破胆:这是对美日菲军演的回应!

顾史
2026-04-29 01:33:53
天地会逃到海外,成立了一个国家,面积比两个日本大,至今说汉语

天地会逃到海外,成立了一个国家,面积比两个日本大,至今说汉语

史之铭
2026-04-27 16:15:05
2026-04-29 17:15:00
中科智媒
中科智媒
聚焦新闻前沿,每日热点速递
852文章数 11801关注度
往期回顾 全部

科技要闻

今晨庭审纪实|马斯克当庭讲述OpenAI被偷走

头条要闻

孙杨方回应"孙杨妈妈要求删除马頔发言":毫无事实依据

头条要闻

孙杨方回应"孙杨妈妈要求删除马頔发言":毫无事实依据

体育要闻

一场九球狂欢,各路神仙批量下凡

娱乐要闻

马頔一句话,孙杨妈妈怒骂节目组2小时

财经要闻

曾经的新能源首富,希望又破了!

汽车要闻

配32寸升降屏 新款别克世纪CENTURY上市53.99万起

态度原创

时尚
家居
房产
游戏
数码

除了“薄底鞋”,今年最流行这5双鞋,怎么搭都好看!

家居要闻

寂然无界 简洁风格

房产要闻

80亿投资!浙商总部基地+海口北站,金沙湾这是要起飞啊!

中西晃史解释《生化危机9》里昂戴戒指 只是老去的象征!

数码要闻

华为MateBook 14鸿蒙版电脑HarmonyOS 6.1版本发布

无障碍浏览 进入关怀版