网易首页 > 网易号 > 正文 申请入驻

全球AI智商排名今日出炉:Gemini 2.5 Pro登顶,爱因斯坦160分纪录仍未被超越

0
分享至

今日,由独立项目Trackingai.org 发布的全球首份大型语言模型智商测试报告引发广泛关注。该测试摒弃传统技术跑分,首次参照人类智商评估体系,对主流AI模型进行标准化智力测评。结果显示,谷歌Gemini 2.5 Pro以137分位列榜首,OpenAI的GPT-5 Pro与xAI的Grok 4分别获121分和125分,但无一超越爱因斯坦估算值160分的水平。

一、测试方法:双维度量化AI“脑力”

项目采用两种测评体系:

门萨标准测试:沿用人类智商评估标杆,130分以上视为“极超常智力”(即前2%顶尖人群);

AI专用数据集测试:覆盖大规模逻辑推理与模式识别任务,难度更高。

这种设计首次将AI能力转化为公众可理解的“智商数值”,打破了MMLU、HellaSwag等专业术语的认知壁垒。

二、头部模型表现:逻辑能力接近人类天才

(1)门萨测试结果:

Gemini 2.5 Pro(137分) :达到人类“极超常智力”标准,处理复杂逻辑推理与模式识别的能力媲美顶尖科学家群体。其解题路径展现高效的系统化思维,如在九宫格推理题中精准识别旋转对称规律。

Grok 4(125分) :虽分数低于Gemini,但解题过程凸显探索性思维,通过多维度分析(线条主题、数量变化)最终推导正确答案。

GPT-5 Pro(121分) :展现强大抽象能力,但在门萨测试中意外低于前代模型o3(分数未公开),开发者推测因技术路线取舍所致。

爱因斯坦参照系:后世估算其智商约160分,当前AI最高分仅达其85.6%,显示人类顶级智慧仍具优势。

(2)数据集测试排名:

GPT-5 Pro反超至第一,Gemini 2.5 Pro次之,Grok 4第四。这表明AI在专项逻辑任务中的表现更依赖训练数据规模与架构优化。

三、黑马与反思:AI智商的深层启示

DeepSeek R1成最大惊喜:该模型使用5月底旧版数据,仍获102分,超越Meta新一代Llama 4 Maverick。证明算法优化可弥补数据时效性缺陷,为开源社区提供“性价比”路径。

Meta的困境:曾引领开源浪潮的Llama系列此次未进头部,反映闭源模型在资源投入上的压倒性优势。Meta正以高薪争夺谷歌、OpenAI人才试图破局。

四、专家解读:智商测试的边界与意义

Trackingai.org 强调测评本质是“趣味实验”,因当前AI智商仅反映聚合性思维(规则下的逻辑演绎),而人类独有的发散性思维(创造力、社会情感认知)仍难被模仿。

技术意义:137分证明AI已成最强逻辑分析引擎,将重构人机协作范式。例如Gemini可辅助科研突破,Grok或更适配创新探索场景。

公众价值:用“智商”概念降低理解门槛,推动社会理性讨论AI能力边界。

结语

本次排名虽揭示AI在特定认知领域逼近人类顶尖水平,但爱因斯坦的智慧丰碑仍未被撼动。当Gemini们以137分的“超常智力”成为人类得力助手时,我们更需思考:如何培育AI无法替代的创造力与人文精神?这或许才是技术狂潮中坚守人类价值的核心命题。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
苹果iPhone 18 Pro Max实锤!9月正式发布

苹果iPhone 18 Pro Max实锤!9月正式发布

叮当当科技
2026-04-09 05:32:27
打击伊朗为何不需要太多美军呢?因为只需打垮12.5万革命卫队而已

打击伊朗为何不需要太多美军呢?因为只需打垮12.5万革命卫队而已

民间胡扯老哥
2026-03-30 05:05:52
统一大局已定,台湾回归后,马英九与洪秀柱谁更适合当台湾省长?

统一大局已定,台湾回归后,马英九与洪秀柱谁更适合当台湾省长?

小祁谈历史
2026-04-11 03:17:25
“看面相就很蠢!”五年级女孩对妈妈大吼滚出去,网友都看不下去

“看面相就很蠢!”五年级女孩对妈妈大吼滚出去,网友都看不下去

妍妍教育日记
2026-03-16 19:28:27
美国下狠手!美拟全面禁止中国实验室检测美版手机、电脑、相机

美国下狠手!美拟全面禁止中国实验室检测美版手机、电脑、相机

粤语音乐喷泉
2026-04-10 02:33:29
北海市一栋大别墅160万起拍卖,26人抢拍,最后又被房东432万竞得

北海市一栋大别墅160万起拍卖,26人抢拍,最后又被房东432万竞得

天天话事
2026-04-11 12:01:17
夏克立宣布再婚生女:和另一位家长生了个孩子,再否认睡女粉

夏克立宣布再婚生女:和另一位家长生了个孩子,再否认睡女粉

枫尘余往逝
2026-04-03 11:24:38
外交部公开发声,10字定性郑丽文访问大陆,白岩松的话果真没说错

外交部公开发声,10字定性郑丽文访问大陆,白岩松的话果真没说错

阿纂看事
2026-04-11 15:53:22
采耳变卖淫?女技师可变装,躺采色诱客人,有反应了就直接脱裤子

采耳变卖淫?女技师可变装,躺采色诱客人,有反应了就直接脱裤子

乌娱子酱
2025-03-19 10:27:30
性学专家李银河说:“能不能发生关系,第一次见面就差不多定了”

性学专家李银河说:“能不能发生关系,第一次见面就差不多定了”

九哥哥车评
2026-03-31 13:30:36
阿尔特塔「打脸」自己:9分优势剩6天,曼城笑了

阿尔特塔「打脸」自己:9分优势剩6天,曼城笑了

赛场速报局
2026-04-11 23:53:18
大杀器终于到手!马克龙大谈中国,他断定:法国翻盘的机会来了

大杀器终于到手!马克龙大谈中国,他断定:法国翻盘的机会来了

触摸史迹
2026-04-10 15:20:30
高速收费5月1日起变了!不按最远路径计费,车主出行迎实惠

高速收费5月1日起变了!不按最远路径计费,车主出行迎实惠

小谈食刻美食
2026-04-11 10:12:23
自完成红军首秀以来,萨拉赫英超参与进球比别人至少多109个

自完成红军首秀以来,萨拉赫英超参与进球比别人至少多109个

懂球帝
2026-04-12 02:38:28
盘点足坛历史最高年薪Top30:沙特疯狂撒钱,金元中超太恐怖?

盘点足坛历史最高年薪Top30:沙特疯狂撒钱,金元中超太恐怖?

仰卧撑FTUer
2026-04-12 03:07:03
13岁被富豪狂追六年,旺夫脸一晚狂赚13亿

13岁被富豪狂追六年,旺夫脸一晚狂赚13亿

眼底星碎
2026-04-11 07:33:07
张嘉译迎来56生日!在西安大别墅请客,别墅院子很气派,还有假山

张嘉译迎来56生日!在西安大别墅请客,别墅院子很气派,还有假山

离离言几许
2026-04-09 13:17:57
深度长文:黄种人、黑人、白人为何能自由交配并繁衍后代?

深度长文:黄种人、黑人、白人为何能自由交配并繁衍后代?

宇宙时空
2026-04-11 15:15:50
女王谭维维太美了,露香肩渐变皮衣勒出S曲线,这气场谁顶得住?

女王谭维维太美了,露香肩渐变皮衣勒出S曲线,这气场谁顶得住?

娱乐领航家
2026-04-05 19:38:20
云南一方丈意外身亡整理遗物发现卡内有498万,方丈女儿提出继承

云南一方丈意外身亡整理遗物发现卡内有498万,方丈女儿提出继承

霹雳炮
2026-03-10 22:56:02
2026-04-12 03:32:49
中科智媒
中科智媒
聚焦新闻前沿,每日热点速递
780文章数 11797关注度
往期回顾 全部

科技要闻

半夜被燃烧瓶砸醒,OpenAI CEO发文反思

头条要闻

事关霍尔木兹海峡通行安排 伊美各执一词

头条要闻

事关霍尔木兹海峡通行安排 伊美各执一词

体育要闻

换帅之后,他们从降级区冲到升级区

娱乐要闻

郑钧回应儿子走路:会监督他挺直腰板

财经要闻

从日本翻身看:这次谁能扛住高油价?

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

家居
手机
亲子
公开课
军事航空

家居要闻

复古风格 自然简约

手机要闻

全球首款阔折叠卖爆!华为Pura X一年出货量超150万台

亲子要闻

孩子出现这些行为,不是早恋那么简单!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗议长带四名遇难儿童照片赴美伊谈判

无障碍浏览 进入关怀版