网易首页 > 网易号 > 正文 申请入驻

全球AI智商排名今日出炉:Gemini 2.5 Pro登顶,爱因斯坦160分纪录仍未被超越

0
分享至

今日,由独立项目Trackingai.org 发布的全球首份大型语言模型智商测试报告引发广泛关注。该测试摒弃传统技术跑分,首次参照人类智商评估体系,对主流AI模型进行标准化智力测评。结果显示,谷歌Gemini 2.5 Pro以137分位列榜首,OpenAI的GPT-5 Pro与xAI的Grok 4分别获121分和125分,但无一超越爱因斯坦估算值160分的水平。

一、测试方法:双维度量化AI“脑力”

项目采用两种测评体系:

门萨标准测试:沿用人类智商评估标杆,130分以上视为“极超常智力”(即前2%顶尖人群);

AI专用数据集测试:覆盖大规模逻辑推理与模式识别任务,难度更高。

这种设计首次将AI能力转化为公众可理解的“智商数值”,打破了MMLU、HellaSwag等专业术语的认知壁垒。

二、头部模型表现:逻辑能力接近人类天才

(1)门萨测试结果:

Gemini 2.5 Pro(137分) :达到人类“极超常智力”标准,处理复杂逻辑推理与模式识别的能力媲美顶尖科学家群体。其解题路径展现高效的系统化思维,如在九宫格推理题中精准识别旋转对称规律。

Grok 4(125分) :虽分数低于Gemini,但解题过程凸显探索性思维,通过多维度分析(线条主题、数量变化)最终推导正确答案。

GPT-5 Pro(121分) :展现强大抽象能力,但在门萨测试中意外低于前代模型o3(分数未公开),开发者推测因技术路线取舍所致。

爱因斯坦参照系:后世估算其智商约160分,当前AI最高分仅达其85.6%,显示人类顶级智慧仍具优势。

(2)数据集测试排名:

GPT-5 Pro反超至第一,Gemini 2.5 Pro次之,Grok 4第四。这表明AI在专项逻辑任务中的表现更依赖训练数据规模与架构优化。

三、黑马与反思:AI智商的深层启示

DeepSeek R1成最大惊喜:该模型使用5月底旧版数据,仍获102分,超越Meta新一代Llama 4 Maverick。证明算法优化可弥补数据时效性缺陷,为开源社区提供“性价比”路径。

Meta的困境:曾引领开源浪潮的Llama系列此次未进头部,反映闭源模型在资源投入上的压倒性优势。Meta正以高薪争夺谷歌、OpenAI人才试图破局。

四、专家解读:智商测试的边界与意义

Trackingai.org 强调测评本质是“趣味实验”,因当前AI智商仅反映聚合性思维(规则下的逻辑演绎),而人类独有的发散性思维(创造力、社会情感认知)仍难被模仿。

技术意义:137分证明AI已成最强逻辑分析引擎,将重构人机协作范式。例如Gemini可辅助科研突破,Grok或更适配创新探索场景。

公众价值:用“智商”概念降低理解门槛,推动社会理性讨论AI能力边界。

结语

本次排名虽揭示AI在特定认知领域逼近人类顶尖水平,但爱因斯坦的智慧丰碑仍未被撼动。当Gemini们以137分的“超常智力”成为人类得力助手时,我们更需思考:如何培育AI无法替代的创造力与人文精神?这或许才是技术狂潮中坚守人类价值的核心命题。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
生活不易奥特曼耕地...

生活不易奥特曼耕地...

超级数学建模
2026-04-07 22:52:09
陈云晚年首次披露:遵义会议上这两个人死活不同意毛主席,吵得面红耳赤

陈云晚年首次披露:遵义会议上这两个人死活不同意毛主席,吵得面红耳赤

老杉说历史
2026-03-21 17:38:44
豪取17连胜!随着上海119-97轻取宁波,这三人堪称赢球绝对功臣!

豪取17连胜!随着上海119-97轻取宁波,这三人堪称赢球绝对功臣!

田先生篮球
2026-04-08 22:14:38
从惊魂到TACO--特朗普震惊世界的12小时

从惊魂到TACO--特朗普震惊世界的12小时

华尔街见闻官方
2026-04-08 11:06:14
只静静装点每一步

只静静装点每一步

有一点可爱
2026-04-05 17:19:15
斯诺克世锦赛:中国6胜3负,新科冠军9-10被"打爆",美女球手封神

斯诺克世锦赛:中国6胜3负,新科冠军9-10被"打爆",美女球手封神

田心生活
2026-04-08 12:39:43
美国完全陷入中国的圈套!纽约时报:特朗普正在领导超级大国自杀

美国完全陷入中国的圈套!纽约时报:特朗普正在领导超级大国自杀

混沌录
2026-04-07 22:00:06
57岁郑丽文懂审美!穿紫色西服很干练,一举一动都透着女强人气场

57岁郑丽文懂审美!穿紫色西服很干练,一举一动都透着女强人气场

八八尚语
2026-04-08 10:25:52
300390,一季度净利最高预增32120.45%!

300390,一季度净利最高预增32120.45%!

证券时报e公司
2026-04-08 19:15:20
哈佛大学50年研究揭示:拉开人生差距的,不是智商,而是3个习惯

哈佛大学50年研究揭示:拉开人生差距的,不是智商,而是3个习惯

千秋文化
2026-04-07 19:44:05
张姩菡妈妈李丽婧发文澄清:非博士学位,人在江苏陪女儿

张姩菡妈妈李丽婧发文澄清:非博士学位,人在江苏陪女儿

魔都姐姐杂谈
2026-04-07 18:22:36
英超头名花15年养出的核心,被倒数第二截胡了

英超头名花15年养出的核心,被倒数第二截胡了

竞技风云录
2026-04-09 01:06:14
美军高官称停火只是暂时 随时准备战斗

美军高官称停火只是暂时 随时准备战斗

新华社
2026-04-08 20:49:35
意大利连续3届世界杯出局,23岁后卫把痛苦转嫁给阿森纳对手

意大利连续3届世界杯出局,23岁后卫把痛苦转嫁给阿森纳对手

篮坛第一线
2026-04-09 01:03:24
阳光自信的微胖女生:胖,从不是快乐的阻碍

阳光自信的微胖女生:胖,从不是快乐的阻碍

疾跑的小蜗牛
2026-04-08 23:23:24
张雪都夸的豪爵摩托,今年将新出4款,涵盖125—350,有中意的吗

张雪都夸的豪爵摩托,今年将新出4款,涵盖125—350,有中意的吗

小李子体育
2026-04-08 16:47:01
马斯克被调查,炸上热搜!

马斯克被调查,炸上热搜!

财经三分钟pro
2026-04-08 15:15:17
中国商飞C939研发计划曝光,目标推力50吨

中国商飞C939研发计划曝光,目标推力50吨

林子说事
2026-04-07 02:21:42
维蒂尼亚:联赛成绩不会影响利物浦欧冠表现,我们要保持警惕

维蒂尼亚:联赛成绩不会影响利物浦欧冠表现,我们要保持警惕

懂球帝
2026-04-09 01:02:21
杀害女童凶手被扒光!与丈夫常年分居,村民曝恶行,坐牢只是开始

杀害女童凶手被扒光!与丈夫常年分居,村民曝恶行,坐牢只是开始

星星会坠落
2026-04-09 00:17:10
2026-04-09 01:47:00
中科智媒
中科智媒
聚焦新闻前沿,每日热点速递
770文章数 11797关注度
往期回顾 全部

科技要闻

造出地表最强AI,却死活不给你用!

头条要闻

伊朗武装部队:伊朗对美以绝不信任

头条要闻

伊朗武装部队:伊朗对美以绝不信任

体育要闻

40岁,但实力倒退12年

娱乐要闻

侯佩岑全家悉尼度假,一家四口幸福满溢

财经要闻

天津海河乳业回应直播间涉黄

汽车要闻

20万级满配华为全家桶 华境S是懂家庭的大六座

态度原创

健康
游戏
旅游
房产
公开课

干细胞抗衰4大误区,90%的人都中招

真爱拉电线!《终末地》日本市场收入超中国:全球第一

旅游要闻

三大花海已浪漫盛放!来这里“花”点时间!

房产要闻

正式动工!珠城马场地块,签约华尔道夫!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版