网易首页 > 网易号 > 正文 申请入驻

全球AI智商排名今日出炉:Gemini 2.5 Pro登顶,爱因斯坦160分纪录仍未被超越

0
分享至

今日,由独立项目Trackingai.org 发布的全球首份大型语言模型智商测试报告引发广泛关注。该测试摒弃传统技术跑分,首次参照人类智商评估体系,对主流AI模型进行标准化智力测评。结果显示,谷歌Gemini 2.5 Pro以137分位列榜首,OpenAI的GPT-5 Pro与xAI的Grok 4分别获121分和125分,但无一超越爱因斯坦估算值160分的水平。


一、测试方法:双维度量化AI“脑力”

项目采用两种测评体系:

门萨标准测试:沿用人类智商评估标杆,130分以上视为“极超常智力”(即前2%顶尖人群);


AI专用数据集测试:覆盖大规模逻辑推理与模式识别任务,难度更高。

这种设计首次将AI能力转化为公众可理解的“智商数值”,打破了MMLU、HellaSwag等专业术语的认知壁垒。

二、头部模型表现:逻辑能力接近人类天才

(1)门萨测试结果:

Gemini 2.5 Pro(137分) :达到人类“极超常智力”标准,处理复杂逻辑推理与模式识别的能力媲美顶尖科学家群体。其解题路径展现高效的系统化思维,如在九宫格推理题中精准识别旋转对称规律。

Grok 4(125分) :虽分数低于Gemini,但解题过程凸显探索性思维,通过多维度分析(线条主题、数量变化)最终推导正确答案。

GPT-5 Pro(121分) :展现强大抽象能力,但在门萨测试中意外低于前代模型o3(分数未公开),开发者推测因技术路线取舍所致。

爱因斯坦参照系:后世估算其智商约160分,当前AI最高分仅达其85.6%,显示人类顶级智慧仍具优势。

(2)数据集测试排名:

GPT-5 Pro反超至第一,Gemini 2.5 Pro次之,Grok 4第四。这表明AI在专项逻辑任务中的表现更依赖训练数据规模与架构优化。

三、黑马与反思:AI智商的深层启示

DeepSeek R1成最大惊喜:该模型使用5月底旧版数据,仍获102分,超越Meta新一代Llama 4 Maverick。证明算法优化可弥补数据时效性缺陷,为开源社区提供“性价比”路径。


Meta的困境:曾引领开源浪潮的Llama系列此次未进头部,反映闭源模型在资源投入上的压倒性优势。Meta正以高薪争夺谷歌、OpenAI人才试图破局。

四、专家解读:智商测试的边界与意义

Trackingai.org 强调测评本质是“趣味实验”,因当前AI智商仅反映聚合性思维(规则下的逻辑演绎),而人类独有的发散性思维(创造力、社会情感认知)仍难被模仿。


技术意义:137分证明AI已成最强逻辑分析引擎,将重构人机协作范式。例如Gemini可辅助科研突破,Grok或更适配创新探索场景。

公众价值:用“智商”概念降低理解门槛,推动社会理性讨论AI能力边界。

结语

本次排名虽揭示AI在特定认知领域逼近人类顶尖水平,但爱因斯坦的智慧丰碑仍未被撼动。当Gemini们以137分的“超常智力”成为人类得力助手时,我们更需思考:如何培育AI无法替代的创造力与人文精神?这或许才是技术狂潮中坚守人类价值的核心命题。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
果然不出所料,委内瑞拉的石油“有问题”,只有中国能安稳开采!

果然不出所料,委内瑞拉的石油“有问题”,只有中国能安稳开采!

古事寻踪记
2026-01-13 07:10:23
第一次和女朋友同居,真是让我大开眼界!你们的女朋友也是这样吗

第一次和女朋友同居,真是让我大开眼界!你们的女朋友也是这样吗

阿凯销售场
2026-01-01 10:07:29
这居然是孙怡!

这居然是孙怡!

陆万万
2026-01-12 22:10:12
心脏与花生的关系,提醒:若想保护心脏健康,尽量少吃这7种坚果

心脏与花生的关系,提醒:若想保护心脏健康,尽量少吃这7种坚果

岐黄传人孙大夫
2025-12-24 09:30:24
美国将暂停 对75个国家的所有签证

美国将暂停 对75个国家的所有签证

每日经济新闻
2026-01-14 23:15:22
回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

就一点
2025-10-09 12:19:42
全程眼神空洞,拿腔作势,一人连累整部剧?《小城大事》还能追吗

全程眼神空洞,拿腔作势,一人连累整部剧?《小城大事》还能追吗

娱说瑜悦
2026-01-14 23:55:36
朝鲜不会成为第二个委内瑞拉!因为朝鲜有两个后盾

朝鲜不会成为第二个委内瑞拉!因为朝鲜有两个后盾

米君文史
2026-01-07 10:01:47
“早大寒,春节脱棉袄;晚大寒,春节雪堵门”,今年大寒在哪?

“早大寒,春节脱棉袄;晚大寒,春节雪堵门”,今年大寒在哪?

普陀动物世界
2026-01-14 01:21:01
特朗普“抢劫失败”,两艘中国油轮果断掉头,一桶高价石油也没买

特朗普“抢劫失败”,两艘中国油轮果断掉头,一桶高价石油也没买

听风行天涯
2026-01-15 01:20:35
离婚才3个月,高调谈论再婚的李亚鹏,没给海哈金喜留一丝体面

离婚才3个月,高调谈论再婚的李亚鹏,没给海哈金喜留一丝体面

人间无味啊
2026-01-14 00:15:59
王石田朴珺运动照流出!网友:这老头,太不容易了……

王石田朴珺运动照流出!网友:这老头,太不容易了……

麦杰逊
2026-01-13 12:09:35
600亿存储龙头,净利润预计暴增520%

600亿存储龙头,净利润预计暴增520%

21世纪经济报道
2026-01-14 16:41:28
大反转!北京国安这是什么操作?官宣续约两名必走之人,球迷热议

大反转!北京国安这是什么操作?官宣续约两名必走之人,球迷热议

罗掌柜体育
2026-01-14 10:02:54
2026年有贵人,有靠山,3生肖地上生金,转大运连连

2026年有贵人,有靠山,3生肖地上生金,转大运连连

人閒情事
2026-01-11 16:33:42
国民党老将被逮捕,郑丽文1个出人意料的举动,令赖清德计谋白费

国民党老将被逮捕,郑丽文1个出人意料的举动,令赖清德计谋白费

策略述
2026-01-10 12:57:46
32岁章泽天,做节目采访刘嘉玲,网友评价:年轻,漂亮,还有脑子

32岁章泽天,做节目采访刘嘉玲,网友评价:年轻,漂亮,还有脑子

娱乐圈笔娱君
2026-01-14 15:44:00
接连道歉!停产十多年,知名零食回归后被指“擦边”!是很多人的童年回忆

接连道歉!停产十多年,知名零食回归后被指“擦边”!是很多人的童年回忆

南方都市报
2026-01-14 10:15:26
玩得不亦乐乎,勇士队库里和巴特勒在大胜开拓者队时尽情嬉闹

玩得不亦乐乎,勇士队库里和巴特勒在大胜开拓者队时尽情嬉闹

好火子
2026-01-15 01:25:23
骑了 练了 拍了 该干的干了

骑了 练了 拍了 该干的干了

飛娱日记
2026-01-12 08:38:22
2026-01-15 04:08:49
新网科技
新网科技
聚焦新闻前沿,每日热点速递
653文章数 11782关注度
往期回顾 全部

科技要闻

携程因涉嫌垄断被市场监管总局调查

头条要闻

外媒揭美对伊朗动手方案:派特种部队对高层实施"斩首"

头条要闻

外媒揭美对伊朗动手方案:派特种部队对高层实施"斩首"

体育要闻

你是个好球员,我们就拿你交易吧

娱乐要闻

网红彭十六偷税被封杀 曾成功转型明星

财经要闻

携程被立案调查,最高或被罚超50亿

汽车要闻

曝Model Y或降到20万以内!

态度原创

健康
亲子
教育
时尚
本地

血常规3项异常,是身体警报!

亲子要闻

笑麻了!宝妈求教给娃买衣服不便宜,穿起来土里土气!评论区炸锅

教育要闻

年轻妈妈带男孩坐地铁,坐姿引发热议!网友:这才是真正的“炫富”!

最时髦的单品,难道不是背肌吗?

本地新闻

邵阳公益诉讼检察主题曲:《守望星》

无障碍浏览 进入关怀版