网易首页 > 网易号 > 正文 申请入驻

GPT-5 智商测试 57 分垫底再次引爆全网,这是降智还是降本?

0
分享至

GPT-5 上线以来的表现引发了巨大争议,被指降智下滑,GPT-4o 也强烈呼声下回归。

今天一个测试结果再次把 GPT-5 推上风口浪尖,在知名的挪威门萨智商测试中, GPT-5 创下了模型中最差的记录

1️⃣ GPT-5 Thinking 在测试中得分 85,在离线测试中得分 57,直接垫底。

2️⃣ GPT-5 得分 118,线下测试得分 70

这个并不是门萨官方给 AI 做的测试,而是有人把挪威门萨向公众免费公开的 35 道图形推理题(test.mensa.no)直接拿去给大模型做,然后按人类常模换算出一个「IQ 分数」。

‍♂️ 这个测试可一定程度衡量 AI 的逻辑推理、抽象思维与问题解决能力,帮助我们了解 AI 在这些方面的发展水平,还能标准化对比不同 AI 模型的智能水平。

如 OpenAI 的 o1 模型在测试中取得超 120 分,高于其他顶尖 AI 模型,显示出其在复杂逻辑和视觉难题上的出色能力。

不过,依据智商测试分数并不能准确判断 AI 的综合智能水平。既不能直接类比成人格化的「比人类聪明」,也不代表 AI 具备与人类相同的抽象智能。

想比较模型,统一用同一套离线、未泄露的图形推理题+同样 prompting 才有意义。

真要评估 AI 的「通用推理」,应使用 ARC、GPQA、MATH 这类专门为机器设计、且不断更新题库的研究基准,而非人类 IQ 测试。

但结果最近的反馈来看,GPT-5 的确出现了不小的问题,至少对比官方公布的各种霸榜的参数,在实际体验上有着明显的差距。

在昨天 OpenAI 在社区的 AMA 中,奥特曼也承认 GPT-5的「智能路由」坏了,导致 GPT-5 变笨,并进行了修复和调整。

❓ 行业里还有一种猜测, GPT-5 一开始就不追求做「最强王者」,而是 OpenAI 降本增效的「秘密武器」。

目标是在现有现金储备下,搞一个 2025 年人人都能用的版本,顺便把钱给赚了。

今天 OpenAI 已经宣布 GPT-5 模型目前现已向所有 Plus、Pro、Team 和免费用户全面开放,后续的体验是否会变化,APPSO 也会持续使用并反馈给大家。













特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
从杀猪盘到19天13板!嘉美包装股价大反转,是狂欢还是陷阱?

从杀猪盘到19天13板!嘉美包装股价大反转,是狂欢还是陷阱?

财经市界
2026-01-18 22:28:31
李亚鹏必须道歉,否则房租涨价也不会租给他了,房东最新回应

李亚鹏必须道歉,否则房租涨价也不会租给他了,房东最新回应

汉史趣闻
2026-01-17 17:40:36
欧洲8个国家发表联合声明

欧洲8个国家发表联合声明

澎湃新闻
2026-01-18 23:56:03
随着利雅得新月2-1逆转,沙特联最新积分榜:C罗率队落后榜首7分

随着利雅得新月2-1逆转,沙特联最新积分榜:C罗率队落后榜首7分

侧身凌空斩
2026-01-19 04:10:49
美军为什么越来越拉胯,根源来自资本主义制度!

美军为什么越来越拉胯,根源来自资本主义制度!

北山浮生
2026-01-18 12:13:43
40岁左右得女性这样打扮,既优雅又有成熟女人的魅力

40岁左右得女性这样打扮,既优雅又有成熟女人的魅力

牛弹琴123456
2025-12-28 16:35:58
出大事了,美军战机求救后失踪,搜救队曝出重大秘密,美日都慌了

出大事了,美军战机求救后失踪,搜救队曝出重大秘密,美日都慌了

孤单是寂寞的毒
2026-01-18 12:41:31
李亚鹏称被李嫣拉黑,3岁夏夏出镜力挺爸,海哈金喜感谢大家捐钱

李亚鹏称被李嫣拉黑,3岁夏夏出镜力挺爸,海哈金喜感谢大家捐钱

阳春三月天晴
2026-01-18 14:49:06
太狂妄!越南媒体:5大优势让越南有希望击败中国U23!

太狂妄!越南媒体:5大优势让越南有希望击败中国U23!

邱泽云
2026-01-18 17:29:00
左小青这状态,鲨疯了!明媚动人,若隐若现

左小青这状态,鲨疯了!明媚动人,若隐若现

只要高兴就好
2025-12-10 19:09:26
嫁法国老头真相大白5个月,41岁李宇春近况曝光,一点也不意外

嫁法国老头真相大白5个月,41岁李宇春近况曝光,一点也不意外

小熊侃史
2026-01-17 07:50:11
夫妻性生活中的“小动作”技巧:让妻子“爽”到骨子里的四个秘诀

夫妻性生活中的“小动作”技巧:让妻子“爽”到骨子里的四个秘诀

精彩分享快乐
2025-12-04 13:26:44
国内卖不动狂降价,海外却被抢着买!中国燃油车这波操作太绝了

国内卖不动狂降价,海外却被抢着买!中国燃油车这波操作太绝了

李砍柴
2026-01-17 20:47:51
北京下了死命令,2027年底前,所有中小学必须告别“校外配餐”

北京下了死命令,2027年底前,所有中小学必须告别“校外配餐”

小郑说史
2026-01-18 18:42:29
陳百祥血管爆了展示傷勢大片瘀黑好駭人,看淡生死不排斥安樂死

陳百祥血管爆了展示傷勢大片瘀黑好駭人,看淡生死不排斥安樂死

粤睇先生
2026-01-18 01:51:44
徐寅生:国家用纳税人的钱培养运动员 打不打奥运会不该由WTT决定

徐寅生:国家用纳税人的钱培养运动员 打不打奥运会不该由WTT决定

念洲
2026-01-18 16:12:52
搞钱的前提,从来不是你有多少本钱,而是你有没有悟透这3大逻辑

搞钱的前提,从来不是你有多少本钱,而是你有没有悟透这3大逻辑

第一桶金学派
2025-11-03 10:23:55
聂卫平追悼会!大儿子仍未改姓,棺木覆盖党旗,妻子花圈摆在中间

聂卫平追悼会!大儿子仍未改姓,棺木覆盖党旗,妻子花圈摆在中间

裕丰娱间说
2026-01-18 12:12:33
埃梅里:埃弗顿配得上这场胜利,我们位居前四并不是理所当然

埃梅里:埃弗顿配得上这场胜利,我们位居前四并不是理所当然

懂球帝
2026-01-19 03:36:11
庄则栋走了,穆铁柱走了,聂卫平走了,体育界4大脊梁就他还活着

庄则栋走了,穆铁柱走了,聂卫平走了,体育界4大脊梁就他还活着

林子说事
2026-01-18 15:05:56
2026-01-19 04:48:49
AppSo incentive-icons
AppSo
让智能手机更好用的秘密
6017文章数 26743关注度
往期回顾 全部

科技要闻

AI大事!马斯克:索赔9300亿元

头条要闻

特朗普建"联合国"自任主席 邀60国加入仅1国接受

头条要闻

特朗普建"联合国"自任主席 邀60国加入仅1国接受

体育要闻

21年后,中国男足重返亚洲四强

娱乐要闻

香港武打演员梁小龙去世:享年77

财经要闻

BBA,势败如山倒

汽车要闻

又一次闷声干大事,奇瑞进入2.0 AI+时代

态度原创

数码
教育
房产
游戏
公开课

数码要闻

保时捷设计推C-Seed折叠电视,售价超三台911

教育要闻

2025山东政法大学录取分揭秘!各省差异大

房产要闻

真四代来了!这次,海口楼市将彻底颠覆!

《GTA6》两大主角开场任务泄露 60%的建筑可进去

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版