网易首页 > 网易号 > 正文 申请入驻

AI智力天花板崩了!GPT-5.5 Pro视觉智商145,撞倒门萨俱乐部门槛

0
分享至


新智元报道

编辑:KingHZ

【新智元导读】1946年至今,「人类最高智商俱乐部」门萨将迎来第一位非人类成员。根据LisanBench最新跑分,GPT-5.5 Pro文本IQ 130踩上门萨会员线,视觉IQ直接飙到145,杀进天才区。一年前「LLM过不了130」还是技术圈共识,今天,这堵墙彻底被砸碎!

1946年至今,「人类最高智商俱乐部」门萨将迎来第一位非人类成员。

GPT-5.5 Pro,在线文本智商133,视觉智商145,线下非公开智商测试得分130。



这是AI第一次正式跨过门萨会员线。

门萨 130墙这一脚是最响的一脚,但绝对不会是最后一脚。

门萨,全球最古老的高智商社团,1946年成立,入会标准只有一条——

智商IQ达到全人类前2%,分数线130。

普通人考几次都摸不到边的那条线,AI一次就过了。


而145,是门萨官网公开数据里「前0.1%」的位置,俗称天才区。


这并非孤例。就在本月初,GPT-5.4 Pro 已经在TrackingAI公开榜单上跑出150 IQ,登顶所有公开IQ跑分。


过去几个月里,也是OpenAI节奏从未停:视觉基座、推理升级、Agent产品线、API侧连环动作。

现在,AI赛场再次进入了OpenAI时代。


短板变王牌,

OpenAI引爆认知视觉革命

更炸的是文本和视觉的差距:GPT-5.5 Pro在文本部分跑出130分,刚好压线进门萨,但视觉部分直接飙到145。

15分的差距,不是测试误差。

这意味着模型在「看图找规律」这件事上的能力,比「读题做推理」高出整整一个标准差。

按照门萨的分布,130是前2%,145是前0.1%。也就是说,把GPT-5.5 Pro的视觉能力拿出去和真人比,真正的千里挑一。

这里有个细节值得多说一句:为什么是视觉,而不是文本,先把墙撞碎的?

门萨Norway采用3×3九宫格格式(八张图+空缺第九张),完全非语言、非文化依赖,考察抽象推理。

人类高智商群体(尤其是140+「天才区」)确实依赖瞬间模式识别:旋转(rotation)、镜像/反射(mirroring/reflection)、叠加/增减元素(superposition/addition-subtraction)等变换规则。


LLM做这种题的标准方法,是先把图片转成token再推理。

但token化的过程,丢的恰恰是空间结构和拓扑关系——也就是这类题最核心的信息。

所以,过去十二个月,所有顶级模型在视觉题上都是这个状况:文本勉强及格,视觉一塌糊涂。

Claude 4.7、GPT-5.4 Pro全部卡在 125 以下。

GPT-5.5 Pro的145意味着:这不是在模拟思考,这是在重构智能。 过去我们嘲笑AI「不懂常识」,而现在,它正在以高于98%人类的智力水平,俯视着我们的常识。

OpenAI联合创始人、总裁Greg Brockman转发用户展示,力荐GPT Image 2将《物种起源》等书籍瞬间转为详细信息图,促进高效学习。



这揭示了人类文明的一个重大转折点:知识的摄入媒介变了。

数千年来,人类依赖文字这种低带宽的线性媒介来传递智慧。

但GPT-5.5告诉我们,未来的学习不再需要你花费三个月去咀嚼一本厚书,AI会通过对长文本的深度语义理解,将其重构为一种「视觉认知流」。

这是「语义重组」








上下滚动查看图片

当AI的记忆力和上下文处理能力不再「健忘」,它就成了你大脑外的另一层皮质层。你不再是阅读知识,而是在俯瞰知识。

此外,ChatGPT现在一键直接把老旧破损的图片变成4K画质,而且免费!


Restore this old photo into professional portrait of DLSR - quality colour and detail, using an advanced upscaling algorithm comparable to the results from canon EOS R6 II. Ensure the restored the image looks natural, retains exact facial features, has great clarity......

「勤勉的小火车头」:说最温柔的话,做最狠的事

奥特曼用了一个极具迷惑性的词:「小火车头」(little engine)


这个听起来甚至有些软萌的比喻背后,隐藏着 OpenAI 极度冷酷的商业意志。

昨天,OpenAI API新品登场:GPT-5.5及Pro版现已可用,显著提升智能水平和token效率,完美适配复杂任务场景,如编码、分析等高负载应用。


在LisanBench测试中,GPT-5.5是最强的双料非推理模型!



更令人胆寒的是, GPT-5.5的Token使用减少45.6%,智能分数却提升了1.77倍。

自从GPT-5以来,OpenAI模型的推理效率持续提升:


当前有效性比率排行榜中GPT 5.5独占鳌头:

  1. GPT 5.5(Medium):99.44%

  2. Opus 4.7 (xhigh): 99.35%

  3. Sonnet 4.6 (16k): 99.28%

  4. Opus 4.6 (16k): 98.74%

  5. Gemini 3.1 Pro预览版(低):97.77%

测试之后,AI行业分析机构SemiAnalysis坦承:在某些任务上的表现,GPT-5.5已经显著超越了所有其他模型。


在数学上,GPT-5.5表现最佳;

在编程上,GPT-5.5和Opus 4.7各有千秋;

在智能体任务上,Claude和GPT-5.5远胜于其他所有模型。



这意味着什么?这意味着 OpenAI 正在同时「垄断智力」和「降维成本」。

对于竞争对手,这几乎是一场无解的「降维打击」

特别是,Claude系列这次迎来了真正的对手,只剩下「神话中的Myhos」尚能一战。


已经有Claude忠实支持者,转为OpenAI Codex用户。



当你的产品比对手聪明一倍,延迟却只有对方的一半时,市场规则已经失效了,剩下的只有收割。

但对于开发者来说,这种「诚恳的能量」却带来了一种「西西弗斯式的焦虑」

OpenAI加速狂飙,每月一炸

上个月,OpenAI 才刚刚发布了一个模型,再之前是去年12月,以及去年11月。


OpenAI正以快速、稳健的步伐持续推出新模型,在Artificial Analysis智能指数上稳步前行。


AI仍在加速 ,指数效应开始显现,奇点触手可及!


在可预见的未来,这一趋势有望延续。

「我们在短期内看到了相当显著的进步,在中期内看到了极其显著的进步,」OpenAI首席科学家Jakub Pachocki 说。「事实上,我认为过去两年其实出奇地缓慢。」

Brockman表示,该模型也是朝着创建「超级应用」迈出的又一步。

所谓「超级应用」,就是一个像瑞士军刀一样的多功能程序。Brockman与联合创始人奥特曼此前曾设想将 ChatGPT、Codex 和 AI 浏览器整合到一个统一的服务中,为企业客户提供支持。

值得注意的是,「超级应用」也是Elon Musk热衷的话题。

OpenAI官宣的「Crisp Pace」——每月一炸的更新频率,让所有的集成、优化和 Prompt 工程都变成了一次性用品。你昨晚刚熬夜调优好的工作流,今天可能就被 GPT-5.5 的原生能力直接覆盖。


被压缩的窗口期

这件事的真正分量,不在跑分本身,在节奏。

去年视觉天花板还停在119。今年直接跳到145。中间没有过渡,没有预告,只有一行更新。

在这种速度面前,一切熟练度都正在贬值。

正如尤瓦尔·赫拉利所言,历史上第一次,我们无法预测20年后人类的就业市场是什么样。但现在,这个窗口期可能被OpenAI缩短到了20个月。

那个「诚恳的小火车头」已经拉响了汽笛,它不打算等任何人。如果你感受到了颠簸,那是时代在换轨。

技能的半衰期正在被这种迭代速度反复缩短。不是十年,不是五年,是按月计算。

参考资料:

https://www.reddit.com/r/accelerate/comments/1svnxv9/gpt_55_pro_vision_is_actually_the_first_model_to/

https://startupfortune.com/gpt-55-lands-as-openai-accelerates-its-model-release-cadence-to-near-monthly/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国第四艘航母官宣:是核动力!舷号19,命名大概率是“江苏号”

中国第四艘航母官宣:是核动力!舷号19,命名大概率是“江苏号”

谛听骨语本尊
2026-04-25 14:44:21
中国抛得太及时,8500亿美债没人接盘。

中国抛得太及时,8500亿美债没人接盘。

流苏晚晴
2026-04-26 18:32:23
1992年,陆定一问秦川:如果党的一把手腐败了,那么该由谁来管?

1992年,陆定一问秦川:如果党的一把手腐败了,那么该由谁来管?

阿器谈史
2026-04-26 14:13:38
突发!南海055遵义舰实弹亮剑,疑似发射鹰击-20震慑美日菲舰队!

突发!南海055遵义舰实弹亮剑,疑似发射鹰击-20震慑美日菲舰队!

利刃号
2026-04-26 18:36:56
白宫晚宴枪击案全网最全细节:特工疑与枪手互开数枪,特朗普在台上十分淡定

白宫晚宴枪击案全网最全细节:特工疑与枪手互开数枪,特朗普在台上十分淡定

爆角追踪
2026-04-26 10:29:13
南京一派出所副所长为完成查处任务,“设计”让6名未成年人吸毒再查获,一审获刑5年

南京一派出所副所长为完成查处任务,“设计”让6名未成年人吸毒再查获,一审获刑5年

封面新闻
2026-04-26 17:18:07
血亏8亿!华晨宇直播崩溃大哭,云南拿地建乐园,临门一脚被强拆

血亏8亿!华晨宇直播崩溃大哭,云南拿地建乐园,临门一脚被强拆

奇怪的鲨鱼们
2026-04-26 16:32:25
世锦赛战报:吴宜泽4-4,连爆大冷,3位80后大满贯得主都被逼平了

世锦赛战报:吴宜泽4-4,连爆大冷,3位80后大满贯得主都被逼平了

求球不落谛
2026-04-26 20:17:11
外媒炸锅了!当着日本航母的面,055竟然发射鹰击-20?

外媒炸锅了!当着日本航母的面,055竟然发射鹰击-20?

凡知
2026-04-26 21:00:16
白宫开枪凶手是老师?网传其刚在洛杉矶拿了“月度优秀教师”奖

白宫开枪凶手是老师?网传其刚在洛杉矶拿了“月度优秀教师”奖

爆角追踪
2026-04-26 12:16:15
老外震惊!中国馒头横扫欧美!不是文化输出,是中国供应链赢麻了

老外震惊!中国馒头横扫欧美!不是文化输出,是中国供应链赢麻了

魔都姐姐杂谈
2026-04-24 11:56:08
去了趟海参崴,我的三观被彻底刷新,除了美女多,一无是处!

去了趟海参崴,我的三观被彻底刷新,除了美女多,一无是处!

老特有话说
2026-04-26 15:56:03
25岁女孩确诊黑色素瘤仅5个月便离世,原本今年要订婚……生前曾在腹部发现“巨大的肿瘤”

25岁女孩确诊黑色素瘤仅5个月便离世,原本今年要订婚……生前曾在腹部发现“巨大的肿瘤”

都市快报橙柿互动
2026-04-26 19:45:19
李提香:没有人愿意输球,如果保持这种状态就不会赢得胜利

李提香:没有人愿意输球,如果保持这种状态就不会赢得胜利

懂球帝
2026-04-26 21:58:39
44岁陈震现身北京车展,从网红车评人到无人问津,现状一点都不怨

44岁陈震现身北京车展,从网红车评人到无人问津,现状一点都不怨

林雁飞
2026-04-25 17:14:49
CBA官宣最佳阵容:胡金秋贺希宁领衔一阵 周琦张镇麟领衔二阵

CBA官宣最佳阵容:胡金秋贺希宁领衔一阵 周琦张镇麟领衔二阵

醉卧浮生
2026-04-26 18:11:33
日本政府图谋出口二手武器,不断突破“红线”引担忧

日本政府图谋出口二手武器,不断突破“红线”引担忧

参考消息
2026-04-26 20:00:08
这配速你能跟多久?萨维全马破2完整配速,35公里后太恐怖

这配速你能跟多久?萨维全马破2完整配速,35公里后太恐怖

全景体育V
2026-04-26 19:24:48
真相大白!那台拉缸的张雪820RR返厂,经拆解后本人公布故障原因

真相大白!那台拉缸的张雪820RR返厂,经拆解后本人公布故障原因

一盅情怀
2026-04-26 15:32:03
美国一旦霸权结束,一定会灭亡的三个国家,排第一的果然是它

美国一旦霸权结束,一定会灭亡的三个国家,排第一的果然是它

琴音缭绕回
2026-04-25 07:21:31
2026-04-26 22:43:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15071文章数 66808关注度
往期回顾 全部

科技要闻

涨价浪潮下,DeepSeek推动AI“价格战”

头条要闻

以色列政坛重大变局 内塔尼亚胡迎来劲敌

头条要闻

以色列政坛重大变局 内塔尼亚胡迎来劲敌

体育要闻

森林狼3比1掘金:逆境中杀出了多孙穆?!

娱乐要闻

仅次《指环王》的美剧,有第二季

财经要闻

事关新就业群体,中办、国办发文

汽车要闻

预售19.38万元起 哈弗猛龙PLUS七座版亮相

态度原创

房产
旅游
手机
艺术
家居

房产要闻

新一轮教育大爆发来了!海口,开始疯狂建学校!

旅游要闻

东阿文旅焕新升级:东阿阿胶城牵手开心麻花开启文旅融合新征程

手机要闻

鸿蒙6,玻璃,光,和我

艺术要闻

总投资35亿!汾酒集团太原的地标大楼,呈现白酒文化!

家居要闻

自然肌理 温润美学

无障碍浏览 进入关怀版