网易首页 > 网易号 > 正文 申请入驻

GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

0
分享至


新智元报道

编辑:Aeneas

【新智元导读】号称满分屠榜的GPT-5.2,一发布就降智了?许多网友现身表示,似乎确实比开始弱了很多。但提前实测的网友表示,它的确很强,甚至当得起GPT-6之称!

昨夜,OpenAI放出了GPT-5.2炸弹。

根据官方公布的基准测试,它几乎完全碾压Gemini 3 Pro。

GPT-5.2最擅长帮人们完成有经济价值的任务,比如做电子表格、做PPT、写代码和审查代码、分析长文档等等。

而且号称在GDPval等基准测试中,有70.9%的时间能追赶甚至吊打专业人士。

可以说,这是OpenAI进入红色预警,甚至不惜改变AGI目标,都要完成的一个产品,而且还身负着狙击Gemini 3的重任。


所以,GPT-5.2实测起来,体感究竟如何?

GPT-5.2实测:一上线就降智?

出乎意料都是,一个GPT-5.2实测翻车的帖子,在X上火了。

如果向它提问:「garlic」中有多少个R?它会回答:0个。


相比之下,其他模型的表现就要稳定得多。


归根结底,这是LLM的一个底层问题:因为tokenization而无法统计字母数量。

不过,只要强制选到Thinking版本,GPT-5.2就能答对这个问题了。



在reddit上,也有很多网友表示:在GPT-5.2刚发布的时候,似乎功能还很强。

结果几个小时后,它紧接着就降智了。


有人表示,自己早上八点半开始用的时候还好好的,喝完一杯咖啡后,GPT-5.2忽然就不行了。


似乎每次新模型一发布,几小时后就会被削弱,OpenAI这是什么操作?


大佬现身说法:还是挺强的

不过这点小插曲,还是没有影响坊间的正面评论。

昨晚GPT-5.2一发布,网友们就被震撼了。

比如有人说,ARC-AGI 2的这次飞跃属实疯狂,OpenAI究竟是怎么做到的?




本来大家还以为OpenAI已经落后谷歌了,看来并没有!


看起来,OpenAI内部还捂着不少厉害的东西没发布。


而且,领略过GPT-5.2超强满血版的用户,对它是一致好评。


沃顿商学院教授Ethan Mollick表示,自己有幸提前使用了GPT-5.2,它的性能还是令人印象很深刻的。


比如下面这个任务:创建一个视觉上有趣的着色器,可以在twigl-dot-app中运行,使其看起来像一座无限的新哥特式塔楼城市,部分淹没在波涛汹涌的海洋中。

对于这个视频,很多网友大加赞叹:GPT-5.2不仅遵循了指令,还在代码中选择了非常合理的审美和结构。



然后,教授又让GPT-5.2绘制一张人类历年考试成绩的图表。


这个任务十分复杂,因为需要在过程中查找和交叉引用大量资料,然后一次性就生成有用的结果。

可以看到,GPT-5.2的表现十分惊艳。


这个Twigl代码的实例,显出了GPT-5.2的强大编码能力。


推理、数学、编程的重大飞跃

Magicpathai的CEO表示,自己已经测试GPT-5.2有一段时间了。

他对于这个模型的评价是——「复杂推理、数学、编程和模拟方面的一次重大飞跃」。


在下面这个实例中,它在单个文件中就构建了一个完整的3D图形引擎,还支持交互式控制,分辨率达到4K。

在这个视频中,他还用GPT-5.2进行了高难度推理。

有人质疑道:这个图形引擎会不会是GPT-5.2调库完成的?CEO表示,所有代码和图形完全是从0开始写的。


也就是说,GPT-5.2的进步不是渐进式的,而是编码助手功能的彻底范式转变。


网友们惊呼:这种进步的速度,实在是令人头晕目眩。


这位CEO对于GPT-5.2的评价是:它是OpenAI推出的最佳智能体模型,可以连续运行大量工具而不会出现问题,并且比其前代产品速度更快。

为了测试它的功能,他构建了一个智能体,可以同时使用GPT-5.2、5.1和5。

结果显示,GPT-5.2调用工具时无需任何前导码,而且即使在长时间会话中,也不会迷失方向。


还有人让GPT-5.2用ASCII写出了自己的内心世界,答案很震撼。


总之,在大多数人的反馈中,GPT-5.2能稳定地处理实际工作,条理清晰,工作流程顺畅。


相比于会出现小中断的旧模型,GPT-5.2对于任务的理解更强,完成得也更顺利。


ARC Prize表示,GPT-5.2 Pro(X-High)的最新SOTA得分为90.5%,这就意味着,AI在一年内效率已经提高了约390倍。



背后神秘华人,浮出水面

同以往一样,这次GPT-5.2的幕后功臣,依然有不少华人。

比如,最早预告GPT-5.2的OpenAI华人研究员、北大校友Yu Bai。


他本科在北大学习数学,在斯坦福获得统计学博士学位。


负责后训练的Yun Dai,本科来自清华大学,在加州大学尔湾分校获得了计算机科学硕士学位。


另一位OpenAI华人研究员Zuxin Liu,从事推理模型后训练工作。

他本科毕业于北航,在CMU攻读硕士和博士学位。


Aston Zhang来自在伊利诺伊大学厄巴纳-香槟分校攻读博士学位,现在是OpenAI的研究员。


他感谢了团队,尤其强调了GPT-5.2 Thinking的处理多步骤任务能力。


总之,昨晚的AI大战,OpenAI给出了强烈一击。

接下来,谷歌又会拿出什么来应对呢?

参考资料:

https://x.com/skirano/status/1999182295685644366

https://x.com/emollick/status/1999185085719887978

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“亲妈霸占消防通道,儿子被火烧死”,这件事,简直太魔幻了……

“亲妈霸占消防通道,儿子被火烧死”,这件事,简直太魔幻了……

桌子的生活观
2026-03-26 12:28:04
6900万元!摩洛哥要求塞内加尔归还非洲杯奖金+奖牌 后者强硬拒绝

6900万元!摩洛哥要求塞内加尔归还非洲杯奖金+奖牌 后者强硬拒绝

风过乡
2026-03-26 19:13:28
联大认定“奴隶制”为最严重反人类罪:123票赞成,美国、以色列、阿根廷共3票反对

联大认定“奴隶制”为最严重反人类罪:123票赞成,美国、以色列、阿根廷共3票反对

扬子晚报
2026-03-26 07:27:54
美国悬赏1000万美金,通缉一中国四川小伙,他到底做了什么?

美国悬赏1000万美金,通缉一中国四川小伙,他到底做了什么?

趣文说娱
2026-03-26 18:11:01
想拿中国尿素救春耕?先把欠中企的百亿欠款还了!否则一粒不售

想拿中国尿素救春耕?先把欠中企的百亿欠款还了!否则一粒不售

过期少女致幻录
2026-03-26 11:44:43
博主被陌生网友辱骂3个月,默默观察其2年半,终于找到机会碰面了

博主被陌生网友辱骂3个月,默默观察其2年半,终于找到机会碰面了

离离言几许
2026-03-26 15:01:41
恶毒诋毁张雪峰离世:千万粉丝“留几手”被罚!网友:应永久封杀

恶毒诋毁张雪峰离世:千万粉丝“留几手”被罚!网友:应永久封杀

影像温度
2026-03-26 11:25:05
丧夫仅5个月,49岁翁帆突传“喜讯”高调露面,状态好到出人意料

丧夫仅5个月,49岁翁帆突传“喜讯”高调露面,状态好到出人意料

冷紫葉
2026-03-24 19:12:36
伊朗战争还将持续多久?据传特朗普希望4-6周内终结战事

伊朗战争还将持续多久?据传特朗普希望4-6周内终结战事

财联社
2026-03-26 18:29:05
张雪峰去世真相!网友:偌大的公司靠他个人ip养活,早死是必然的

张雪峰去世真相!网友:偌大的公司靠他个人ip养活,早死是必然的

火山詩话
2026-03-25 09:18:58
扎哈罗娃警告日本:任何试图向乌提供致命武器之举,都将招致强硬回应

扎哈罗娃警告日本:任何试图向乌提供致命武器之举,都将招致强硬回应

环球网资讯
2026-03-26 08:55:12
中共中央批准,开除刘慧党籍

中共中央批准,开除刘慧党籍

新京报
2026-03-26 17:14:17
罕见!97岁老人头顶长出4厘米恶臭树桩 五年前曾做手术仍复发

罕见!97岁老人头顶长出4厘米恶臭树桩 五年前曾做手术仍复发

快科技
2026-03-25 09:53:08
紧急提醒:截图别乱发,暗水印能直接找到你的本人

紧急提醒:截图别乱发,暗水印能直接找到你的本人

戗词夺理
2026-03-25 10:35:41
揭开美国粮价低的真面目!他们骗人的鬼把戏终于被揭穿了!

揭开美国粮价低的真面目!他们骗人的鬼把戏终于被揭穿了!

老范谈史
2026-03-25 22:45:51
何鸿燊是个谜!2009年,88岁何鸿燊各脏器就已衰竭

何鸿燊是个谜!2009年,88岁何鸿燊各脏器就已衰竭

果妈聊娱乐
2026-03-26 10:00:16
41岁张雪峰去世后续,其婚姻被扒,已离婚6年,前妻很低调

41岁张雪峰去世后续,其婚姻被扒,已离婚6年,前妻很低调

180视角
2026-03-26 13:01:03
张雪峰助理万霞:十年相伴,生死相隔最痛的人!

张雪峰助理万霞:十年相伴,生死相隔最痛的人!

天光破云来
2026-03-26 11:55:41
引而不发才是王道,封锁霍尔木兹海峡,伊朗打完了最后一张牌……

引而不发才是王道,封锁霍尔木兹海峡,伊朗打完了最后一张牌……

家传编辑部
2026-03-26 10:34:27
斯柯达将退出中国,大众中国回应

斯柯达将退出中国,大众中国回应

第一财经资讯
2026-03-26 15:14:56
2026-03-26 19:56:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14821文章数 66721关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

艺术
教育
旅游
数码
亲子

艺术要闻

哪一座桥不是风景?

教育要闻

2026人工智能时代下的教育课堂变革

旅游要闻

鲁冰花开啦!快来新乡南太行八里沟 赴一场春日之约

数码要闻

1+4核,英特尔酷睿3 304处理器现身基准测试

亲子要闻

这就是引导型老师的厉害吗?

无障碍浏览 进入关怀版