网易首页 > 网易号 > 正文 申请入驻

AI理科碾压人类状元,却被这道“文科题”戳中了死穴...

0
分享至


谁敢信?

日本最难考的顶尖学府——东京大学和京都大学,刚刚被AI实现了突破。

不仅是考上,成绩还大幅领先。

在LifePrompt公司和日本老牌补习机构“河合塾”搞的一场闭卷盲测中,OpenAI的最新大模型ChatGPT 5.2 Thinking,大幅领先人类顶尖考生。

但值得注意的是。

在翻看这份成绩单时,我们发现了一个AI得分率仅为25%的“显著薄弱环节”。

这个大坑,或许恰好是当代高考生和准大学生们的“核心竞争力所在”。

多考50分,数学拿满分

先来看一眼这份成绩单。

这可不是开卷考试。测试全程物理断网,AI只能凭自己的“脑力”(预训练权重)硬做。

结果呢?

在号称日本地狱级难度的东大理科三类(医学部)考试里,满分550分,ChatGPT 5.2拿了503分。

作为参照,今年考上这个专业的人类最高分,仅仅是453分。

整整高了50分!

更值得注意的是,它的数学直接拿了满分,英语得分率也稳稳踩在90%的基准线上。

京都大学同样取得了突破性成绩。在医学部考试中,AI获得1176分,把人类状元的1098分远远甩在身后。

要知道,AI进化速度令人瞩目。

回看2024年,老前辈GPT-4在这套卷子面前未能通过所有科目,连最低录取线都没够到。

2025年,加了强化学习的o1模型终于首次达到录取合格线。

结果才过了一年,ChatGPT 5.2以最高分通过考试。

得分率25%的短板

数学满分,英语90%,理应是无敌的存在了吧?

但是!

在这份优异的成绩单中,有一科的成绩明显不足——

世界史论述题,满分60,它只拿了15分,得分率仅为25%


为何一个拥有庞大知识储备、数学能力极强的模型,会在文科论述题上表现明显不佳?

阅卷的河合塾老师和技术社区的专家们给出了答案:因为这届AI,严重缺乏结构化组织能力(Structural organization)

世界史论述题可不是背年份填空。

它需要你把历史长河里的碎片串起来,理出政治和经济的因果,写出一篇逻辑严密、首尾呼应的大文章。

一句话:需要人类的“宏大叙事”。

而这,恰恰是大模型目前的死穴。

当让它写上千字长文时,它写着写着就偏离了主题。

开发者社区做过极端测试:如果让现在的AI去维持一个超长文本的“连贯思想主线”,往往在几轮逻辑转折后,它就开始出现结构性断裂(Structural collapse)。

更要命的是,在处理极度复杂的宏大卷宗时,它还可能遭遇“长期记忆坍缩”,上下文丢失,逻辑线瞬间重置。

也就是说,目前的大模型依然缺乏全局架构能力。

它写出来的东西,单看每一句辞藻都很华丽;但拼在一起,整体缺乏逻辑连贯性,完全没有人类统领全局的“世界观”。

准大学生的“反击指南”

看懂了这个25%的软肋,高考生和准大学生的破局方向也就清晰了。

日本人工智能学会会长Satoshi Kurihara教授说得好:人类绝对不该在同一条赛道上与AI直接竞争

打个比方,你非要跟计算器比算数快,这显然不是明智之举。

在AI轻松超越人类顶尖理科考生的时代,准大学生们的技能树,必须得换个点法了:

第一,减少对“规则内机械做题”的依赖。

不管你微积分算得多快,法条背得多熟练,你都拼不过几美分调用一次的API接口。

靠疯狂刷题、机械记忆去换取职场高薪的路线,正在急速贬值。果断把你的时间精力,从纯粹的“拼记忆、拼算力”里抽离出来。

第二,将重心转向“宏观架构能力”的培养。

AI连世界史大题都统筹不好,说明它目前根本当不了“总工程师”。

未来的高薪岗位,属于那些懂行的“AI项目经理”。

你需要重点培养的能力是:如何提出直击本质的犀利问题?如何把一个庞大模糊的任务,精准拆解成十几个AI能听懂的标准指令?最后,如何用人类的战略眼光,把AI生成的一堆碎片,拼装成一套能用的系统。

第三,去那些充满复杂性和不确定性的现实场景中历练。

AI喜欢干净、透明、结构化的数据。但在真实的社会里,到处是混沌、情绪和谎言。

在一场剑拔弩张的商务谈判里,怎么察言观色搞定客户?

在公司不同派系的利益博弈中,怎么调解冲突?

面对一团乱麻的市场反馈,谁来顶住压力拍板担责?

这些需要同理心、信任背书、道德抉择的“高感触(High-touch)”领域,是AI目前无法有效介入的领域。

时代真的变了。机器的履带已经越过了知识评估的及格线。

与其在AI擅长的规则中过度内卷,不如退一步,去填补那些技术无法替代的领域。(本文首发钛媒体App,作者| AGI-Signal,编辑|林深)

声明:

本文所涉数据及推演均严格基于客观原始信息。包括LifePrompt对东京大学与京都大学的录取分数线对比盲测数据、大语言模型在长文本结构上的架构缺陷剖析及相关人工智能专家访谈等。需警示的是,AI技术演进属于极速变动的高压领域,本文的客观对比与能力推演不构成任何教育、升学或财务投资建议。读者在进行个人能力规划与发展决策时,应充分评估技术变迁带来的深远影响。

声明:包含AI生成内容

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美媒:在摩洛哥失踪美军士兵可能已坠海

美媒:在摩洛哥失踪美军士兵可能已坠海

澎湃新闻
2026-05-04 03:23:06
央视官宣歼-35新机0001,出口版“首机”亮相

央视官宣歼-35新机0001,出口版“首机”亮相

世家宝
2026-05-03 20:49:57
别再被抗战剧骗了!一名日军摄影师,拍下真正的“鬼子进村”照片

别再被抗战剧骗了!一名日军摄影师,拍下真正的“鬼子进村”照片

历史甄有趣
2026-05-04 08:10:22
2026汤尤杯:国羽第12次夺得汤杯冠军!论功行赏,谁是头号功臣?

2026汤尤杯:国羽第12次夺得汤杯冠军!论功行赏,谁是头号功臣?

林子说事
2026-05-04 06:28:01
俄罗斯“苏-34”战机被击落

俄罗斯“苏-34”战机被击落

名人苟或
2026-05-03 13:14:52
李宗仁晚年吐露,红军长征取得胜利,全靠老蒋这步神助攻

李宗仁晚年吐露,红军长征取得胜利,全靠老蒋这步神助攻

晓张说
2026-04-09 17:25:40
2-3被瑞典逆转!国乒男团遭2连败,输球原因曝光,连进4强都难了

2-3被瑞典逆转!国乒男团遭2连败,输球原因曝光,连进4强都难了

侃球熊弟
2026-05-03 23:59:04
越南4月出口同比增长21%,预估17.9%

越南4月出口同比增长21%,预估17.9%

每日经济新闻
2026-05-03 10:18:05
范丞丞与母亲张传美合影,张传美脖子并不长,戴了帽子像个老太太

范丞丞与母亲张传美合影,张传美脖子并不长,戴了帽子像个老太太

小娱乐悠悠
2026-05-04 09:33:21
“愿为美兵”“分中国为七国”,北大教授遭开除,如今下场怎么样

“愿为美兵”“分中国为七国”,北大教授遭开除,如今下场怎么样

今墨缘
2026-05-03 10:23:55
陈慧琳演唱会穿三角裤衩,五十多了合适吗?人老心不老 不愧是女神

陈慧琳演唱会穿三角裤衩,五十多了合适吗?人老心不老 不愧是女神

陈意小可爱
2026-05-01 20:25:19
大专、野模、知三当三,孙怡浪姐"骚操作"不断难怪王京花看不上她

大专、野模、知三当三,孙怡浪姐"骚操作"不断难怪王京花看不上她

橙星文娱
2026-04-18 16:01:07
日本媒体惊呼:中国电动两轮车横扫越南,让本田措手不及

日本媒体惊呼:中国电动两轮车横扫越南,让本田措手不及

阿芒娱乐说
2026-05-02 01:54:13
这辈子和你发生过关系的人,前世究竟是你的谁?缘分深浅,一看便知

这辈子和你发生过关系的人,前世究竟是你的谁?缘分深浅,一看便知

心理观察局
2026-05-04 08:51:07
广东晋级八强,能淘汰北京队吗?听听粤媒京媒怎么说,一队被看衰

广东晋级八强,能淘汰北京队吗?听听粤媒京媒怎么说,一队被看衰

南海浪花
2026-05-04 10:26:10
没想到,赖清德如此无底线,蹭专机离台窜访,大陆8字定调

没想到,赖清德如此无底线,蹭专机离台窜访,大陆8字定调

兰妮搞笑分享
2026-05-04 10:20:26
格力原董事长投案,全网都在找董明珠——被踢走十年,交出了什么

格力原董事长投案,全网都在找董明珠——被踢走十年,交出了什么

情系雨樱花叶
2026-05-04 05:03:27
魔幻的韩国股市,父母给婴儿开户买股票

魔幻的韩国股市,父母给婴儿开户买股票

吴晓波频道
2026-05-04 08:35:15
星二代颜值是个谜,没想到《爸去哪》13年后,最帅男孩是郭涛儿子

星二代颜值是个谜,没想到《爸去哪》13年后,最帅男孩是郭涛儿子

清川逐影
2026-05-03 21:55:24
巴拿马彻底傻眼了!抢完港口后,却发现全世界都没人敢接盘

巴拿马彻底傻眼了!抢完港口后,却发现全世界都没人敢接盘

朗威谈星座
2026-05-03 00:00:11
2026-05-04 11:28:49
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
133102文章数 862137关注度
往期回顾 全部

教育要闻

弃考高发期即将来临

头条要闻

刘国正谈国乒男团两连败:王楚钦正常 林诗栋起伏太大

头条要闻

刘国正谈国乒男团两连败:王楚钦正常 林诗栋起伏太大

体育要闻

曼联3-2双杀利物浦!提前三轮锁定欧冠资格 梅努制胜

娱乐要闻

严浩翔新歌,父母离婚17年矛盾再升级

财经要闻

魔幻的韩国股市,父母给婴儿开户买股票

科技要闻

OpenAI“复活”了QQ宠物,网友直接玩疯

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

时尚
房产
健康
亲子
手机

快看!!这个女演员近日暴瘦!!哦,知道了……

房产要闻

五一楼市彻底明牌!塔尖人群都在重仓凯旋新世界

干细胞治烧烫伤面临这些“瓶颈”

亲子要闻

五一期间5个儿童常见病,家长注意

手机要闻

华为nova 16系列三剑齐发:渐变机身设计 看齐Pura 90

无障碍浏览 进入关怀版