网易首页 > 网易号 > 正文 申请入驻

AI进化成人的速度,可能比你想象的还慢。。。

0
分享至


吹了这么久AI,到底嘛时候才能超越人类啊?

其实,圈内人对 AI 都有一个终极期望,就是实现 AGI (通用人工智能),说白了,就是造出“和人一样聪明的AI”。

咱去马斯克的社交平台上逛一圈,会发现他三句不离AGI。。


OpenAI的奥特曼也在疯狂预言,AGI即将到来,也就这三五年的事儿了。


但这玩意,到底咋衡量呢?俗话说得好,人和人的区别,比人和猪的区别还大。。到底啥水平,才能和人一样聪明啊?

就连天天为了AGI吵架的大佬们,也根本说不出来,AGI到底是个啥。。


合着都在这虚空对线是吧。

所以最近,一帮顶尖大佬看不下去了,几十号人联手发了篇论文,作者还是全明星阵容,包括图灵奖得主、谷歌前 CEO 等等,他们联合起来,给出了目前为止第一个 AGI 的量化定义。

他们也顺便用GPT模型做了个测试,结果显示,如果AGI是100分,GPT-5只有58分,不及格的水平。


这帮大佬的核心观点是:AGI,就是一种能达到“一个受过良好教育的成年人”的能力的人工智能。

他们把心理学中一个最权威的理论,CHC 理论,给AI搬过来了。

CHC 的观点,简单来说,就是智力这玩意,不是一个单一的标准能衡量的东西,需要多维度考察。

说白了,这就和高考差不多。一门课强根本不够,你得门门都强,才证明你厉害。


所以,他们把 AI 的能力分成了 10 个核心能力,每个占了 10% 的分。它们分别是:

(K) 通识知识、(RW) 读写能力、(M) 数学能力、(R) 即时推理、(WM) 工作记忆、(V) 视觉处理、(A) 听觉处理、(S) 反应速度、(MS) 长期记忆存储、 (MR) 长期记忆检索。

这里面比较抽象的,可能就是工作记忆和长期记忆了。

工作记忆,其实就是短期记忆,就是说我刚刚提过的东西,你现在还能记得起来;而长期记忆就是,AI通过跟我的对话,永久性学到了新东西,就像你上过学,即使你毕业了,“奇变偶不变”还刻在你DNA里一样。。


每一种能力,他们都会叫AI测试,也就是写他们精心准备的测试题。比如(R) 即时推理这一块,他们就专门找了些略微烧脑的问题,比如:

“David认识张先生的朋友Jack,Jack认识David的朋友林女士。认识Jack的人都有硕士学位,认识林女士的人都是上海人。所以谁既是上海人又有硕士学位?”(测试你是不是AI的时候到了)

他们找了OpenAI的两员大将,GPT-4(2023)和 GPT-5(2025)来考试。结果,GPT-4 总分 27。 GPT-5 总分 58,合计也没达到100分。

而且,咱来看看这成绩单,有拉满的,也有拉裤兜的,纯纯严重偏科


比如 GPT-5,在通识(K)、读写(RW)、数学(M)这几项上,直奔 9 分 10 分。所以说目前来看,这几项是AI的强项。

而 (MS) 长期记忆存储这项,GPT-5纯纯大光头,3-4分的也有一堆。而GPT-4更不用说,好几项都是0分。

这一项其实考的是, AI 能不能持续学习获得信息。因为论文发现,现在的 AI 根本就是个健忘症,你今天教它的东西,明天它就忘得一干二净。


他们做测试的方法,就是第一天跟AI讲一些东西,然后第二天单开一个对话,再让AI回想。

都不用猜,包想不起来的,大伙用过都知道,新开窗口就会清空记忆,那得分不是0就怪了。。

有的人会反驳,现在的AI早就有永久记忆了。但文章中其实谴责了这一点,现在AI的记忆,根本不是真正的记忆,他们只是在假装自己有记忆。

作者们把这招叫做 “能力扭曲” ,即利用某些领域的优势来弥补其他领域的严重弱点,创造出一种“AI真有能力”的错觉。像现在的AI记忆,其实就是在疯狂卷上下文长度,或者通过知识库来实现,实际上就是外挂,模型本身是一点记忆都没有。

除了记忆力,长期记忆检索ai也很拉,说白了,就是检测幻觉,别睁眼说瞎话。


当然,还有一项大伙都很拉的功能,(V) 视觉处理。 GPT-4是0分, 而GPT-5进化过后,也只来到4分。

它考的不是简单的“这图里有啥”,考的是视觉推理。这对大模型来说,可就难多了。比如说,咱来试一道:

“下面这 4 个 2D 展开图里,哪一个不能折成左边那个立方体?”


还真有点难度,但我们人类稍加思索,还是能做出来的。我也去求证了下Gemini,结果确实是无法战胜。


这也说明,AI的眼睛和脑子,目前配合的不是很好,还没有人类这种,边看边想就解决问题的能力。

当然,这份报告,肯定还是不够完美的。除了这十个维度,人脑还有联想等其他难以名状的能力,人类可太复杂了,不是几道题就能测明白的。

但它最大的价值,是给当下的 AI 做了一次全面诊断:AI现在还是瘸腿,在一些人类最基本的认知能力上,仍然有严重的缺陷。

而且,现在的 AI 厂商会还用一些捷径,来掩盖这些弱点。

因此,这篇文章也在给大家敲警钟:这样搞出来的 AI,是到不了 AGI 的。

但奥特曼在前一阵的直播里还说了,AGI在路上了,我只能说,走着瞧了。


当然,俺觉得,这套标准本身也有不小的槽点。

人家AGI ,凭啥非要模仿人类啊?它很可能是一种完全不同的智能。硬拿人类的 CHC 理论去套 AGI,是否有点刻舟求剑的意味了。

而且,这标准定得也有点高了。讲实话,AI 要能达到一个“没受过教育的小孩”的水平,就已经无敌了。更别提有相当一部分人类,自己都通不过这个测试。。

不过,不管怎么吐槽,有人提出标准就是好事。

它最大的意义,是终于把 AGI 这个话题从玄学的范畴,拉回到了一个可以讨论的具体问题上。

就算这个标准不完美,它也会逼着整个行业开始思考,我们到底在追求什么,以及我们到底缺了什么。

这总比大家都在吹牛,说自己快要实现 AGI要强得多。

撰文:不咕

编辑:江江&面线

美编:萱萱

图片、资料来源

A Definition of AGI, Arxiv

OpenAI, X,部分图源互联网


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
31岁中乙中场停赛7个月罚6万 暴力染红后威胁+推裁判 踹坏广告板

31岁中乙中场停赛7个月罚6万 暴力染红后威胁+推裁判 踹坏广告板

风过乡
2026-05-07 12:12:48
男子在四川峨眉山游玩时,猛推悬崖边进食猴子取乐,险致猴子坠崖

男子在四川峨眉山游玩时,猛推悬崖边进食猴子取乐,险致猴子坠崖

网络易不易
2026-05-07 12:50:29
WTA罗马站:卡·普利斯科娃苦战过关,郑钦文17:00冲击32强

WTA罗马站:卡·普利斯科娃苦战过关,郑钦文17:00冲击32强

全网球APP
2026-05-07 12:14:39
郑晓龙新版《红楼梦》来袭:流量丫鬟扎堆,真能撼动87版经典?

郑晓龙新版《红楼梦》来袭:流量丫鬟扎堆,真能撼动87版经典?

乡野小珥
2026-05-07 11:38:41
67 岁倪萍哭着说:若有来生,我不要爹娘不要孩子,也不要家庭

67 岁倪萍哭着说:若有来生,我不要爹娘不要孩子,也不要家庭

橙星文娱
2026-05-06 15:19:39
伊朗战争,全世界才知道我国掌握三个杀手锏,早就是世界第一了

伊朗战争,全世界才知道我国掌握三个杀手锏,早就是世界第一了

揭秘历史的真相
2026-04-29 21:32:06
如果你不开心,就去看东北人的评论区,能让你笑出腹肌!

如果你不开心,就去看东北人的评论区,能让你笑出腹肌!

夜深爱杂谈
2026-04-14 15:18:00
35岁女子去做私处紧缩,缝针断在肉里,医生徒手掏了半小时没找着

35岁女子去做私处紧缩,缝针断在肉里,医生徒手掏了半小时没找着

离离言几许
2026-04-21 19:53:18
英媒:054B型护卫舰,第五艘亮相,总计8艘,可能有多大?

英媒:054B型护卫舰,第五艘亮相,总计8艘,可能有多大?

万里繁华
2026-05-07 10:17:58
上海内环旧改大局已定!真正有动迁机会的就这几片

上海内环旧改大局已定!真正有动迁机会的就这几片

科学发掘
2026-05-07 10:58:12
5月6日国际足联急了!除了中国,还有不止3个国家不给世界杯买单

5月6日国际足联急了!除了中国,还有不止3个国家不给世界杯买单

以茶带书
2026-05-06 20:48:28
33岁章泽天风格大变!穿艳俗纱裙、副乳突出,比实际年龄成熟10岁

33岁章泽天风格大变!穿艳俗纱裙、副乳突出,比实际年龄成熟10岁

阿讯说天下
2026-04-18 14:53:39
百万苏军压境,毛主席深夜召见四大元帅:徐向前刚进门,听完第一句话腿都软了

百万苏军压境,毛主席深夜召见四大元帅:徐向前刚进门,听完第一句话腿都软了

历史回忆室
2026-03-19 18:03:08
39岁前国脚现状:定居美国踢野球,早已财富自由,有2个可爱女儿

39岁前国脚现状:定居美国踢野球,早已财富自由,有2个可爱女儿

揽星河的笔记
2026-04-14 15:18:30
济尔哈朗屠湘潭多惨烈?二十万人仅剩不到百人, 有人留下屠城血证

济尔哈朗屠湘潭多惨烈?二十万人仅剩不到百人, 有人留下屠城血证

鹤羽说个事
2026-05-05 22:30:29
《人民的名义》最讽刺的地方,就是对底层群众和天龙人的刻画了

《人民的名义》最讽刺的地方,就是对底层群众和天龙人的刻画了

剧有梗
2026-05-05 07:42:28
韩媒:中国队,放马过来! 申裕斌已强势回归要为小组赛0-3复仇

韩媒:中国队,放马过来! 申裕斌已强势回归要为小组赛0-3复仇

劲爆体坛
2026-05-07 07:46:09
合同到期!CBA昔日王牌后卫与主教练闹翻,或离开老东家

合同到期!CBA昔日王牌后卫与主教练闹翻,或离开老东家

国篮会自强
2026-05-06 19:41:11
美军:一艘伊朗船试图突破封锁 美战机炸坏船舵

美军:一艘伊朗船试图突破封锁 美战机炸坏船舵

财联社
2026-05-07 01:32:06
为什么发达国家对中国都不友好?

为什么发达国家对中国都不友好?

新浪财经
2026-05-04 07:26:54
2026-05-07 13:55:00
差评XPIN incentive-icons
差评XPIN
用知识和观点Debug the world!
10711文章数 489627关注度
往期回顾 全部

科技要闻

凌晨突发!马斯克租22万块GPU给“死敌”

头条要闻

北京三位女大学生青海自驾游2死1伤 伤者一审获刑4年

头条要闻

北京三位女大学生青海自驾游2死1伤 伤者一审获刑4年

体育要闻

阿森纳巴黎会师欧冠决赛!5月31日开战

娱乐要闻

小S阿雅重返大S母校,翻看大S毕业照

财经要闻

特朗普:美伊“很有可能”达成协议

汽车要闻

理想为什么不做轿车,有了解释……

态度原创

艺术
亲子
本地
健康
公开课

艺术要闻

这位老教授笔下的青年,活力满满

亲子要闻

日本老公在地里干活,喜娜酱也来帮忙,被蚯蚓吓得蹦起来了

本地新闻

用青花瓷的方式,打开西溪湿地

干细胞治烧烫伤面临这些“瓶颈”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版