网易首页 > 网易号 > 正文 申请入驻

AGI的真正考卷:让AI独立推导出相对论

0
分享至

快速阅读: 谷歌DeepMind联合创始人哈萨比斯提出了一个检验真正AGI的思想实验:用1911年前的知识训练AI,看它能否像爱因斯坦一样在1915年推导出广义相对论。这个想法听起来浪漫,细想却充满争议。

该图片可能由AI生成

哈萨比斯的AGI定义从来没变过:能够展现人类全部认知能力的系统。他特别强调,大脑是我们已知的唯一一个通用智能的存在证明——这也是他当年去学神经科学的原因。

他对当前系统的判断相当直接:能在国际数学奥林匹克竞赛中拿金牌,却可能被换个问法的简单数学题绊倒。这种“锯齿状智能”不是通用智能,只是某种高度不均衡的能力堆叠。

于是他提出了那个思想实验:将AI的训练数据截止到1911年,然后看它能否自行推导出1915年的广义相对论。

这个想法在网上引发了两种截然对立的反应。

支持者认为,这正是一个真正意义上的推理测试,而非记忆测试。你不是在考它背没背过答案,而是在考它能否从已有材料中生长出全新的理论。有观点认为,把截止年份换成更近的时间也成立——比如用2016年前的数据,看AI能否独立发明2017年的Transformer架构。

质疑者则直接戳穿了这个测试的操作难度:1911年前有多少数字化文本?那点数据够训练出什么规模的模型?更根本的问题是,爱因斯坦的思维不只来自书本,还来自他整个生命中对物理世界的感知、与同行的走廊对话、专利局工作中接触到的各类发明构想。你根本不知道他的脑子里装了什么,也就无法复现他的起点。

有网友直接说:爱因斯坦自己承认,想象力才是他工作中最重要的部分。而这恰好是大型语言模型目前最缺失的东西——它无法在训练数据之外真正“想象”。

还有一个更尖锐的批评:这个标准本身就太高了。爱因斯坦不代表普通人,他代表的是人类认知上限中的上限。用这个标准定义AGI,意味着绝大多数人类也没达到AGI。

有观点认为,当前AI系统的核心缺陷不是知识储备,而是归纳推理和溯因推理。大模型靠的是极其精密的演绎能力,而演绎在人类认知的整个谱系里,可能偏偏是最不关键的那一维。

哈萨比斯说,他认为还需要“一两个重大突破”才能实现AGI,这些突破可能明天到来,也可能是二十年后。听起来像是在打太极,但考虑到他把爱因斯坦当成考题,这个时间窗口的不确定性或许是诚实的。

真正的问题或许是:如果AI终有一天能独立推导出广义相对论,我们会不会又说,“这只是它擅长的那个领域,不算真正的通用智能”?

简评:

哈萨比斯出的这道题,表面考AI,实际考人。

他想要一个决定性证据:AI到底是“记忆的机器”还是“思考的实体”。但问题在于,爱因斯坦自己也说不清相对论是怎么想出来的。创造力最神秘的地方就在于它不可回溯、不可复现。你让AI重走一遍1911到1915,走通了你会说“只是碰巧”,走不通你会说“果然不行”——这不是测试,这是审判

更要命的是,我们对人类智能的标准从来都是“双标”的:普通人办不到的事,我们不苛责;AI办到了的事,我们总怀疑。所以真正的问题不是AI什么时候能推导出相对论,而是——当它真的推出来那天,我们舍得承认吗?

www.reddit.com/r/singularity/comments/1rb3awd/demis_hassabis_the_kind_of_test_i_would_be

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
哈卡震彻战场!乌克兰以毛利战舞送别28岁“托尔金”

哈卡震彻战场!乌克兰以毛利战舞送别28岁“托尔金”

老马拉车莫少装
2026-02-03 22:44:42
高市早苗当选日本第105任首相,外交部回应

高市早苗当选日本第105任首相,外交部回应

极目新闻
2026-02-23 21:57:05
云南省各地市州经济支柱(简明版)

云南省各地市州经济支柱(简明版)

花小猫的美食日常
2026-02-24 00:21:04
当周涛和李雪琴同台主持,一个全裹一个暴露,才懂穿着得体多重要

当周涛和李雪琴同台主持,一个全裹一个暴露,才懂穿着得体多重要

青橘罐头
2026-02-07 09:27:14
全国第一个!陕西官宣2026年提高退休人员养老金,能涨2%吗?

全国第一个!陕西官宣2026年提高退休人员养老金,能涨2%吗?

财话连篇
2026-02-23 18:11:55
央媒27字锐评王菲春晚表现,不提歌技却一针见血,戳中年歌迷心坎

央媒27字锐评王菲春晚表现,不提歌技却一针见血,戳中年歌迷心坎

小徐讲八卦
2026-02-23 07:05:12
6.9万“心碎补偿”引爆全网:女子撞破前男友与闺蜜亲密行为坠楼

6.9万“心碎补偿”引爆全网:女子撞破前男友与闺蜜亲密行为坠楼

戗词夺理
2026-01-22 11:00:09
499米!停工许久苏州第一高楼又要被拍卖了?

499米!停工许久苏州第一高楼又要被拍卖了?

阿离家居
2026-02-23 22:50:56
天津西站发生盗窃事件

天津西站发生盗窃事件

天津族
2026-02-23 07:32:50
东北男子养鹿破产,赌气放生了30头鹿,8年后上山,眼前一幕却让他泪崩了...

东北男子养鹿破产,赌气放生了30头鹿,8年后上山,眼前一幕却让他泪崩了...

品读时刻
2026-02-14 09:03:05
大快人心!乌情报总局官宣:俄军战犯佐托夫被击毙,血债终须血偿

大快人心!乌情报总局官宣:俄军战犯佐托夫被击毙,血债终须血偿

老马拉车莫少装
2026-02-03 23:23:30
酒店里,挤满了偷偷开房的已婚女性

酒店里,挤满了偷偷开房的已婚女性

第7情感
2025-10-08 20:03:17
继张本智和反华拜鬼,被官媒点名后,石川佳纯也走上了他的老路

继张本智和反华拜鬼,被官媒点名后,石川佳纯也走上了他的老路

姩姩有娱
2026-02-23 18:09:28
我妈62岁想离婚,我爸同意签了字,出了民政局后,我爸拿出个文件

我妈62岁想离婚,我爸同意签了字,出了民政局后,我爸拿出个文件

百晓史
2025-10-12 10:56:20
看上海外婆,再看北京姥姥,我悟了:老了尽量少戴黄金、穿老年装

看上海外婆,再看北京姥姥,我悟了:老了尽量少戴黄金、穿老年装

白宸侃片
2026-02-21 10:54:46
李凯馨:原来“大粗腿”才是性感天花板!

李凯馨:原来“大粗腿”才是性感天花板!

白色得季节
2026-02-03 13:20:01
谷爱凌戴32万手表领金牌,她戴的施华洛世奇千元耳饰已售罄!

谷爱凌戴32万手表领金牌,她戴的施华洛世奇千元耳饰已售罄!

车窗起雾q
2026-02-23 00:54:25
3-0横扫晋级!中国女乒22岁第三巨头崛起:追赶孙颖莎王曼昱?

3-0横扫晋级!中国女乒22岁第三巨头崛起:追赶孙颖莎王曼昱?

李喜林篮球绝杀
2026-02-23 20:35:54
全球矿业巨头的“一致战略选择”:铜!

全球矿业巨头的“一致战略选择”:铜!

华尔街见闻官方
2026-02-23 15:00:05
24场1球!引皇马、拜仁、尤文、米兰豪门竞逐!18岁小孩凭什么?

24场1球!引皇马、拜仁、尤文、米兰豪门竞逐!18岁小孩凭什么?

体育世界
2026-02-23 16:39:25
2026-02-24 05:03:00
侃故事的阿庆
侃故事的阿庆
几分钟看完一部影视剧,诙谐幽默的娓娓道来
420文章数 7727关注度
往期回顾 全部

科技要闻

智谱、MiniMax合计蒸发近千亿市值,为何?

头条要闻

墨西哥最大毒枭被击毙:喜欢杀人灭门 几乎没人看见过他

头条要闻

墨西哥最大毒枭被击毙:喜欢杀人灭门 几乎没人看见过他

体育要闻

哈登版骑士首败:雷霆的冠军课

娱乐要闻

那艺娜账号被禁止关注,视频已清空!

财经要闻

美国海关将停止征收被裁定违法的关税

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

教育
房产
游戏
时尚
手机

教育要闻

如何用好奇心与同龄人拉开差距?

房产要闻

窗前即地标!独占三亚湾C位 自贸港总裁行宫亮相

海盗PvE生存冒险《风启之旅》Steam愿望单破100万

今年春天一定要拥有的针织,这样穿减龄又好看!

手机要闻

iPhone 18 Pro进入量产测试阶段 今年秋季发布

无障碍浏览 进入关怀版