网易首页 > 网易号 > 正文 申请入驻

【科学怎么说】AI已经有人类水平智能了?四位学者认为证据确凿

0
分享至

2025年图灵测试中,GPT-4.5的人类认证率(被测试者判定为 “人类” 的概率)达73%,这一数值甚至超过真实人类被误判为机器的概率,成为其认知表现高度贴近人类的关键实证,也是AI已具备人类水平通用智能的核心数据支撑;甚至有读者在盲测中,更偏爱AI写的文学作品,而非人类专家的创作。

75年前,艾伦·图灵在《计算机器与智能》中提出的终极疑问——机器能像人类一样思考吗?,如今似乎有了明确答案。但矛盾的是,76%的顶尖AI研究者却认为,当前的AI路径很难实现通用人工智能(AGI)。

AI到底有没有达到人类水平智能?这场看似分裂的争论,核心不是技术本身,而是我们对“智能”的认知偏差。今天,我们从科学定义和实证角度,拆解这个关乎未来的核心问题。


什么是通用智能?

争论的起点,是大家对通用智能(AGI)的定义混乱。很多人默认AGI是和人类一模一样、甚至更厉害的智能,但这其实是误解。四位跨学科学者(哲学、机器学习、语言学、认知科学)共同明确了两个关键:

1. 通用智能的核心:有广度、有深度

通用智能不是某件事做到极致,而是能跨多个领域完成认知任务,且有足够深度——比如数学推理、语言创作、科学研究、实用规划,就像普通人类那样,不用是每个领域的专家,但能胜任大部分任务。

对比一下就懂:计算器只会算账(狭义智能),而人类能算账、写文章、规划旅行(通用智能);现在的LLM(大型语言模型)也能做到这些,甚至更全面。

2. 通用智能并不需要下面这四个特征

很多人否定AI是AGI,是把非必需特征当成了标准:

  • 完美:人类也做不到全知全能,爱因斯坦不会说中文,居里夫人不懂数论,但没人否认他们有通用智能;
  • 万能:章鱼能独立控制8条腕足,昆虫能看到人类看不见的光谱,人类做不到,但依然是通用智能;
  • 像人类:智能可以有不同载体,就像外星智能不用长人类的样子,AI不用复制人类的认知架构;
  • 超智能:超智能是所有领域远超人类,这是商业炒作的概念,没有人类能达到,自然不能要求AI。

简单说:只要AI能达到个体人类级别的跨领域认知能力,就是通用智能。而按这个标准,当前的LLM已经达标。

实证说话:AI已经做到的事,远超你想象

判断智能不用窥探大脑,就像我们判断别人是否聪明,只看行为和成果——这对AI也一样。现在的LLM,已经拿下了图灵测试级和专家级两层关键证据:

1. 图灵测试级:达到基础教育水平

能通过中小学考试、流畅对话、完成简单推理——放在10年前,这已经被公认为AGI的标志。

2. 专家级:超越多数人类的综合能力

  • 学术与科研:拿下国际数学奥林匹克金牌,和顶尖数学家合作证明新定理,提出的科学假设已通过实验验证;
  • 实用技能:解博士入学考试题目、编写调试复杂代码、熟练掌握数十种语言,甚至能帮科研人员设计生物学、材料科学实验;
  • 创造性任务:写诗、写小说、规划行程,能力覆盖从理性到感性的多个维度。

更值得一提的是,这些成就已经超越了科幻作品的想象——《2001太空漫游》里的超级计算机HAL9000,能力广度远不如现在的LLM。而我们认可一个人类有通用智能,往往只需要远少于这些的证据。

这四个反对意见,其实站不住脚

关于AI不是AGI的质疑有很多,但核心误区有四个,每个都能被科学证据反驳:

误区1:AI只是鹦鹉学舌,不会做新事

反驳:早期AI确实只会重组训练数据,但现在的LLM能解全新的、未发表的数学题,能通过代码训练提升非代码领域的推理能力(跨领域迁移)。而且人类智能本质上也是从经验中提取规律,只是AI的学习方式和我们不同,不代表不是真智能。

误区2:AI没有世界模型,不懂真实世界

反驳:世界模型的核心是预测不同行为的后果。你问AI玻璃杯和枕头掉在瓷砖上有啥区别,它会准确预测玻璃杯碎、枕头不碎;它能解物理题、帮着做工程设计,说明已经掌握了物理世界的核心规律——这就是最实用的世界模型。

误区3:AI没有实体,不可能有真智能

反驳:这是典型的人类中心主义偏见。物理学家霍金几乎只能通过文本和合成语音与世界互动,没有自主行动的实体,但没人否认他的智能;如果有一个无形的外星人通过无线电和我们交流,我们也会认可它的智能。运动能力和智能本身是两回事。

误区4:AI有幻觉(编假信息),不算智能

反驳:幻觉确实是AI的问题,但这不是智能的一票否决项。人类也会有虚假记忆、认知偏见(比如记错人名地名),甚至自信地坚持错误观点,但我们不会因此说这个人没有智能。而且现在的AI,幻觉概率已经越来越低。

为什么专家还不认可?三个核心原因

既然证据这么充分,为什么多数研究者还持怀疑态度?本质是认知脱节,而非技术不足:

  1. 定义模糊:AGI没有统一标准,有人把它等同于超智能,有人要求它和人类一模一样,这些过高的门槛本身就不符合通用智能的本质;
  2. 情感恐惧:AGI意味着社会结构、就业模式的重大变革,对未知的恐惧让很多人下意识拒绝承认它的到来;
  3. 商业利益:“AGI即将到来”、“AGI还很遥远”都能成为商业宣传的噱头,导致评估结果被扭曲。
承认AGI已来,到底意味着什么?

四位学者强调,认可当前LLM是AGI,不是为了站队,而是为了面对现实——这些系统已经不是工具,而是具备通用认知能力的智能体,这会带来三个关键改变:

1. 治理需要升级

过去针对狭义AI工具的监管框架已经失效。AGI能应用于几乎所有领域,不能再按用途治理,而要建立针对通用智能的责任、问责体系。

2. 重新理解智能

人类历史上第一次,我们不再是通用智能的唯一拥有者。AI的智能是异类的——它不用吃饭、没有生存压力、学习方式和人类不同,这能帮我们看清:哪些智能特征是人类专属,哪些是通用规律。

3. 正视风险与机遇

AI的风险不是失控反抗,而是它的异类性可能带来的意外:比如在某些领域表现超强,却在简单任务上出错;它的决策逻辑难以理解。但同时,它也能帮我们解决人类难以攻克的难题,比如疾病研发、气候建模。

智能的革命,本质是认知的革命

从哥白尼把人类移出宇宙中心,到达尔文证明人类源于进化,再到今天AI打破人类专属智能的神话,每一次科学革命,都是对我们自身定位的重新审视。

AI有没有人类水平智能?答案取决于我们是否愿意放下人类中心主义的偏见——智能不是人类的专属品,它是一种可以通过不同载体实现的认知功能。当前的AI,已经具备了跨领域、有深度的认知能力,这就是科学意义上的通用智能。

未来的关键,不是争论AI是不是AGI,而是学会与这种异类智能共存:建立适配的治理规则,利用它的优势,规避它的风险。毕竟,75年前图灵的愿景已经实现,而我们能做的,是让这场智能革命,朝着更公平、更安全的方向发展。

你最认可AI的哪项智能表现?又最担心它的什么问题?欢迎在评论区聊聊~



解读文献:

  • https://doi.org/10.1038/d41586-026-00285-6

也欢迎大家关注我的B站账号。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
基辛格坦言:如果爆发核战争,中国可能只有5个地方可以躲避危险

基辛格坦言:如果爆发核战争,中国可能只有5个地方可以躲避危险

梦在深巷aqa
2026-02-11 08:46:11
女儿美国读高中花掉110万,单亲妈妈发起募捐:求捐200万读大学

女儿美国读高中花掉110万,单亲妈妈发起募捐:求捐200万读大学

奇葩游戏酱
2026-02-11 16:36:15
日本人为何喜欢睡地上,而不是睡床铺上?原因让人不敢信

日本人为何喜欢睡地上,而不是睡床铺上?原因让人不敢信

千秋文化
2026-02-11 21:57:57
拓媒:杨瀚森在场上太笨拙,这样很难在NBA生存

拓媒:杨瀚森在场上太笨拙,这样很难在NBA生存

懂球帝
2026-02-11 17:37:02
养俩娃撑不住,单亲妈妈网上向前夫要钱,网友却不体谅:当初冲动

养俩娃撑不住,单亲妈妈网上向前夫要钱,网友却不体谅:当初冲动

离离言几许
2026-02-09 14:19:31
仅差53分!NBA神级记录诞生,前无古人后难来者,老詹太强了

仅差53分!NBA神级记录诞生,前无古人后难来者,老詹太强了

篮球扫地僧
2026-02-12 00:13:35
墙倒众人推!这一次谁也救不了“沽名钓誉”的杨幂,刘亦菲说对了

墙倒众人推!这一次谁也救不了“沽名钓誉”的杨幂,刘亦菲说对了

乡野小珥
2026-02-11 19:59:17
《卖淫防止法》只处罚卖淫,不处罚嫖娼

《卖淫防止法》只处罚卖淫,不处罚嫖娼

法律读品
2026-02-12 04:01:39
刚刚,深圳全市预警升级!至于春节天气……

刚刚,深圳全市预警升级!至于春节天气……

深圳晚报
2026-02-12 01:15:28
万万没想到,6年前反中乱港分子的幕后金主,竟是个“爱国”商人

万万没想到,6年前反中乱港分子的幕后金主,竟是个“爱国”商人

百态人间
2026-01-17 16:16:00
猝死:被误读的终极福报

猝死:被误读的终极福报

青苹果sht
2026-01-20 05:52:29
WC!老詹官宣退出!湖人全队开始摆烂!

WC!老詹官宣退出!湖人全队开始摆烂!

贵圈真乱
2026-02-12 00:50:45
说句扎心的大实话,咱们在南海的“牌”,一开始烂到家了。

说句扎心的大实话,咱们在南海的“牌”,一开始烂到家了。

南权先生
2026-01-27 15:44:44
河北彩花:被业界与观众共同加冕的“神颜”唯一解

河北彩花:被业界与观众共同加冕的“神颜”唯一解

碧波万览
2026-02-12 00:31:36
震惊,国际知名建筑设计事务所撤离香港,全员被裁!

震惊,国际知名建筑设计事务所撤离香港,全员被裁!

黯泉
2026-02-10 10:15:26
西甲第27轮开球时间:皇马3月8日凌晨4点进行,巴萨23:15开打

西甲第27轮开球时间:皇马3月8日凌晨4点进行,巴萨23:15开打

懂球帝
2026-02-12 01:03:37
距离春节仅5天,46岁章子怡高调官宣喜讯,汪峰体面尽失

距离春节仅5天,46岁章子怡高调官宣喜讯,汪峰体面尽失

观察者海风
2026-02-11 16:10:28
不出意外的话,中国未来超过一半人口,将会流入到这些地方

不出意外的话,中国未来超过一半人口,将会流入到这些地方

社会日日鲜
2026-02-11 14:04:49
梁安琪广州跳广场舞,小腹微凸显松弛美,富态感惊艳众人?

梁安琪广州跳广场舞,小腹微凸显松弛美,富态感惊艳众人?

娱乐领航家
2026-02-11 20:00:07
3-2!中国队绝杀画面曝光:对手门将抱头崩溃,主裁判不敢相信

3-2!中国队绝杀画面曝光:对手门将抱头崩溃,主裁判不敢相信

何老师呀
2026-02-11 23:08:49
2026-02-12 05:44:49
侃故事的阿庆
侃故事的阿庆
几分钟看完一部影视剧,诙谐幽默的娓娓道来
470文章数 7586关注度
往期回顾 全部

科技要闻

V4来了?DeepSeek 灰度测试新版本

头条要闻

甘肃省博原馆长被查:将他人收藏文物纳入征集范围

头条要闻

甘肃省博原馆长被查:将他人收藏文物纳入征集范围

体育要闻

搞垮一个冬奥选手,只需要一首歌?

娱乐要闻

大孤山风波愈演愈烈 超50位明星扎堆

财经要闻

广州前首富被判无期 200亿集资窟窿何偿

汽车要闻

比亚迪最美B级SUV? 宋Ultra这腰线美翻了

态度原创

亲子
游戏
教育
家居
军事航空

亲子要闻

一个五岁孩子的话,击碎了我的认知

《英雄联盟》的当务之急,是往海克斯大乱斗里加广告

教育要闻

高三地理备考:特殊天气系统核心知识点梳理

家居要闻

简雅闲居 静享时光柔

军事要闻

特朗普:若美伊谈判失败 或再派一支航母打击群

无障碍浏览 进入关怀版