近年来,人工智能技术的突飞猛进让"AI何时超越人类"成为热门话题。从ChatGPT的惊艳表现到GPT-5的多模态突破,科技巨头们不断释放着"通用人工智能(AGI)即将到来"的乐观信号。然而,当我们拨开炒作的面纱,用科学方法评估AI的真实能力时,会发现通往AGI的道路远比想象中漫长。
科技领袖们对AGI的预言往往充满矛盾。马斯克宣称"5年内实现AGI",OpenAI CEO山姆·奥特曼则认为"AGI可能在未来4-5年内出现"。但令人尴尬的是,行业至今未能就AGI的准确定义达成共识。这种概念模糊导致各种AI进步被过度解读,某些特定能力的突破常被误认为通用智能的曙光。
2025年由多位图灵奖得主和科技领袖联合发表的里程碑研究,首次建立了AGI的量化评估体系。该研究借鉴心理学中的CHC智力理论,将人类智能分解为10个核心维度:通识知识、读写能力、数学能力、即时推理、工作记忆、视觉处理、听觉处理、反应速度、长期记忆存储与检索。每个维度占10分,满分100分代表达到"受过良好教育的成年人"水平。
![]()
研究团队对GPT-4(2023)和GPT-5(2025)进行系统测试,结果显示:
GPT-4总分27分,表现出严重的能力不平衡
GPT-5进步显著达58分,但仍未及格
具体来看,AI在知识性任务(通识9分、读写9分、数学8分)表现优异,但在工作记忆(4分)、视觉处理(4分)、长期记忆存储(0分)等基础认知能力上存在明显缺陷。这种"偏科"现象揭示出现有AI的本质局限。
测试发现,现有AI的"记忆"实为技术假象。当研究人员第一天向AI输入信息,第二天在新对话中测试时,AI完全无法回忆。这说明:
1. 当前AI依赖外部知识库而非真正的记忆机制
2. 超长上下文窗口只是延缓遗忘的权宜之计
3. 模型本身不具备持续学习能力
这种"能力扭曲"现象导致AI通过某些优势领域掩盖根本缺陷,制造智能假象。
![]()
视觉处理测试(4分)暴露出AI的多模态理解局限。面对"判断2D展开图能否组成指定立方体"这类需要空间推理的任务,AI表现远逊人类。这表明:
视觉信息与逻辑推理尚未有机融合
跨模态关联能力仍处初级阶段
动态思维过程难以模拟
尽管这套标准存在争议(如是否过度人类中心主义),但其突破性在于:
1. 将玄学讨论转化为可测量指标
2. 揭示AI发展的真实瓶颈
3. 遏制行业过度炒作
正如研究者指出:"当AI在基础认知维度存在明显缺陷时,宣称接近AGI是不负责任的。"
要实现真正的AGI,必须突破以下核心难题:
1. 记忆机制:开发具有持续学习能力的神经架构
2. 跨模态整合:建立视觉、语言、逻辑的统一表征
3. 自我监控:解决幻觉问题,提升输出可靠性
4. 适应性学习:实现不同场景的知识迁移
当我们用人类标准衡量时,需要认识到:
AGI可能展现完全不同的智能形态
某些"缺陷"在特定场景反而是优势
达到儿童智能水平已具革命性意义
行业需要更多此类基础研究,避免在资本驱动下陷入盲目乐观。
AI进化之路恰似登山:每当我们征服一个技术高峰,就会看到更高远的山峦。GPT-5的58分提醒我们,从专用智能到通用智能的跨越,需要根本性的理论突破。或许正如计算机科学家艾伦·凯所言:"预测未来的最好方式就是发明它。"在AGI的探索中,保持科学理性比盲目乐观更重要。这条路没有捷径,但每一步扎实的进步,都在拓展智能的边疆。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.