OpenAI的AGI时间表正在经历一场信任危机。公司对外宣称2027年实现通用人工智能,但内部员工选择用代码说话——他们在GitHub上开源了一个名为"PaperBench"的评测框架,专门测试AI能否独立完成机器学习研究。
这个框架的狠劲在于:它不给AI喂现成论文,而是扔给它们ICML 2024的投稿副本,要求从零复现。结果?目前最强的AI系统成功率只有21%,连"勉强及格"都算不上。
项目核心作者之一、OpenAI研究员Julian Michael在发布时甩了一句:「我们的目标是让AI能够自主推进AI研究的前沿。」这句话的潜台词被同行迅速解码:如果连复现现有研究都费劲,2027年AGI的承诺更像是一张远期支票。
讽刺的是,OpenAI自己就是这场评测的出题人。PaperBench的35个测试项全部来自公司内部筛选的机器学习论文,相当于让AI参加一场"自己人命题、自己人监考"的考试,成绩依然惨淡。
一位参与项目的研究员在Hacker News上补充了细节:他们原本设计了更难的测试,但发现现有模型"完全无法开始",只好降级到当前版本。这个细节比任何官方声明都诚实——AGI的进度条,可能比PPT上显示的短一大截。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.