网易首页 > 网易号 > 正文 申请入驻

年终盘点:GPT-5被批无进步,Epoch论调真相令人心寒

0
分享至



哈喽,大家好,今天小睿这篇科技深度解析,就来聊聊 GPT-5 遭吐槽 “没进步” 的争议,Epoch AI 年终报告用硬核数据打脸:AI 不仅在狂飙,通往超级智能(ASI)的脚步还更近了!

2025年末,AI圈陷入一场有趣的争议,GPT-5发布后,不少用户吐槽“没感受到明显进步”,甚至抛出“AI发展停滞”的论调。

就在争议发酵之际,权威研究机构Epoch AI发布年度终期报告,用数百组实测数据和深度洞察给出明确答案:AI不仅没有停滞,反而进入了加速增长的“狂飙期”。





高阶数学测试揭开AI真实水平



值得注意的是,即便是GPT、Gemini等全球顶尖模型,在该测试中的表现也不尽如人意,最新纪录保持者Gemini 3 Pro的4级准确率仅为19%。

这一结果印证了一个关键结论,在需要深度理论理解和创造性思维的高阶任务中,当前AI仍处于“小学生摸象”阶段,尚未成为真正的“专家级选手”。





ECI指标揭示增长真相

AI能力加速提升,核心驱动力生变。

为精准追踪AI发展轨迹,Epoch AI构建了Epoch Capabilities Index(ECI)综合指标体系。

数据显示,自2024年4月起,前沿AI模型的能力增长速度较此前提升近一倍,打破了“稳定上升”的传统认知,呈现出“阶段性爆发”的特征。



这一变化的核心驱动力并非传统的“更大模型+更多参数”,而是推理模型的迭代升级与强化学习技术的深度应用。

黄仁勋在后续公开演讲中也佐证了这一趋势,他提到英伟达与OpenAI的深度协同正是围绕推理效率提升展开,而当前AI算力需求的叠加效应已远超以往。

这也解释了为何大众会产生“进步不明显”的错觉,AI的进化重心已从“感知层面的功能新增”转向“底层推理能力的质变”,这种提升往往不直接体现在日常交互中,却对产业级应用至关重要。





年终盘点十大热门洞察

AI普惠化加速,研发逻辑重构。

Epoch AI梳理了2025年最受关注的十大行业洞察,其中多项结论颠覆了大众认知。

在成本与普及层面,2023年4月至2025年3月,同等性能下AI推理的token价格下降超10倍,这意味着AI技术正从“大厂专属”转向“全民可用”。



更值得关注的是,前沿AI性能已实现消费级硬件适配,当前顶级开源模型在消费级GPU上的运行效果,与顶尖模型的差距不足一年,未来笔记本电脑运行大模型将成为可能。

在研发层面OpenAI 2024年的大部分算力并未用于训练或服务,而是投入实验探索,印证了当前AI研发仍依赖“试错式创新”。

而英伟达芯片的已部署AI计算量自2020年起每年翻倍,旗舰芯片三年内可占据绝大部分计算量,凸显了GPU作为AI核心燃料的不可替代性。



架构创新与发展边界并存,AI价值争议浮出水面。

行业热点中,DeepSeek的技术突破颇具代表性:其通过多头潜在注意力(MLA)、改进型混合专家(MoE)架构等三项核心技术,以更低算力拿下顶级开源模型席位,后续发布的R1模型性能比肩OpenAI o1,成本却仅为几分之一。

这一案例印证了“架构创新=低成本+快落地”的新研发逻辑,也带动了全球低成本AI研发热潮,斯坦福大学团队甚至以数十美元成本开发出可媲美顶尖模型的推理模型。



但报告也指出了发展边界,OpenAI等机构坦言,强化学习(RL)的扩展速度仅能维持1-2年,将很快触及算力基础设施上限,2024-2025年的爆发式增长可能放缓。

更具争议的是AI价值的实现路径:奥特曼等行业领军者认为“自动化研发是爆发式增长关键”,而Epoch AI则基于1988-2020年历史数据提出,AI的最大价值或将来自经济体系的广泛自动化,而非科研加速,这场分歧本质上关乎AI革命的“节奏与形态”。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
马杜罗有四个儿子,亲儿子被起诉,是下一个目标,其他三子或幸免

马杜罗有四个儿子,亲儿子被起诉,是下一个目标,其他三子或幸免

悦心知足
2026-01-04 10:04:50
向华强公开《寻秦记》成本:古天乐差点睡天桥,电影面临巨亏

向华强公开《寻秦记》成本:古天乐差点睡天桥,电影面临巨亏

光影新天地
2026-01-04 17:47:39
万科裁员1.3万人

万科裁员1.3万人

地产微资讯
2026-01-03 11:42:30
布克24+9献0.7秒三分准绝杀!太阳逆转雷霆18分 西部最大黑马?

布克24+9献0.7秒三分准绝杀!太阳逆转雷霆18分 西部最大黑马?

颜小白的篮球梦
2026-01-05 11:43:45
A股:周一,放量上涨,释放了两个信号,股市即将进入尾声了?

A股:周一,放量上涨,释放了两个信号,股市即将进入尾声了?

明心
2026-01-05 11:22:30
最新通报:河北省20人死亡重大事故···

最新通报:河北省20人死亡重大事故···

新牛城
2026-01-05 09:58:17
国内唯一!国产高性能芯片华山A2000通过美国审查:正式推向全球市场

国内唯一!国产高性能芯片华山A2000通过美国审查:正式推向全球市场

快科技
2026-01-04 23:05:04
看见佟丽娅大腿上那两道线条了吗?

看见佟丽娅大腿上那两道线条了吗?

小光侃娱乐
2026-01-03 15:40:02
美国突袭委内瑞拉后,俄罗斯石油面临压力,能源收入将进一步恶化

美国突袭委内瑞拉后,俄罗斯石油面临压力,能源收入将进一步恶化

山河路口
2026-01-04 23:43:35
随着新月2-0,利雅得体育0-4,沙特联最新积分榜:C罗率队从榜首滑落

随着新月2-0,利雅得体育0-4,沙特联最新积分榜:C罗率队从榜首滑落

侧身凌空斩
2026-01-05 06:46:05
现场画面曝光!美媒公布美军打击委内瑞拉蒂乌纳堡基地后景象

现场画面曝光!美媒公布美军打击委内瑞拉蒂乌纳堡基地后景象

环球网资讯
2026-01-04 14:02:30
最低调普京女婿被亿万富豪当街暴打:拒绝10亿赔偿,只提一个要求

最低调普京女婿被亿万富豪当街暴打:拒绝10亿赔偿,只提一个要求

刀刃故事
2024-11-11 10:40:21
三亚不香了?东北人撤离成潮,压垮他们的不是物价,而是生活现实

三亚不香了?东北人撤离成潮,压垮他们的不是物价,而是生活现实

青眼财经
2026-01-02 23:58:07
孟加拉国新发现,凡是靠在中国旁边的国家,人口大部分都是上亿的

孟加拉国新发现,凡是靠在中国旁边的国家,人口大部分都是上亿的

扶苏聊历史
2026-01-04 18:33:26
留给大清的时间,真的不多了

留给大清的时间,真的不多了

我是历史其实挺有趣
2026-01-03 08:50:37
腾讯元宝回应“骂人”:不存在人工回复,小概率下的模型异常输出

腾讯元宝回应“骂人”:不存在人工回复,小概率下的模型异常输出

澎湃新闻
2026-01-05 11:00:26
突发黑天鹅!美国闪击委内瑞拉,这3个板块即将狂暴上涨!

突发黑天鹅!美国闪击委内瑞拉,这3个板块即将狂暴上涨!

小白鸽财经
2026-01-05 09:34:53
黄牛都不要了,网红玩偶价格腰斩暴跌至629元,曾炒到108万天价

黄牛都不要了,网红玩偶价格腰斩暴跌至629元,曾炒到108万天价

削桐作琴
2026-01-02 18:11:30
双星鞋业家族内斗!84岁创始人宣布断绝父子关系,曾曝出抢公章“夺权”

双星鞋业家族内斗!84岁创始人宣布断绝父子关系,曾曝出抢公章“夺权”

红星新闻
2026-01-04 19:54:28
李斯:为什么《寻秦记》的李斯最不像演的,带你看历史上的李斯

李斯:为什么《寻秦记》的李斯最不像演的,带你看历史上的李斯

威言晓史
2026-01-05 08:57:27
2026-01-05 13:03:00
无法克制的烦恼
无法克制的烦恼
感谢关注
274文章数 94关注度
往期回顾 全部

科技要闻

雷军新年首播:确认汽车业务降速

头条要闻

媒体:美国捉拿马杜罗后 多位专家示警赖清德

头条要闻

媒体:美国捉拿马杜罗后 多位专家示警赖清德

体育要闻

女子世界第一,9年前在咖啡店洗碗

娱乐要闻

黄宗泽夺双料视帝,泪洒颁奖台忆往昔

财经要闻

李迅雷:扩内需要把重心从"投"转向"消"

汽车要闻

不是9S是8X!极氪全新高性能旗舰SUV命名官宣

态度原创

艺术
亲子
本地
公开课
军事航空

艺术要闻

19幅 列宾美院学生优秀毕业作品

亲子要闻

医患联欢 别样温情

本地新闻

即将过去的2025年,对重庆的影响竟然如此深远

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

马杜罗预计5日在纽约"首次出庭"

无障碍浏览 进入关怀版