斯坦福AI年度报告：中美差距缩至0.3%，美国AI投资还是中国12倍|基准|大模型|人工智能|斯坦福ai|查尔斯·维利尔斯·斯坦福

斯坦福AI年度报告：中美差距缩至0.3%，美国AI投资还是中国12倍

2025-04-13 20:37:50　来源: AI变革

黑龙江举报

分享至

从17.5%到0.3%：中美AI大模型差距的惊天逆转

在人工智能领域，中美两国一直是全球AI发展的两大引擎。2025年4月7日，斯坦福大学以人为本人工智能研究所(HAI)发布了备受瞩目的《2025年人工智能指数报告》，这份长达456页的报告揭示了一个令人震惊的发现：中美顶级AI大模型的性能差距从2023年的17.5%骤降至2024年的0.3%，几乎可以忽略不计。

基准测试中的差距变化

要理解这一差距缩小的意义，我们需要了解AI性能是如何衡量的。斯坦福报告使用了多项基准测试来评估AI模型的性能，包括MMLU(大规模多任务语言理解)、MMMU、MATH和HumanEval等。这些基准测试分别评估AI在语言理解、推理、数学和编程等不同能力上的表现。

2023年底，中美AI模型在这些基准测试上的差距分别为：

MMLU：17.5个百分点

MMMU：13.5个百分点

MATH：24.3个百分点

HumanEval：31.6个百分点

到了2024年底，这些差距已经显著缩小到：

MMLU：0.3个百分点

MMMU：8.1个百分点

MATH：1.6个百分点

HumanEval：3.7个百分点

特别是在MMLU测试中，中国领先的模型与美国顶级模型之间的差距从近20个百分点缩小到仅仅0.3个百分点。这一进步速度令人惊叹，相当于在不到一年的时间里，中国AI模型的性能提高了近17个百分点。

开源与闭源的较量

开源AI模型在2024年的崛起是推动这一差距缩小的重要因素。2024年初，领先闭源模型的表现比顶级开源模型高出8.0%。然而，到2025年2月，这一差距已经大幅缩小。

以DeepSeek为代表的开源模型迅速崛起，性能逼近甚至在某些方面超过了闭源的美国模型。开源社区的协作模式和快速迭代能力成为中国AI快速进步的重要推动力。

数量与质量的双重较量

模型数量差距

尽管在性能上差距大幅缩小，但在模型数量方面，美国仍然保持显著优势。2024年，美国机构开发了40个"值得关注的AI模型"，而中国只有15个，欧洲仅3个。

投资差距：数字背后的实力对比

尽管在模型性能上差距缩小，但在AI投资方面，美国仍然保持着压倒性优势。2024年，美国AI投资额达到1091亿美元，是中国93亿美元的12倍。

这种投资差距反映了两国在AI生态系统方面的差异。美国拥有更为成熟的AI产业链、更丰富的数据资源和更强大的计算能力，这些因素共同构成了美国AI持续创新的土壤。

技术进步：推动差距缩小的关键因素

推理成本的戏剧性下降

2023年至2024年，AI模型推理成本实现了戏剧性下降。高端AI模型运行成本削减了99.7%。以MMLU基准测试中表现相当于GPT-3.5的AI模型为例，其推理成本大幅降低。

小模型的崛起

2022-2024年间，小模型性能显著提升。2022年，在大规模多任务语言理解（MMLU）基准测试中，得分超过60%的最小模型是PaLM，参数量为5400亿。到了2024年，参数量减少了142倍，但性能却保持了相当水平。

解决复杂任务能力的飞跃

AI在解决复杂任务方面的能力也实现了显著提升。在解决编码问题上，AI的能力从2021年的4.4%跃升至2024年的71.1%。这一进步表明AI已经能够处理更加复杂和专业的任务，其应用价值正在不断提升。

开源社区的蓬勃发展

开源社区在中国AI发展中扮演了重要角色。开源模型的快速发展和广泛应用，使得中国能够绕过一些技术壁垒，迅速提升AI能力。

开源社区的协作模式和快速迭代能力成为中国AI快速进步的重要推动力。通过开源，中国AI研究者能够直接参与全球AI技术前沿的探索，加速技术积累和创新。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.