刚刚，李飞飞团队发布《2025年人工智能指数报告》：12大趋势证明，AI不再只是关于可能性的故事|机器人|计算机|超级智能

刚刚，李飞飞团队发布《2025年人工智能指数报告》：12大趋势证明，AI不再只是关于可能性的故事

2025-04-08 10:13:07　来源: 学术头条

北京举报

分享至

刚刚，由李飞飞联合领导的斯坦福大学以人为本人工智能研究所（Stanford HAI）发布了《2025 年人工智能指数报告》（Artificial Intelligence Index Report 2025）。

这份长达 456 多页的报告是 Stanford HAI 发布的第 8 份 AI Index 研究，追踪了 2024 年全球人工智能（AI）行业的发展趋势。

今年的报告新增了对 AI 硬件发展状况的深入分析、对推理成本的新估算，以及对 AI 出版和专利申请趋势的分析。他们还引入了有关企业采用负责任的 AI 实践的最新数据，并扩大了对 AI 在科学和医学中日益重要作用的报道。

完整报告：

https://hai-production.s3.amazonaws.com/files/hai_ai_index_report_2025.pdf

Stanford HAI 在官方网站上写道，“AI 对社会的影响从未如此明显......2025 年指数是我们迄今为止最全面、也是在这一重要时刻发布的报告。”

他们还认为，“AI 将是 21 世纪最具变革性的技术。然而，除非我们精心引导 AI 行业的发展，否则这项技术将难以惠及普罗大众。”

这份新报告揭示了 2024 年 AI 行业的 12 大趋势：

1.AI 在苛刻基准上的表现持续提升

2023 年，研究人员引入了新的基准——MMMU、GPQA 和 SWE-bench，以测试高级 AI 系统的极限。仅仅一年后，性能大幅提升：在 MMMU、GPQA 和 SWE-bench 上的得分分别提高了 18.8、48.9 和 67.3 个百分点。在基准测试之外，AI 系统在生成高质量视频方面也取得了重大进展，在某些场景下，语言模型智能体（language model agents）甚至在有限时间预算的编程任务中超越了人类。

图｜选择的 Al 指数技术性能基准 vs. 人类表现

2.AI 正越来越多地融入到日常生活中

从医疗保健到交通运输，AI 正迅速从实验室走向日常生活。2023 年，FDA 批准了 223 种 AI 医疗设备，而 2015 年仅为 6 种。在道路上，自动驾驶汽车不再是实验性的：美国最大的运营商之一 Waymo 每周提供超过 15 万次自动驾驶出行，而百度的经济型“萝卜快跑” （Apollo Go）自动驾驶出租车车队现在已在中国多个城市提供服务。

图｜FDA 批准的 AI 医疗设备数量（1955-2023）

3.企业全力投入 AI，推动投资和使用创历史新高

2024 年，美国私营部门对 AI 的投资增长到 1091 亿美元——几乎是中国（9.3 亿美元）的 12 倍，是英国（4.5 亿美元）24 倍。生成式 AI 尤其强劲，全球吸引私营投资 339 亿美元——比 2023 年增长 18.7%。AI 的商业应用也在加速：2024 年，78% 的组织报告称在使用 AI，比前一年增长 55%。同时，越来越多的研究证实，AI 提高了生产力，在大多数情况下，有助于缩小劳动力中的技能差距。

图｜2017-2024 年，表示其所在组织至少在一项职能中使用 AI 的受访者比例

4.在创造顶级 AI 模型方面，中国正在缩小与美国的差距

2024 年，美国机构推出了 40 个引人注目的 AI 模型，显著超过中国的 15 个和欧洲的 3 个。虽然美国在数量上保持领先，但中国模型在质量上迅速缩小了差距：在 MMLU 和 HumanEval 等主要基准上的性能差异从 2023 年的两位数缩小到 2024 年的接近相等。同时，中国在 AI 出版物和专利方面继续领先。与此同时，模型开发越来越全球化，中东、拉丁美洲和东南亚等地区也推出了引人注目的新模型。

图｜美国顶尖模型与中国顶尖模型在 LMSYS 聊天机器人竞技场中的表现

5.负责任的 AI 生态系统不断发展，但不均衡

人工智能相关事件急剧上升，但在主要工业模型开发者中，标准化的 RAI 评估仍然很少。然而，新的基准如 HELM Safety、AIR-Bench 和 FACTS 为评估事实性和安全性提供了有希望的工具。在公司中，识别 RAI 风险和采取有意义的行动之间存在差距。相比之下，政府表现出更大的紧迫性：2024 年，全球在人工智能治理方面的合作加强，包括经合组织、欧盟、联合国和非盟在内的组织发布了关注透明度、可信度和其他核心负责任人工智能原则的框架。

图｜已公布的针对热门基础模型的安全性和负责任 AI 基准

6. 全球 AI 乐观情绪上升，但地区间深层次分歧依然存在

在中国（83%）、印度尼西亚（80%）和泰国（77%）等国家的大多数人认为，人工智能产品和服务是利大于弊的。相比之下，加拿大（40%）、美国（39%）和荷兰（36%）等地的乐观情绪仍然远低于其他国家。然而，情绪正在转变：自 2022 年以来，包括德国（+10%）、法国（+10%）、加拿大（+8%）、英国（+8%）和美国（+4%）在内的几个先前持怀疑态度的国家，乐观情绪显著增长。

图 | 2022-2024 年，按国家划分认为“使用 AI 的产品和服务利大于弊”的比例

7.AI 变得更加高效、经济实惠和易于获取

由越来越强大的小型模型驱动，在达到 GPT-3.5 水平上的系统推理成本在 2022 年 11 月到 2024 年 10 月间下降了 280 倍。在硬件层面，成本每年下降 30%，而能效每年提高 40%。开放权重模型也在缩小与封闭模型的差距，在某些基准测试中，一年内性能差异从 8%减少到仅 1.7%。这些趋势共同迅速降低了高级人工智能的门槛。

图 | 2022-2024 年，在 MMLU 中得分超过 60% 的最小规模 AI 模型

8.各国政府正在加强对 AI 的监管和投资

2024 年，美国联邦机构出台了 59 项与 AI 相关的法规，是 2023 年的两倍多，发布法规的机构数量也是 2023 年的两倍。在全球范围内，自 2023 年以来，75 个国家的 AI 立法提及率上升了 21.3%，自 2016 年以来增长了 9 倍。在日益受到关注的同时，各国政府也在进行大规模投资：加拿大承诺投资 24 亿美元，中国启动了 475 亿美元的半导体基金，法国承诺投资 1090 亿欧元，印度承诺投资 12.5 亿美元，沙特阿拉伯则发起了一项 1000 亿美元的倡议。

图 | 部分供应商的顶尖模型在 LSYS 聊天机器人竞技场中的表现

9.AI 和计算机科学教育正在扩大，但普及程度仍不够

如今，已有 2/3 的国家提供或计划提供 K-12 计算机科学教育，是 2019 年的两倍，其中非洲和拉丁美洲取得的进展最大。在美国，拥有计算机学士学位的毕业生人数在过去 10 年中增加了 22%。然而，在许多非洲国家，由于电力等基础设施的不足，获得计算机学位的机会仍然有限。在美国，81% 的 K-12 计算机科学教师表示，AI 应该成为计算机科学基础教育的一部分，但只有不到一半的教师认为自己有能力教授 AI。

10.工业界依然一路领先

2024 年，近 90% 的著名人工智能模型来自工业界，高于 2023 年的 60%，而学术界仍然是高引用率研究的首要来源。模型规模持续快速增长——训练计算每 5 个月翻一番，数据集每 8 个月翻一番，耗电量每年翻一番。然而，性能差距正在缩小：排名第一和第十的模型之间的得分差距在一年内从 11.9% 降至 5.4%，排名前两位的差距现在仅为 0.7%。前沿领域的竞争越来越激烈。

图｜AlphaFold 3 与用于蛋白质 - 配体对接的基线方法的性能对比

11.AI 因其对科学的影响而斩获最高荣誉

AI 的重要性与日俱增，这一点从重大科学奖项中就可见一斑：两项诺贝尔奖表彰了 AI 在深度学习（物理学）和蛋白质折叠（化学）中的应用，而图灵奖则表彰了 AI 在强化学习方面的开创性贡献。

图｜PlanBench 基准下正确的实例数量

12.复杂推理仍是一项挑战

人工智能模型在国际数学奥林匹克竞赛问题等任务中表现出色，但在 PlanBench 等复杂推理基准测试中仍然面临挑战。即使存在可证明正确的解决方案，它们也常常无法可靠地解决逻辑任务，这限制了它们在精度至关重要的高风险环境中的有效性。

附：来自 AI Index 联合主任 Yolanda Gil 和 Raymond Perrault 的一封信

随着人工智能不断重塑我们的生活、企业界和公共讨论，AI Index 将继续跟踪其进展--提供一个独立的、数据驱动的视角，跨越时间和地域，观察人工智能的发展、应用和影响。

对于人工智能来说，2024 年是多么美好的一年。诺贝尔物理学奖和化学奖，以及因强化学习方面的奠基性工作而获得的图灵奖，都体现了对人工智能在推动人类知识进步方面作用的认可。曾经困难重重的图灵测试已不再被视为一个难以挑战的目标，今天的尖端系统已经超越了它。与此同时，人工智能的应用正以前所未有的速度加速发展，数以百万计的人们正经常在专业工作和休闲活动中使用人工智能。随着高性能、低成本和开放模型的普及，人工智能的可及性和影响力必将进一步扩大。

在经历了短暂的放缓之后，企业对人工智能的投资出现反弹。新近获得融资的生成式人工智能初创企业数量增加了近两倍，在经过多年的低迷之后，企业采用人工智能的速度在 2024 年显著加快。人工智能已从边缘领域成为商业价值的核心驱动力。

政府也在加大参与力度。政策制定者们不再只是在讨论人工智能，而是在投资人工智能。一些国家启动了价值十亿美元的国家人工智能基础设施计划，包括扩大能源能力以支持人工智能发展的重大努力。全球协调不断加强，地方倡议也初具规模。

然而，信任仍是一大挑战。越来越少的人相信人工智能公司会保护他们的数据，对公平性和偏见的担忧依然存在。错误信息继续构成风险，尤其是在选举和深度伪造泛滥的情况下。对此，各国政府正在推进新的监管框架，旨在促进透明度、问责制和公平性。公众的态度也在转变。虽然怀疑的态度依然存在，但 2024 年的一项全球调查显示，人们对人工智能带来广泛社会效益的潜力的乐观态度明显上升。

人工智能不再只是一个关于可能性的故事，而是一个关于现在正在发生的事情，以及我们如何共同塑造人类未来的故事。

Yolanda Gil、Raymond Perrault

AI Index 联合主任

https://hai.stanford.edu/ai-index/2025-ai-index-report

整理：锦鲤

如需转载或投稿，请直接在公众号内留言

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.