网易首页 > 网易号 > 正文 申请入驻

刚刚,李飞飞团队发布《2025年人工智能指数报告》:12大趋势证明,AI不再只是关于可能性的故事

0
分享至

刚刚,由李飞飞联合领导的斯坦福大学以人为本人工智能研究所(Stanford HAI)发布了《2025 年人工智能指数报告》(Artificial Intelligence Index Report 2025)。

这份长达 456 多页的报告是 Stanford HAI 发布的第 8 份 AI Index 研究,追踪了 2024 年全球人工智能(AI)行业的发展趋势。

今年的报告新增了对 AI 硬件发展状况的深入分析、对推理成本的新估算,以及对 AI 出版和专利申请趋势的分析。他们还引入了有关企业采用负责任的 AI 实践的最新数据,并扩大了对 AI 在科学和医学中日益重要作用的报道。

完整报告:

https://hai-production.s3.amazonaws.com/files/hai_ai_index_report_2025.pdf

Stanford HAI 在官方网站上写道,“AI 对社会的影响从未如此明显......2025 年指数是我们迄今为止最全面、也是在这一重要时刻发布的报告。”

他们还认为,“AI 将是 21 世纪最具变革性的技术。然而,除非我们精心引导 AI 行业的发展,否则这项技术将难以惠及普罗大众。”

这份新报告揭示了 2024 年 AI 行业的 12 大趋势:

1.AI 在苛刻基准上的表现持续提升

2023 年,研究人员引入了新的基准——MMMU、GPQA 和 SWE-bench,以测试高级 AI 系统的极限。仅仅一年后,性能大幅提升:在 MMMU、GPQA 和 SWE-bench 上的得分分别提高了 18.8、48.9 和 67.3 个百分点。在基准测试之外,AI 系统在生成高质量视频方面也取得了重大进展,在某些场景下,语言模型智能体(language model agents)甚至在有限时间预算的编程任务中超越了人类。

图|选择的 Al 指数技术性能基准 vs. 人类表现

2.AI 正越来越多地融入到日常生活中

从医疗保健到交通运输,AI 正迅速从实验室走向日常生活。2023 年,FDA 批准了 223 种 AI 医疗设备,而 2015 年仅为 6 种。在道路上,自动驾驶汽车不再是实验性的:美国最大的运营商之一 Waymo 每周提供超过 15 万次自动驾驶出行,而百度的经济型“萝卜快跑” (Apollo Go)自动驾驶出租车车队现在已在中国多个城市提供服务。

图|FDA 批准的 AI 医疗设备数量(1955-2023)

3.企业全力投入 AI,推动投资和使用创历史新高

2024 年,美国私营部门对 AI 的投资增长到 1091 亿美元——几乎是中国(9.3 亿美元)的 12 倍,是英国(4.5 亿美元)24 倍。生成式 AI 尤其强劲,全球吸引私营投资 339 亿美元——比 2023 年增长 18.7%。AI 的商业应用也在加速:2024 年,78% 的组织报告称在使用 AI,比前一年增长 55%。同时,越来越多的研究证实,AI 提高了生产力,在大多数情况下,有助于缩小劳动力中的技能差距。

图|2017-2024 年,表示其所在组织至少在一项职能中使用 AI 的受访者比例

4.在创造顶级 AI 模型方面,中国正在缩小与美国的差距

2024 年,美国机构推出了 40 个引人注目的 AI 模型,显著超过中国的 15 个和欧洲的 3 个。虽然美国在数量上保持领先,但中国模型在质量上迅速缩小了差距:在 MMLU 和 HumanEval 等主要基准上的性能差异从 2023 年的两位数缩小到 2024 年的接近相等。同时,中国在 AI 出版物和专利方面继续领先。与此同时,模型开发越来越全球化,中东、拉丁美洲和东南亚等地区也推出了引人注目的新模型。

图|美国顶尖模型与中国顶尖模型在 LMSYS 聊天机器人竞技场中的表现

5.负责任的 AI 生态系统不断发展,但不均衡

人工智能相关事件急剧上升,但在主要工业模型开发者中,标准化的 RAI 评估仍然很少。然而,新的基准如 HELM Safety、AIR-Bench 和 FACTS 为评估事实性和安全性提供了有希望的工具。在公司中,识别 RAI 风险和采取有意义的行动之间存在差距。相比之下,政府表现出更大的紧迫性:2024 年,全球在人工智能治理方面的合作加强,包括经合组织、欧盟、联合国和非盟在内的组织发布了关注透明度、可信度和其他核心负责任人工智能原则的框架。

图|已公布的针对热门基础模型的安全性和负责任 AI 基准

6. 全球 AI 乐观情绪上升,但地区间深层次分歧依然存在

在中国(83%)、印度尼西亚(80%)和泰国(77%)等国家的大多数人认为,人工智能产品和服务是利大于弊的。相比之下,加拿大(40%)、美国(39%)和荷兰(36%)等地的乐观情绪仍然远低于其他国家。然而,情绪正在转变:自 2022 年以来,包括德国(+10%)、法国(+10%)、加拿大(+8%)、英国(+8%)和美国(+4%)在内的几个先前持怀疑态度的国家,乐观情绪显著增长。

图 | 2022-2024 年,按国家划分认为“使用 AI 的产品和服务利大于弊”的比例

7.AI 变得更加高效、经济实惠和易于获取

由越来越强大的小型模型驱动,在达到 GPT-3.5 水平上的系统推理成本在 2022 年 11 月到 2024 年 10 月间下降了 280 倍。在硬件层面,成本每年下降 30%,而能效每年提高 40%。开放权重模型也在缩小与封闭模型的差距,在某些基准测试中,一年内性能差异从 8%减少到仅 1.7%。这些趋势共同迅速降低了高级人工智能的门槛。

图 | 2022-2024 年,在 MMLU 中得分超过 60% 的最小规模 AI 模型

8.各国政府正在加强对 AI 的监管和投资

2024 年,美国联邦机构出台了 59 项与 AI 相关的法规,是 2023 年的两倍多,发布法规的机构数量也是 2023 年的两倍。在全球范围内,自 2023 年以来,75 个国家的 AI 立法提及率上升了 21.3%,自 2016 年以来增长了 9 倍。在日益受到关注的同时,各国政府也在进行大规模投资:加拿大承诺投资 24 亿美元,中国启动了 475 亿美元的半导体基金,法国承诺投资 1090 亿欧元,印度承诺投资 12.5 亿美元,沙特阿拉伯则发起了一项 1000 亿美元的倡议。

图 | 部分供应商的顶尖模型在 LSYS 聊天机器人竞技场中的表现


9.AI 和计算机科学教育正在扩大,但普及程度仍不够

如今,已有 2/3 的国家提供或计划提供 K-12 计算机科学教育,是 2019 年的两倍,其中非洲和拉丁美洲取得的进展最大。在美国,拥有计算机学士学位的毕业生人数在过去 10 年中增加了 22%。然而,在许多非洲国家,由于电力等基础设施的不足,获得计算机学位的机会仍然有限。在美国,81% 的 K-12 计算机科学教师表示,AI 应该成为计算机科学基础教育的一部分,但只有不到一半的教师认为自己有能力教授 AI。

10.工业界依然一路领先

2024 年,近 90% 的著名人工智能模型来自工业界,高于 2023 年的 60%,而学术界仍然是高引用率研究的首要来源。模型规模持续快速增长——训练计算每 5 个月翻一番,数据集每 8 个月翻一番,耗电量每年翻一番。然而,性能差距正在缩小:排名第一和第十的模型之间的得分差距在一年内从 11.9% 降至 5.4%,排名前两位的差距现在仅为 0.7%。前沿领域的竞争越来越激烈。

图|AlphaFold 3 与用于蛋白质 - 配体对接的基线方法的性能对比


11.AI 因其对科学的影响而斩获最高荣誉

AI 的重要性与日俱增,这一点从重大科学奖项中就可见一斑:两项诺贝尔奖表彰了 AI 在深度学习(物理学)和蛋白质折叠(化学)中的应用,而图灵奖则表彰了 AI 在强化学习方面的开创性贡献。

图|PlanBench 基准下正确的实例数量


12.复杂推理仍是一项挑战

人工智能模型在国际数学奥林匹克竞赛问题等任务中表现出色,但在 PlanBench 等复杂推理基准测试中仍然面临挑战。即使存在可证明正确的解决方案,它们也常常无法可靠地解决逻辑任务,这限制了它们在精度至关重要的高风险环境中的有效性。

附:来自 AI Index 联合主任 Yolanda Gil 和 Raymond Perrault 的一封信


随着人工智能不断重塑我们的生活、企业界和公共讨论,AI Index 将继续跟踪其进展--提供一个独立的、数据驱动的视角,跨越时间和地域,观察人工智能的发展、应用和影响。


对于人工智能来说,2024 年是多么美好的一年。诺贝尔物理学奖和化学奖,以及因强化学习方面的奠基性工作而获得的图灵奖,都体现了对人工智能在推动人类知识进步方面作用的认可。曾经困难重重的图灵测试已不再被视为一个难以挑战的目标,今天的尖端系统已经超越了它。与此同时,人工智能的应用正以前所未有的速度加速发展,数以百万计的人们正经常在专业工作和休闲活动中使用人工智能。随着高性能、低成本和开放模型的普及,人工智能的可及性和影响力必将进一步扩大。


在经历了短暂的放缓之后,企业对人工智能的投资出现反弹。新近获得融资的生成式人工智能初创企业数量增加了近两倍,在经过多年的低迷之后,企业采用人工智能的速度在 2024 年显著加快。人工智能已从边缘领域成为商业价值的核心驱动力。


政府也在加大参与力度。政策制定者们不再只是在讨论人工智能,而是在投资人工智能。一些国家启动了价值十亿美元的国家人工智能基础设施计划,包括扩大能源能力以支持人工智能发展的重大努力。全球协调不断加强,地方倡议也初具规模。


然而,信任仍是一大挑战。越来越少的人相信人工智能公司会保护他们的数据,对公平性和偏见的担忧依然存在。错误信息继续构成风险,尤其是在选举和深度伪造泛滥的情况下。对此,各国政府正在推进新的监管框架,旨在促进透明度、问责制和公平性。公众的态度也在转变。虽然怀疑的态度依然存在,但 2024 年的一项全球调查显示,人们对人工智能带来广泛社会效益的潜力的乐观态度明显上升。


人工智能不再只是一个关于可能性的故事,而是一个关于现在正在发生的事情,以及我们如何共同塑造人类未来的故事。


Yolanda Gil、Raymond Perrault

AI Index 联合主任

https://hai.stanford.edu/ai-index/2025-ai-index-report

整理:锦鲤

如需转载或投稿,请直接在公众号内留言

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
泰国打的不是柬埔寨,是脸

泰国打的不是柬埔寨,是脸

求实处
2025-12-16 23:00:43
馆藏明代仇英《江南春》为何现身拍卖市场?南京博物院回应

馆藏明代仇英《江南春》为何现身拍卖市场?南京博物院回应

界面新闻
2025-12-17 21:05:14
上海空气里飘着“焦味”?最新回应来了

上海空气里飘着“焦味”?最新回应来了

看看新闻Knews
2025-12-17 18:28:05
俄乌迎来大结局?泽连斯基终于怕了,普京被甩锅,最大输家浮现

俄乌迎来大结局?泽连斯基终于怕了,普京被甩锅,最大输家浮现

军机Talk
2025-12-17 14:19:47
泰国定义柬埔寨园区为“犯罪团伙”,国人却称他们为“电诈人员”

泰国定义柬埔寨园区为“犯罪团伙”,国人却称他们为“电诈人员”

清书先生
2025-12-17 17:32:36
苹果官宣:部分老款 iPhone 存在严重技术故障

苹果官宣:部分老款 iPhone 存在严重技术故障

简科技
2025-12-17 19:00:17
警方通报“警务人员开警车接送孩子”:涉事人员已被停止执行职务

警方通报“警务人员开警车接送孩子”:涉事人员已被停止执行职务

界面新闻
2025-12-17 18:38:12
奥迪:我们只能造出热效率38%的发动机,你们是怎么做到45%的?

奥迪:我们只能造出热效率38%的发动机,你们是怎么做到45%的?

少数派报告Report
2025-12-17 07:32:02
王毅同委内瑞拉外长希尔通电话

王毅同委内瑞拉外长希尔通电话

界面新闻
2025-12-17 22:35:55
海南封关动了谁的奶酪?答案显而易见:新加坡为代表的传统中转港

海南封关动了谁的奶酪?答案显而易见:新加坡为代表的传统中转港

知法而形
2025-12-17 09:45:58
炸裂!网传老太太睡大女婿生了娃,偷换小女儿的儿子,致外孙丢失

炸裂!网传老太太睡大女婿生了娃,偷换小女儿的儿子,致外孙丢失

社会酱
2025-12-17 17:12:37
男子参加婚宴饮酒后死亡,家属起诉新郎新娘及酒店索赔238万元 二审改判:本人自担全责

男子参加婚宴饮酒后死亡,家属起诉新郎新娘及酒店索赔238万元 二审改判:本人自担全责

红星新闻
2025-12-17 19:08:06
南京博物院馆藏明代《江南春》现身拍卖市场,捐赠者后人起诉博物馆:为何多幅名画“消失”

南京博物院馆藏明代《江南春》现身拍卖市场,捐赠者后人起诉博物馆:为何多幅名画“消失”

澎湃新闻
2025-12-17 08:16:28
《阿凡达3》预售票房断崖式下跌,网友:这票价他们也是真敢开口

《阿凡达3》预售票房断崖式下跌,网友:这票价他们也是真敢开口

星宿影视鸭
2025-12-17 14:53:49
全网疯传的江门大瓜,年度最复杂的家庭伦理关系

全网疯传的江门大瓜,年度最复杂的家庭伦理关系

杭城村叔
2025-12-17 21:01:23
泰军炸掉诈骗园区、器官移植中心,洪森为何气急败坏?

泰军炸掉诈骗园区、器官移植中心,洪森为何气急败坏?

胡严乱语
2025-12-16 20:33:51
“汪苏泷隐婚生子”冲上热搜,回应来了

“汪苏泷隐婚生子”冲上热搜,回应来了

大风新闻
2025-12-17 15:50:05
日本议员曝光,高市早苗抛开事先准备的材料,强行输出涉台谬论

日本议员曝光,高市早苗抛开事先准备的材料,强行输出涉台谬论

合赞历史
2025-12-17 14:51:13
住建部部长倪虹最新署名文章:推动房地产高质量发展

住建部部长倪虹最新署名文章:推动房地产高质量发展

新京报政事儿
2025-12-16 09:22:26
佳能63万“恶意赔偿”,咋这么明目张胆?

佳能63万“恶意赔偿”,咋这么明目张胆?

胡严乱语
2025-12-16 20:29:21
2025-12-18 01:40:49
学术头条
学术头条
致力于学术传播和科学普及,重点关注AI4Science、大模型等前沿科学进展。
1426文章数 5081关注度
往期回顾 全部

科技要闻

特斯拉值1.6万亿靠画饼 Waymo值千亿靠跑单

头条要闻

坠亡女教师有已婚哥哥和未婚弟弟 父母被指不愿退彩礼

头条要闻

坠亡女教师有已婚哥哥和未婚弟弟 父母被指不愿退彩礼

体育要闻

短短一年,从争冠到0胜垫底...

娱乐要闻

狗仔曝热播剧姐弟恋真谈了???

财经要闻

重磅信号!收入分配制度或迎重大突破

汽车要闻

一车多动力+双姿态 长城欧拉5上市 限时9.18万元起

态度原创

数码
房产
亲子
手机
公开课

数码要闻

RGB-Mini LED迎来“跨年夜”,“光色同控”从电视走向桌面

房产要闻

封关前夕!豪庭铭苑超前交付,敬呈海口生活新范本

亲子要闻

撒泼打滚的娃妈妈只有一早就制服了

手机要闻

真我16 Pro系列外观曝光,还有10000mAh±电池机型

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版