网易首页 > 网易号 > 正文 申请入驻

斯坦福报告显示:中美大模型质量差距缩小至0.3%

0
分享至

DoNews4月10日消息,斯坦福大学以人为本人工智能研究所发布的《2025年人工智能指数报告》显示,人工智能领域的竞争日益激烈:中国高性能AI模型的数量和质量不断提升,对美国的领先地位构成挑战,顶级模型之间的性能差距正在缩小。

美国此前在模型质量方面的领先优势已经消失。中国是人工智能出版物和专利产出最多的国家,如今其开发的模型在性能上已经与美国的竞争对手不相上下。2023年,在大规模多任务语言理解测试(MMLU)中,中国领先的模型落后于美国顶级模型近20个百分点。然而,到2024年底,美国的领先优势缩小到了0.3个百分点。

该报告强调,随着人工智能的快速持续发展,没有一家公司能够脱颖而出。在聊天机器人竞技场排行榜上,2024年初排名第一的模型比排名第十的模型得分高出约12%,但到2025年初,这一差距缩小到了5%。报告称:“前沿领域的竞争越来越激烈,也越来越拥挤。”

该指数显示,通过使用更多决策变量、更强的计算能力和更大的训练数据集,生成式人工智能模型平均而言仍在变得更“大”。但开发人员也在证明,更小、更精简的模型也能有出色的表现。由于算法的改进,如今的模型性能与两年前规模大100倍的模型性能齐平。该指数称:“2024年是小型人工智能模型的突破之年。”

纽约伊萨卡康奈尔大学的计算机科学家巴特・塞尔曼表示,很高兴看到像中国的DeepSeek这样相对小型、低成本的研究成果证明了自己的竞争力。他说:“我预计我们会看到一些由五人甚至两人组成的独立团队,他们会提出一些新的算法想法,从而改变现状。这很好。我们不希望世界只由一些大公司掌控。”

报告显示,如今绝大多数强大的人工智能模型是由工业界而非学术界开发的:这与21世纪初神经网络和生成式人工智能尚未兴起情况正好相反。报告称,2006年之前,工业界开发的著名人工智能模型不到20%,2023年这一比例为60%,2024年则接近90%。

美国仍然是强大模型的最大生产国,2024年发布了40个模型,中国发布了15个,欧洲发布了3个。但许多其他地区也在加入这场竞赛,包括中东、拉丁美洲和东南亚。

AI领域还出现了“开放权重”模型在数量和性能上的惊人增长,如DeepSeek和Meta的LLaMa。用户可以自由查看这些模型在训练过程中学习到的并用于预测的参数,不过其他细节,如训练代码,可能仍保密。最初,不公开这些因素的封闭系统明显更优越,但到2024年初,这些类别中顶级竞争者之间的性能差距缩小到了8%,到2025年初则缩小到了1.7%。

2022 年ChatGPT公开推出后,开发人员将大部分精力投入到通过扩大模型规模来提升系统性能上。该指数报告称,这一趋势仍在继续:训练一个典型的领先人工智能模型所消耗的能源目前每年翻一番;每个模型使用的计算资源每五个月翻一番;训练数据集的规模每八个月翻一番。

然而,各公司也在发布性能非常出色的小型模型。例如,2022年在MMLU上得分超过60%的最小模型使用了5400亿个参数;到2024年,一个模型仅用38亿个参数就达到了相同的分数。小型模型比大型模型训练速度更快、回答问题更迅速,且能耗更低。

该指数报告称,人工智能系统使用的硬件的平均能源效率每年提高约40%。由于这些进步,在MMLU上得分超过60%的成本大幅下降,从2022年11月的每百万个token约20美元降至 2024年10月的每百万个token约7美分。

尽管在几项常见的基准测试中取得了显著进步,但该指数强调,生成式人工智能仍然存在一些问题,如隐性偏见和“幻觉”倾向,即吐出虚假信息。塞尔曼说:“它们在很多方面给我留下了深刻印象,但在其他方面也让我感到恐惧。它们在犯一些非常基本的错误方面让我感到惊讶。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
老公转正公婆逼我离婚,我低调离开,一周后婆家无钱缴贷房被查封

老公转正公婆逼我离婚,我低调离开,一周后婆家无钱缴贷房被查封

麦子情感故事
2026-05-30 13:16:17
最成功的业界内容创作者之一Morgpie

最成功的业界内容创作者之一Morgpie

吃瓜党二号头目
2026-05-25 08:22:25
星舰又是“基本成功”,中国航天界这次真开始怀疑马斯克了

星舰又是“基本成功”,中国航天界这次真开始怀疑马斯克了

深层奥秘
2026-05-29 11:30:00
王玉雯29岁生日直播:16个月无戏可拍,撕开了内娱最残酷的遮羞布

王玉雯29岁生日直播:16个月无戏可拍,撕开了内娱最残酷的遮羞布

手工制作阿歼
2026-05-29 17:08:33
1990年,作家三毛到新疆和76岁的王洛宾同居,王洛宾说:“可以同居,不可以发生关系!

1990年,作家三毛到新疆和76岁的王洛宾同居,王洛宾说:“可以同居,不可以发生关系!

犀利辣椒
2026-05-20 06:23:07
曝卡里克希望曼联签托纳利,安德森是拉爵选择!一人加盟已没机会

曝卡里克希望曼联签托纳利,安德森是拉爵选择!一人加盟已没机会

罗米的曼联博客
2026-05-30 09:04:47
网红边牧被杀后续,警方上门,凶手咬死不犯法,全村逼狗主人认栽

网红边牧被杀后续,警方上门,凶手咬死不犯法,全村逼狗主人认栽

不写散文诗
2026-05-29 12:41:13
人类灭绝已成定局?科学家算出人类灭绝日期,我们还能幸存多久?

人类灭绝已成定局?科学家算出人类灭绝日期,我们还能幸存多久?

蜉蝣说
2026-05-28 19:49:46
法国与浙江都是6000多万人口,法国创造了3万多亿美元,浙江呢?

法国与浙江都是6000多万人口,法国创造了3万多亿美元,浙江呢?

商业财经风向
2026-05-28 09:52:51
学医后才明白,预防骨质疏松最好的习惯,不是晒太阳,而是3件事

学医后才明白,预防骨质疏松最好的习惯,不是晒太阳,而是3件事

垚垚分享健康
2026-05-04 19:15:04
童年时的金晨与父亲金延杰的合影,金延杰是国家一级古典舞演员

童年时的金晨与父亲金延杰的合影,金延杰是国家一级古典舞演员

娱你同欢
2026-05-29 21:20:30
解放军还是手软了,荷兰军舰闯西沙时的一个动作,本该被当场击沉

解放军还是手软了,荷兰军舰闯西沙时的一个动作,本该被当场击沉

阿龙聊军事
2026-05-28 10:14:28
0点欧冠决赛打响!阿森纳最强阵冲首冠+3大神迹,巴黎56%概率卫冕

0点欧冠决赛打响!阿森纳最强阵冲首冠+3大神迹,巴黎56%概率卫冕

我爱英超
2026-05-30 07:14:28
爆锅了!一女子直言再穷,也绝不会去夜店做公主,炸出1.2万评论

爆锅了!一女子直言再穷,也绝不会去夜店做公主,炸出1.2万评论

火山詩话
2026-05-24 06:41:17
张军林任西安市委常委、组织部部长

张军林任西安市委常委、组织部部长

汲古知新
2026-05-30 00:07:14
西方垄断七十年,全球最缺水的地方,为何突然向中国全面开放?

西方垄断七十年,全球最缺水的地方,为何突然向中国全面开放?

潘冹旅行浪子
2026-05-30 14:32:03
麻省理工出品,AI时代人人必修的最佳公开课!从传感器到大模型,手把手教你调试AI的“艺术”

麻省理工出品,AI时代人人必修的最佳公开课!从传感器到大模型,手把手教你调试AI的“艺术”

麻省理工AI公开课
2026-05-30 15:26:29
要求单独会晤被拒,日本高官在APEC会议发泄不满,拦住王文涛部长

要求单独会晤被拒,日本高官在APEC会议发泄不满,拦住王文涛部长

田柳
2026-05-29 09:00:11
划清界限?李显龙访华后公开表态:新加坡和中国不是“共同族群”

划清界限?李显龙访华后公开表态:新加坡和中国不是“共同族群”

悄悄史话
2026-05-30 11:17:34
中国女排头号球星是谁?国际排联的两张海报给出答案,不是李盈莹

中国女排头号球星是谁?国际排联的两张海报给出答案,不是李盈莹

老高说体育
2026-05-30 12:06:36
2026-05-30 16:23:00
DoNews incentive-icons
DoNews
不局限于对互联网行业的追踪与探索,更要向未来、向未知的方向迈进。
107429文章数 26867关注度
往期回顾 全部

科技要闻

车圈大佬发声:价格战远去,但竞争仍残酷

头条要闻

香港著名演员刘洵离世 《倩女幽魂》中曾饰演普渡慈航

头条要闻

香港著名演员刘洵离世 《倩女幽魂》中曾饰演普渡慈航

体育要闻

岁月不饶人!39岁德约鏖战近5小时拼到呕吐

娱乐要闻

向太曝黄晓明曾当众给她下跪

财经要闻

双汇管不住一头猪

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

本地
时尚
艺术
旅游
公开课

本地新闻

用剪纸的方式,打开江苏扬州

2026夏天最新5款发型合集,每一款都超心动!

艺术要闻

王文生 2026风景写生新作

旅游要闻

Design Hotels™再添新成员,万豪中餐厅与广州酒家同创菜单 | 一周旅行指南

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版