网易首页 > 网易号 > 正文 申请入驻

斯坦福年度结论:中美大模型已没差距

0
分享至

一觉醒来,中美AI模型差距快没了??

仔细一看才知道,这竟然还是斯坦福HAI最新发布的《2026年AI指数报告》给出的结论。

中美AI模型性能差距已基本消除(effectively closed)。

(粉色代表中国,蓝色代表美国,模型差距逐渐缩小)



除了谈中美,报告还一口气给出了14个重要观察或结论,它们共同回答了一个问题:

过去一年,AI又把我们带到了怎样的世界?

如果你也想知道答案,不妨一起往下看。

(天啦撸,报告原文有423页,所以咱们直接挑重点gogogo)

报告得出的15个主要结论

“Scaling Law见顶”争议下,AI发展不停

首先,报告从整体上给出了一个趋势判断:

AI能力并未停滞不前,它正在加速发展,并触达比以往更多的人



这体现在AI对困难任务的解决上:

2025年,业界生产了超过90%的知名前沿模型,其中多个模型在博士级科学问题、多模态推理和竞赛数学方面现已达到或超越人类基线。

而且在SWE-bench Verified这个关键的编码基准测试上,模型性能在一年内从60%提升至接近100%。

与此同时,AI也在迅速普及开来:

企业端的采用率已经达到88%,而在大学生群体中,五分之四的人已经在使用生成式人工智能。

中美AI模型性能差距已基本消除

至于中美,则从2025年初以来呈现“你方唱罢我登台”的局面。



2025年2月,DeepSeek-R1横空出世,短暂追平美国顶尖模型。

截至2026年3月,Anthropic的顶尖模型虽仍保持领先,但优势已收窄至仅2.7%

在产出层面,美国依然拥有更多顶级AI模型和更高影响力的专利,而中国则在论文发表量、引用量、专利总数及工业机器人安装量上占据优势。

此外,韩国凭借其创新密度脱颖而出,人均AI专利数量位居全球第一。

AI数据中心美国最多,台积电赢麻了

关于巨头们都在押注的AI数据中心,目前美国拥有绝对数量优势——

有5427个数据中心,数量是其他任何国家的10倍以上(不过能源消耗也超过其他任何国家)。

而且在芯片制造方面,台积电简直赢麻了:

几乎每一款领先的AI芯片都由台积电一家公司制造,这使得全球AI智能硬件供应链依赖于中国台湾省的一家代工厂——尽管台积电在美国的扩建项目已于2025年投入运营。

AI能拿奥数金牌,但还是看不懂时间

过去一年,AI能力依旧参差不齐。

国际前沿模型Gemini Deep Think可以在IMO中拿下金牌,但当前顶尖模型在读取指针式时钟时,准确率却只有50.1%。

与此同时,AI Agent的能力也在快速进化:

在OSWorld这一覆盖多操作系统真实任务的测试中,任务成功率从12%跃升至约66%。

不过即便如此,在结构化基准测试中,它们仍然大约有三分之一的任务会失败。



AI安全基准滞后,安全事故频发

如今,几乎所有头部前沿模型开发者,都会主动披露模型在能力基准测试上的成绩。

但在“负责任的AI”这件事上,信息依然零散且不完整,缺乏系统性的披露。

与此同时,风险信号也在变多——

被记录在案的AI事件数量,从2024年的233起,上升到了362起。

更棘手的是,最新研究还发现:

在负责任的AI中,不同目标之间可能存在“此消彼长”,比如提升安全性,往往会以牺牲准确性为代价。



美国在AI投资方面领先,但对全球人才的吸引力正在下降

2025年,美国在AI上的私人投资达到2859亿美元,规模是中国124亿美元的23倍以上。

不过报告提醒,单看私人投资大概率会低估中国的整体投入——

因为中国还有大量来自政府引导基金的支持。



在创业活跃度上,美国领先中国:

一年内获得新融资的AI公司达到1953家,数量是第二名国家的10倍以上。

但另一边,美国这边也出现了一个不太乐观的趋势——

流向美国的AI研究人员和开发者,正在明显减少。

自2017年以来,这一数字已经下降了89%;仅过去一年,就又减少了80%。

AI普及率正在历史性加速

AI普及率正在历史性加速。

仅用三年时间,生成式AI就触达了53%的人口,普及速度明显快于PC和互联网

不过,这一进程在不同国家之间差异明显,并且与人均GDP高度相关。

其中,新加坡的普及率达到61%,阿拉伯联合酋长国为54%;相比之下,美国仅为28.3%,排名第24位。



此外,从价值角度看,体感也在迅速放大——

到2026年初,生成式AI工具为美国消费者创造的年价值,已经达到1720亿美元。

而从2025年到2026年,单个用户的中位价值直接翻了三倍。

换句话说,哪怕很多工具本身是免费的,但普通消费者正在从中拿到真金白银的价值。

当前正规教育跟不上AI发展的速度

虽然AI发展很快,但正规教育体系,当前明显有点跟不上了。

学生这边已经全面上手:

在美国,超过80%的高中生和大学生,已经在用AI完成学习相关任务。

但另一边,学校体系却还没准备好——

美国只有一半的中小学制定了AI相关政策,而在教师群体中,只有6%的人认为这些政策是清晰的。



在全球范围内,AI工程技能增长最快的国家,反而是阿拉伯联合酋长国、智利和南非。

与此同时,人才供给也在变化:

从2022年到2024年,美国和加拿大新增的AI博士数量增长了22%,但这些新增博士,更多流向了学术界,而不是工业界。

开源正在成为全球AI竞争新变量

如今,越来越多国家开始加码布局AI。

为了把AI能力尽量掌握在本土体系内,发展中经济体持续扩展国家级AI战略,同时政府主导的AI超级计算投资也在同步增长。

但现实是,核心能力依然高度集中:

无论是模型研发还是前沿突破,仍主要掌握在美国和中国手中。



不过,一个新的变量正在出现——开源

随着开源生态的发展,参与者的版图开始被重新分配。

在GitHub上,来自“其他地区”的贡献量,已经超过欧洲,并逐渐逼近美国。

更重要的是,这种变化正在带来连锁反应:

更多语言、更丰富场景的模型与评测体系,开始出现。

关于AI的未来,专家和普通人的看法正在明显“分叉”

在“AI会如何影响工作”这个问题上,73%的专家认为是正面的,但公众中只有23%这么看,两者之间拉开了整整50个百分点的差距。

类似的分歧,也出现在对经济、医疗等关键领域的判断上。

信任层面,不同国家之间,对政府监管AI的信任度差异明显。

在受调查国家中,美国的信任度最低,只有31%。

而从全球范围来看,欧盟在“能否有效监管AI”这件事上,整体信任度要高于美国和中国。



除了上面这10个,斯坦福官网未列但报告里提到的其他5个结论分别是:

1、即使在受控环境中表现出色,机器人仍无法完成大多数家务任务(仅12%)。

2、AI先替代的是“入门级执行”,而不是“有经验的判断”。从2024年开始,美国22~25岁的年轻开发者岗位,直接少了近20%;但与此同时,年长开发者反而在增加。

3、AI能力在变强,但环境代价也在同步放大。仅GPT-4o推理的年用水量,就可能超过1200万人的饮用水需求

4、AI在科学领域,已经开始超越人类,但模型越大,并不总是越强。

5、AI正在快速进入临床一线,但仍缺乏有效性。一项覆盖500多项研究的综述显示,接近一半的研究,依赖的是示例性问题,而不是真实患者数据;真正基于真实临床数据开展的研究,占比只有5%。

(具体指路第9页)



斯坦福HAI出品、谷歌OpenAI提供支持

最后简单说一下,《斯坦福AI指数报告》到底是什么来头。

除了出品方斯坦福HAI,其支持者阵容可谓相当豪华:

不仅有谷歌、OpenAI这样的头部模型玩家,而且还有麦肯锡、GitHub、领英等强大数据提供方。



对了,“以人为本”人工智能实验室(HAI)还是李飞飞发起并联合创立的,之前她通常以“代言人”的身份宣传介绍这份报告,不过今年推特暂无动静。

翻了下报告指导委员会名单,里面也没有她的身影(而且也没有华人)。

(难道这和她投身创业有关?)



而从2017年开始,这些顶尖研究人员和机构就聚在一起专门做一件事:

用数据,把AI每年怎么发展这件事讲清楚

多年下来,该报告已经成为业界重要参考(今年已经是第9份了)。

相比之前,报告今年还明显增加了一个信号:AI已经不只是技术问题,而是开始全面进入深水区

一方面,它持续追踪AI在推理能力、安全性、以及真实世界任务中的表现,但一个关键变化是——

这些指标本身,正在变得越来越不可靠。



另一方面,报告首次给出了生成式AI的经济价值新估算,并补充了对劳动力市场影响的最新证据——

AI不再只是“会不会取代人”的问题,而是已经开始重塑岗位结构。

更宏观的部分也在展开,比如提出了一个分析国家层面技术控制与竞争的新框架、首次单独设立AI科学/AI医学两大板块、与谷歌前CEO施密特的公司合写科学章节。

Anyway,如果你也关心AI的近况和未来——

这份报告或许就是目前信息密度最高、值得每年一追的那一个。

(好好好,我将深度学习之)



报告原文:
https://hai.stanford.edu/ai-index/2026-ai-index-report

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国“捡钱”时代将要来临:若手中只有10万,试下死啃这两条线

中国“捡钱”时代将要来临:若手中只有10万,试下死啃这两条线

混沌录
2026-04-03 17:28:23
再见了,NBA!最后一舞,河村勇98分超杨瀚森!

再见了,NBA!最后一舞,河村勇98分超杨瀚森!

体育新角度
2026-04-14 08:18:13
1982年血色使馆:中国外交官唐健生为了生存杀光了所有同事

1982年血色使馆:中国外交官唐健生为了生存杀光了所有同事

阿校谈史
2026-03-20 11:03:27
俄罗斯外长加急访华,比中东战争更重要的,是普京的中国之行?

俄罗斯外长加急访华,比中东战争更重要的,是普京的中国之行?

老范谈史
2026-04-14 18:18:13
蒋介石私生活有多混乱?贴身秘书晚年才敢说破,宋美龄的做法绝了

蒋介石私生活有多混乱?贴身秘书晚年才敢说破,宋美龄的做法绝了

芊芊子吟
2026-04-12 21:20:03
12项升级!特斯拉发布2026年春季软件更新

12项升级!特斯拉发布2026年春季软件更新

鞭牛士
2026-04-14 15:52:12
美军禁令失效,4艘中资油轮将离港,英国拒不参战,作出明智选择

美军禁令失效,4艘中资油轮将离港,英国拒不参战,作出明智选择

霁寒飘雪
2026-04-14 14:44:21
听在哈萨克斯坦生活的中国人说:吃饭撑死算工伤,女人聊的太上头

听在哈萨克斯坦生活的中国人说:吃饭撑死算工伤,女人聊的太上头

天下霸奇
2026-04-14 07:43:28
他发明一道菜在美国一年卖52163吨,年入203亿,却称绝不进入中国

他发明一道菜在美国一年卖52163吨,年入203亿,却称绝不进入中国

杰丝聊古今
2026-04-09 23:44:51
毛主席去南泥湾视察,王震请客吃烧鸡,饭后主席悄悄将鸡架塞兜里

毛主席去南泥湾视察,王震请客吃烧鸡,饭后主席悄悄将鸡架塞兜里

老范谈史
2026-04-14 16:37:10
国乒三条消息: 张继科复出、马龙坐镇成都、王曼昱跨界新身份

国乒三条消息: 张继科复出、马龙坐镇成都、王曼昱跨界新身份

罗纳尔说个球
2026-04-13 22:28:20
愤怒的李想和遭到围攻的理想汽车

愤怒的李想和遭到围攻的理想汽车

界面新闻
2026-04-13 10:01:09
日网疯传“日本买石油,用人民币结算”,网民反应太好玩

日网疯传“日本买石油,用人民币结算”,网民反应太好玩

这里是东京
2026-04-13 19:13:51
中产彻底清醒!钢琴销量暴跌72%:不是不爱音乐,是时代不装了…

中产彻底清醒!钢琴销量暴跌72%:不是不爱音乐,是时代不装了…

火山詩话
2026-04-09 13:45:45
马伊琍俩女儿现身爸爸饭馆,文章全程陪伴,爱马化妆遮不住脸上痘

马伊琍俩女儿现身爸爸饭馆,文章全程陪伴,爱马化妆遮不住脸上痘

柒佰娱
2026-04-13 17:04:34
不到24小时,以色列迎来6个噩耗,内塔尼亚胡或被关进大牢

不到24小时,以色列迎来6个噩耗,内塔尼亚胡或被关进大牢

浪子阿邴聊体育
2026-04-13 11:54:13
受权发布|中华人民共和国国务院令  第835号

受权发布|中华人民共和国国务院令  第835号

新华社
2026-04-13 17:03:04
苹果版套娃 买台Mac Pro回家:打开一看里面还藏着一台Mac Pro

苹果版套娃 买台Mac Pro回家:打开一看里面还藏着一台Mac Pro

快科技
2026-04-12 20:51:04
许光汉和周子瑜恋爱?网友:感觉2人八竿子打不着!

许光汉和周子瑜恋爱?网友:感觉2人八竿子打不着!

毒舌八卦
2026-04-14 11:49:55
突然公开这段水下画面,中国海军在释放什么信号?背后博弈不简单

突然公开这段水下画面,中国海军在释放什么信号?背后博弈不简单

刘振起观点
2026-04-14 10:55:55
2026-04-14 19:32:49
量子位 incentive-icons
量子位
追踪人工智能动态
12469文章数 176448关注度
往期回顾 全部

科技要闻

离职同事"炼化"成AI?这届公司不需要活人了

头条要闻

美伊谈到80%突然崩了:会场传争论声 内塔尼亚胡打电话

头条要闻

美伊谈到80%突然崩了:会场传争论声 内塔尼亚胡打电话

体育要闻

带出中超最大黑马!他让球迷们“排队道歉”

娱乐要闻

宋祖儿刘宇宁恋情大反转 正主火速辟谣

财经要闻

许家印受审当庭表示认罪悔罪

汽车要闻

售12.99万起/续航2000km 风云T9L上市

态度原创

家居
艺术
手机
健康
时尚

家居要闻

现代融合 自然灵动

艺术要闻

这位美女画家的夏天竟如此梦幻

手机要闻

苹果突放大招!为 iPhoneFold 加码 20% 面板库存,折叠屏 iPhone 稳了

干细胞抗衰4大误区,90%的人都中招

秦岚:风里荡秋千

无障碍浏览 进入关怀版