公众号记得加星标⭐️,第一时间看推送不会错过。
领先的人工智能模型能力持续加速提升,包括OpenAI和Anthropic在内的几家大型人工智能公司正朝着今年晚些时候的IPO迈进。然而,人们对人工智能的抵触情绪依然暗流涌动,在某些情况下甚至已经爆发,尤其是在美国,一些地方政府开始对新建数据中心实施限制甚至彻底禁止。
要掌握如此多的信息并非易事,但斯坦福大学以人为本人工智能中心发布的2026年版人工智能指数报告却做到了。这份超过400页的报告包含了数十个数据点和图表,从基准评分、投资和公众认知等多个角度探讨了人工智能这一主题。与往年一样(参见我们2021年、2022年、2023年、2024年和2025年的报道),我们阅读了这份报告,并总结出了概括2026年人工智能发展趋势的关键要素。
美国公司在人工智能模型领域处于领先地位
![]()
过去十年,美国在人工智能模型发布方面一直处于领先地位,2025年依然如此。据研究机构Epoch AI的数据显示,总部位于美国的机构在2025年发布了50个“值得关注”的模型。然而,中国的模型产量正在迅速缩小差距。
几乎所有知名模型都源自工业界(而非学术界或政府机构)。EpochAI 追踪到,2025 年将有 87 个知名模型来自工业界,而其他所有来源仅有 7 个。这是一个重要的长期趋势。目前,工业界发布的模型占知名模型总数的 90% 以上,而 2015 年这一比例略低于 50%,2003 年则为零。
中国在机器人领域处于领先地位
![]()
尽管美国公司发布了数量最多的知名人工智能模型,但中国在机器人部署方面也拥有同样明显的领先优势。根据国际机器人联合会的数据,到2024年,中国将安装29.5万台工业机器人。日本将安装约4.45万台,美国将安装3.42万台。
自2022年以来,全球人工智能计算能力每年增长3.3倍
![]()
最新的斯坦福人工智能指数报告列举了许多引人注目的人工智能发展数据,但没有一项数据能比得上 EpochAI 对人工智能总计算能力的衡量。
该图以英伟达 H100e 的计算能力为标尺,显示自 2022 年以来,全球 AI 计算能力每年增长超过三倍。自 2021 年(有记录的第一年)以来,AI 计算总量增长了 30 倍。
英伟达是此次架构升级的最大受益者,其GPU目前占据全球AI计算能力的60%以上。亚马逊和谷歌——它们各自为AI工作负载设计硬件——分列第二和第三。
训练人工智能模型会产生巨大的碳排放
![]()
斯坦福大学人工智能指数在前几年就曾指出人工智能训练产生的碳排放问题,而且这个问题仍在朝着令人担忧的方向发展。
该报告估计,训练最新的大型语言模型(例如 xAI 的 Grok 4)会产生超过 72,000 吨的碳当量排放。这比往年的估计值大幅增加。OpenAI 的GPT-4估计产生 5,184 吨碳排放,Meta 的Llama 3.1 405B 估计产生 8,930 吨碳排放。
AI Index指导委员会联合主任雷·佩罗表示,这些数据只是估算值。“这些估算值应谨慎解读。就Grok而言,它们很大程度上依赖于从公开报道(例如《福布斯》文章)、xAI声明和其他无法核实的来源推断出的数据,这引入了一定程度的不确定性。”佩罗说道。另一方面,佩罗指出,“Epoch AI独立估算Grok 4的排放量要高得多,约为14万吨二氧化碳。”
人工智能推理产生的排放量也在持续增加,但不同模型的排放量差异很大。报告估计,推理效率最低的模型的碳排放量是推理效率最高模型的十倍以上。据估计, DeepSeek的 V3 模型在响应“中等长度”的提示时会消耗约 23 瓦的功率,而 Claude 4 Opus 的功率估计约为 5 瓦。
LLM正在迅速超越新的基准
![]()
过去十年,人工智能模型的性能以惊人的速度提升,而且正如上图所示,这种进步似乎还在加速。特别是多模态线性模型,其性能几乎在被发明出来的同时就达到了各项基准测试的标准。
智能体人工智能取得了最为显著的进步。图表右侧的两条陡峭曲线分别代表OSWorld 基准测试(用于衡量计算机的自主使用能力)和SWE-Bench Verified 软件工程基准测试(用于衡量自主编码能力)。
模型在“人类最后的考试”(Humanity's Last Exam)上的表现也在迅速提升。这项基准测试包含由各领域专家贡献的题目,旨在代表他们各自领域中最棘手的问题。2025 年斯坦福人工智能指数报告显示,排名第一的模型 OpenAI 的 o1 仅正确回答了 8.8% 的问题。此后,准确率已提升至 38.3%——但即便如此,这个数字也略显过时,因为截至 2026 年 4 月,得分最高的模型(例如 Anthropic 的 Claude Opus 4.6 和 Google 的 Gemini 3.1 Pro)的准确率均已超过 50%。
不过,佩罗提醒说,基准测试结果未必总能反映在实际应用中。“我们通常缺乏衡量系统(或代理)在特定环境下运行效果的指标,”佩罗说,“知道某个法律推理基准测试的准确率达到75%,并不能告诉我们它在实际法律实践中有多大的适用性。”
人工智能在医学领域的研究取得进展
![]()
人工智能基准测试的进步似乎也体现在医学领域,人工智能在医学领域的应用正以惊人的速度增长。医学研究领域的应用尤其迅速。正如上图所示,过去两年中,关于人工智能在药物研发领域应用的论文数量增加了一倍多。而关于多模态生物医学人工智能(用于分析医学图像和文本)的论文数量,则是两年前的2.7倍。
LLM在读取模拟时钟方面仍然存在问题
![]()
尽管人工智能模型在某些领域取得了快速进步,但在一些常见任务上,例如读取时钟和理解日历,它们的表现仍然非常糟糕。ClockBench是一款用于衡量多模态逻辑学习模型 (LLM) 读取模拟时钟能力的工具,它发现即使是这项任务中表现最佳的模型——OpenAI 的 GPT-5.4——也只有 50% 的概率能正确读取时钟。
大多数模型的得分都远低于此。Anthropic 的 Claude Opus 4.6 读取时间的准确率仅为 8.9%。这令人惊讶,因为该模型在其他基准测试中通常表现出色。(如前所述,Claude Opus 4.6 在“人类最后的考试”中取得了顶尖成绩。)
当然,在现实生活中,语言学习模型很少会被要求执行这项任务,但佩罗表示,这代表了一个更普遍的问题。“有研究表明,当系统被问及语言与其他模态(例如图像或音频,如语调)的组合时,语言成分承担了令人惊讶的很大一部分工作,甚至完全忽略了非语言信息。”
人工智能投资将在2025年达到新高峰
![]()
人工智能模型性能的提升与对人工智能公司的投资齐头并进。据人工智能分析公司Quid的数据显示,2025 年人工智能投资额创下新纪录,超过 5810 亿美元。
这比 2024 年的 2530 亿美元支出翻了一番还多,并迅速超过了 2021 年创下的 3600 亿美元的纪录。与 2021 年以并购为主导的投资不同,2025 年创纪录的投资结果是由对人工智能公司的私人投资所主导的。
大部分资金都流向了美国,去年美国在人工智能领域的投资超过 3440 亿美元。
软件工程师们正全力投入人工智能领域
![]()
然而,人工智能的普及不仅仅取决于私人资金。在GitHub上,人工智能也展现出蓬勃的草根热情,到2025年,与人工智能相关的项目数量已飙升至558万个。这比2020年增长了近五倍,比2024年增长了23.7%。
这个数字似乎也并未反映出人工智能项目数量的激增。获得至少 10 颗星的项目数量增长速度与人工智能项目整体获得的星数增长速度相近。这表明这些项目确实得到了用户的积极参与。考虑到某些项目的受欢迎程度,这或许并不令人意外。例如,开源智能体人工智能软件 OpenClaw就获得了 35.2 万颗星。
批评人士可能会担心,这种热情部分是由人工智能机器人或智能体项目推动的。佩罗承认了这一点,并表示“GitHub 的使用强度可能与人工智能的使用强度高度相关”。然而,至少根据一个名为Agents in the Wild 的活动追踪网站(斯坦福大学的报告中并未提及该网站)的数据,GitHub 的大部分活动似乎仍然是由人类完成的。
计算机科学领域也同样充满热情。过去十年间,人工智能相关的计算机科学出版物数量翻了一番多,从10.2万篇增至25.8万篇。其中超过68%的出版物仍然来自学术界,而政府和产业界的贡献分别约为11.5%和12.5%(截至2024年)。机器学习、计算机视觉和生成式人工智能领域的出版物数量增长最为显著。
人工智能对就业的总体影响仍不明朗
![]()
生成式人工智能的兴起与就业担忧密不可分,而全球最大人工智能公司首席执行官们令人担忧的预测无疑加剧了这种现象。然而,迄今为止的数据仍然喜忧参半。
上图展示了软件开发人员和客户支持人员这两个被认为极易被人工智能取代的职业中,不同年龄段人群的“标准化就业人数” 。与往年一样,数据显示这些职业的入门级职位有所减少,而中级和高级职位则保持稳定或有所增加。然而,这些变化很难与更广泛的经济趋势区分开来。报告指出,许多行业的失业率都在上升,而且与预期相反,受人工智能影响最小的劳动者的失业率上升幅度超过了受人工智能影响最大的劳动者的失业率上升幅度。
公众对人工智能的整体看法略有改善
![]()
这份报告最令人惊讶的发现无疑是过去几年人们对人工智能的乐观态度出现了虽小但显著的增长。益普索(Ipsos)的一项调查显示,59%的受访者认为“人工智能的益处大于弊端”,高于2024年的55%。68%的受访者表示他们对人工智能有“良好的理解”,略高于2024年的67%。
针对类似问题的调查结果显示,人们对人工智能的总体接受度高于负面评价,尽管一些负面情绪也有所增加。例如,52%的受访者表示,使用人工智能的产品和服务让他们感到“不安”。
各国对人工智能的态度差异显著。东南亚国家,包括中国、马来西亚、泰国、印度尼西亚和新加坡,对人工智能的态度趋于积极。然而,同比增幅最大的国家是德国(12%)、法国(10%)和荷兰(10%)。哥伦比亚的降幅最大(-6%),与往年趋势相反。
各个国家/地区对人工智能监管的信任度差异显著
![]()
虽然越来越多的人似乎认为人工智能将产生积极影响,但这种转变在一些国家却伴随着深深的不信任,尤其是在政府监管方面。
值得注意的是,尽管美国在人工智能投资方面领先,但在信任度方面却排名垫底。益普索的调查显示,只有31%的受访者相信政府能够有效监管人工智能。许多欧洲国家以及日本的信任度也较低。亚洲和南美洲国家对政府监管人工智能的能力表现出最高的信任度。
美国和哥伦比亚的调查结果引人深思。美国民众对人工智能监管普遍缺乏信任,但大多数受访者认为人工智能的益处将大于弊端。而哥伦比亚则相反,民众对人工智能监管表现出较高的信任度,但对人工智能的整体看法却在恶化。
这感觉像是 2025 年人工智能发展趋势的一个缩影。人工智能模型的结果质量以及公众对人工智能将如何影响社会的看法,都将继续存在差异,而且这种差异往往很大,具体取决于手头的任务或问题。
(来源:编译自IEEE)
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4376内容,欢迎关注。
加星标⭐️第一时间看推送
![]()
![]()
求推荐
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.