![]()
生成式人工智能(Generative AI)用3年时间覆盖了53%的全球人口,比个人电脑和互联网都快。但这份来自斯坦福人类中心人工智能研究所(HAI)的年度体检报告,给出的诊断结果远比"技术狂奔"复杂得多——性能暴涨、安全失控、信任崩塌,三条曲线正在疯狂背离。
代码能力一年从60%飙到近满分,却读不懂模拟时钟
AI Index Report 2026用一组数据撕开了技术乐观主义的滤镜。在SWE-bench Verified编程基准测试上,模型表现从60%一跃逼近100%,只花了12个月。Google的Gemini Deep Think甚至在国际数学奥林匹克竞赛摘金——这是人类顶尖数学天才的竞技场。
但同一个模型,读模拟时钟的正确率只有50.1%,比抛硬币好不了多少。这种"锯齿前沿"(jagged frontier)现象说明,AI的能力分布极不均衡:它能解博士级别的科学难题,却在幼儿园级别的视觉任务上翻车。技术进步不是平滑爬坡,而是疯狂的局部跃迁与诡异的能力盲区并存。
报告追踪了这种不均衡的代价。客服和软件开发领域,AI带来的生产力提升在14%到26%之间,营销团队最高可达72%。但需要复杂判断的任务,效果微弱甚至为负。企业各部门的AI智能体(AI agent)采用率,几乎全部停留在个位数。
最刺眼的数字藏在就业数据里。美国22至25岁开发者就业率自2024年以来下跌近20%,而年长开发者数量持续增长。AI productivity gains最强的领域,恰恰是对年轻人就业冲击最狠的战场。
中美模型差距缩至2.7%,但投资差距仍是23倍
2025年初以来,中美顶尖模型开始交替登顶。截至2026年3月,Anthropic的领先模型仅比中国最优模型高出2.7个百分点——这个差距在统计误差边缘摇摆。
但结构差异依然悬殊。中国在论文发表量、引用次数、工业机器人部署量上全面领先。美国则把持着顶级模型数量和资本弹药:2025年私人AI投资2859亿美元,是中国的23倍。
![]()
人才流动曲线正在逆转。2017年以来,移居美国的AI研究者数量暴跌89%。钱还在往美国流,人已经开始往别处走。
这种"资本-人才"的撕裂,正在重塑全球AI竞赛的底层逻辑。当技术差距压缩到2.7%,堆钱堆卡的边际效益会不会触顶?报告没有给出答案,但数据指向一个尴尬的过渡期:硬件和资金的优势,正在被工程效率和人才密度稀释。
73%的专家看好就业影响,只有23%的公众同意
报告中最具张力的发现,是一组几乎对称的认知裂痕。73%的美国AI专家认为技术对就业市场影响积极,公众中持同样看法的仅23%。经济、医疗领域呈现类似断层。
这种分裂不是信息滞后那么简单。生成式AI的普及速度已经碾压PC和互联网,但政策配套严重脱节。美国中小学生中,五分之四使用AI辅助学业,却只有半数学校制定了AI使用规范,仅6%的教师认为这些规范清晰明确。
监管信任的崩塌更为彻底。在全球受调查国家中,美国公众对政府AI监管能力的信任度垫底——31%。技术迭代以月为单位,制度响应以年为单位,而公众耐心正在以周为单位蒸发。
安全问题的章节被报告置于显著位置。性能暴涨的另一面,是测试逃逸、对齐失败、滥用风险的同步攀升。但具体案例和数据,报告选择留待后续专项研究展开。
一个细节值得玩味:当模型在数学竞赛击败人类金牌选手时,同一批系统仍在为读取模拟时钟挣扎。这种荒诞的能力错配,或许正是当前AI发展阶段的隐喻——我们造出了在某些维度超越博士生的工具,却还没解决让它稳定识别下午三点的工程问题。
公众信任会先于技术成熟触底反弹,还是持续下探直至某次重大事故?报告的数据截止到2026年3月,而答案正在接下来的几个月里被实时书写。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.