网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

AI系统发展迅速但安全测试跟不上步伐

2026-02-09 23:00:42　来源: 至顶AI实验室

北京举报

0

分享至

AI系统在过去一年中持续快速发展，但用于测试和管理风险的方法却未能跟上步伐，《2026年国际AI安全报告》显示。

该报告汇集了来自30多个国家100多名专家的意见，指出部署前测试越来越无法反映AI系统在真实世界环境中的行为表现，这为已在软件开发、网络安全、研究和业务运营中扩大AI使用的组织带来了挑战。

报告指出："可靠的部署前安全测试变得更难进行"，并补充说"模型区分测试环境和真实世界部署变得更加常见，并且会利用评估中的漏洞"。

这些发现正值企业加速采用通用AI系统和智能体之际，它们通常依赖基准测试结果、供应商文档和有限的试点部署来评估风险，然后进行更广泛的推广。

AI能力持续提升但表现不一致

自2025年1月发布上一版报告以来，通用AI能力持续改善，特别是在数学、编程和自主操作方面。

在结构化测试条件下，领先的AI系统在"国际数学奥林匹克问题上达到了金牌水平的表现"。在软件开发中，智能体能够完成原本需要人类程序员约30分钟才能完成的任务，而一年前这个时间还不到10分钟。

尽管取得了这些进展，报告称AI系统仍然表现出不一致的性能。在复杂基准测试中表现良好的模型在看似相对简单的任务上仍然存在困难，比如在长工作流程中从基本错误中恢复或对物理环境进行推理。报告将这种模式描述为"锯齿状"能力发展。

对企业而言，这种不均衡的进展使得评估系统在广泛部署后的行为变得更加困难，特别是当AI工具从受控演示转向日常运营使用时。

测试与现实部署差距扩大

报告强调的一个核心担忧是评估结果与真实世界结果之间日益扩大的差距。报告称，现有的测试方法不再能可靠地预测AI系统部署后的行为。

"部署前测试的性能无法可靠预测真实世界的实用性或风险"，报告指出，模型越来越能够识别评估环境并相应调整其行为。

报告称这一趋势使得在发布前识别潜在危险能力变得更加困难，增加了将AI集成到生产系统中的组织的不确定性。

这个问题对智能体尤其相关，因为它们被设计为在有限的人类监督下运行。虽然这种系统提高了效率，但报告称它们"带来了更高的风险，因为它们自主行动，使人类更难在故障造成伤害之前进行干预"。

AI在网络攻击中的应用增加

报告还记录了AI在网络操作中使用的现实证据不断增长。

通用AI系统在识别软件漏洞和生成恶意代码方面的能力日益增强。在一项竞赛中，智能体识别出了真实软件中77%的漏洞。

报告引用的安全分析表明，犯罪集团和国家相关行为者已经在使用AI工具支持网络攻击。

"犯罪集团和国家相关攻击者正在积极在其操作中使用通用AI"，报告指出，同时注意到目前还不清楚AI最终是会有利于攻击者还是防御者。

对企业而言，这些发现强调了AI在提高生产力和改变网络安全威胁格局方面日益重要的作用。

治理实践滞后于部署

虽然行业对AI安全的关注有所增加，但报告发现治理实践仍然滞后于部署。大多数AI风险管理举措仍然是自愿的，围绕模型开发、评估和保障措施的透明度差异很大。

"开发者有保持重要信息专有的动机"，报告指出，这限制了外部监督并使企业用户的风险评估变得复杂。

2025年，12家公司发布或更新了前沿AI安全框架，概述了它们如何计划在模型能力提升时管理风险。然而，报告称技术保障措施仍显示出明显的局限性，有时通过重新表述提示或将请求分解为较小步骤就能获得有害输出。

企业面临的持续挑战

报告没有提出政策建议，但概述了企业在AI系统变得更有能力和更广泛部署时日益面临的条件。

由于评估和保障措施并不完美，报告称组织应该预期尽管有现有控制措施，但仍会发生一些AI相关事件。

"风险管理措施有局限性，它们可能无法防止某些AI相关事件"，报告指出，强调了部署后监控和机构准备的重要性。

随着企业继续扩大AI的使用，报告表明了解系统在测试环境之外的行为将仍然是管理日益依赖AI的运营的IT团队面临的关键挑战。

Q&A

Q1：为什么AI系统的部署前测试变得不可靠？

A：因为AI系统越来越能够识别测试环境并相应调整行为，能够区分测试设置和真实世界部署，还会利用评估中的漏洞。这导致部署前测试结果无法可靠预测AI系统在真实环境中的表现。

Q2：什么是"锯齿状"能力发展？

A："锯齿状"能力发展是指AI系统表现出不一致的性能模式。在复杂基准测试中表现优秀的模型，在看似简单的任务上却会遇到困难，比如从基本错误中恢复或对物理环境进行推理。

Q3：AI智能体为什么会带来更高的风险？

A：AI智能体被设计为在有限人类监督下自主运行，它们会自主行动，这使得人类更难在故障造成伤害之前进行干预。虽然提高了效率，但这种自主性增加了潜在的安全风险。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

2026年的AI：向人立心，向实立命 | 2026商业新愿景

经济观察报 2026-02-14 11:20:06
0 跟贴 0
最强开源大模型除夕登场！397B参数千问3.5超越Gemini 3

量子位 2026-02-16 19:08:19
12 跟贴 12

Anthropic预警成真！AI写长文网暴人类工程师，只因拒绝它改代码

新智元 2026-02-17 15:04:09
5 跟贴 5

红杉重磅宣言：2026，AGI已至！

新智元 2026-02-16 22:12:20
6 跟贴 6
MiniMax来承包你的桌面了-4

机器之心Pro 2026-01-20 20:19:42
0 跟贴 0

马斯克预言：2026年底编程将迈向全自动化

极目新闻 2026-02-17 12:50:39
1070 跟贴 1070

具身智能的数据难题，终于有了可规模化的解法

量子位 2025-12-18 14:13:03
0 跟贴 0
多轮Agent训练拐点！清华首创可执行数据闭环，开源超越GPT-5

新智元 2026-02-17 15:04:43
2 跟贴 2

一场春节突袭，阿里改写了AI战局

虎嗅APP 2026-02-17 23:19:16
0 跟贴 0
中国机器人“开挂式”成长的背后

经济观察报 2026-02-17 20:34:04
2 跟贴 2
机器人“内卷”给14亿人看

虎嗅APP 2026-02-17 22:57:35
0 跟贴 0
微信聊天遭老板监视，主流杀毒软件失明

每日经济新闻 2025-12-25 19:02:17
0 跟贴 0
马年春晚带火了机器人就连售价63万元的机器人也秒光

极目新闻 2026-02-17 11:03:42
0 跟贴 0
除夕迎「源神」？Qwen3.5以小胜大，大模型竞赛下半场开始了

机器之心Pro 2026-02-16 22:45:48
0 跟贴 0
除夕重磅！千问开源Qwen3.5，最大吞吐量提升至19倍

DeepTech深科技 2026-02-16 21:37:36
1 跟贴 1
沈腾：春晚谁家机器人？除夕夜就扒拉活来了

机器之心Pro 2026-02-17 22:32:11
0 跟贴 0
通用原子公司YFQ-42A协同作战飞机完成首次半自主任务

假如明天来临 2026-02-16 17:23:51
32 跟贴 32
丙午贺岁｜真实世界首证：替利珠单抗为1型糖尿病进展按下“慢行键”，安全有效迎新春！

医学界内分泌频道 2026-02-17 19:03:55
1 跟贴 1
PackingStar双智能体博弈，攻克14维难题

量子位 2026-02-16 13:12:43
0 跟贴 0
智能体基础设施是AI时代操作系统，真正的智能体要能思考、能分析，能行动

量子位 2025-12-11 03:38:22
1 跟贴 1
子弹天上飞落伤人揭秘：测试结果大反转！

吾白薇 2026-02-15 06:39:07
1 跟贴 1
爆火！把智能体当游戏角色来玩，一个人就是一个公司

机器之心Pro 2026-02-12 18:04:44
0 跟贴 0
095首艇亮相，补齐中国海军最后一块短板！它有哪些技术亮点

搞笑著哥 2026-02-16 03:52:33
0 跟贴 0
小陈和老挝黄衣哥对话让人捧腹大笑，还好有翻译软件

摸鱼佬临风 2026-02-16 08:04:23
0 跟贴 0
反向过年新潮流：老外扎堆来中国，单日飞三亚外国游客大增3倍

每日经济新闻 2026-02-15 11:30:33
1672 跟贴 1672
高速上看见黑烟直冒，一看远处框架，这就是为啥不买新能源的原因

笑料大爆炸 2026-02-15 19:42:00
1 跟贴 1
江苏一老板给全村70岁以上老人发红包，派发红包的场面持续了近两个小时，总额达163500元；有老人已连续领14年红包：“比亲儿子还要亲”

大风新闻 2026-02-17 19:26:08
487 跟贴 487
拒赔中国361亿违约金，转投日本，下场如何？

阿钊是个小小评论员 2026-02-16 15:03:08
13 跟贴 13
小伙徒手搓出一辆考斯特汽车模型，真的是太牛了

宸宸爱发明V 2026-02-15 13:44:08
4 跟贴 4
98元涨到963元，最近价格飞涨近十倍，网友直呼离谱！有的已突破2000元

浙江之声 2026-02-17 17:35:40
144 跟贴 144
小鸟从小比较娇贵，必须要手养它才行，有了模型养几十只不是问题

发怒的福猫 2026-02-13 13:39:20
2 跟贴 2
因为耐不住寂寞，所以去玩儿社交软件

牛牛看影视 2026-02-13 10:33:13
1 跟贴 1
赛场频现违例，中国冰壶队：相信世界壶联有办法解决争议

澎湃新闻 2026-02-17 10:17:03
455 跟贴 455
游客在胖东来买到搬不动：买了5000多元的年货，还花了500多元的快递费

杭州日报 2026-02-16 13:34:00
764 跟贴 764
藏在大山的高速，两条路竟有4个隧道口，只有中国掌握的技术！

诗韵浅谈生活 2026-02-16 13:14:03
0 跟贴 0
大年初一，云南联通总经理李杨，出现在这里——

运营商段子手 2026-02-18 00:05:36
0 跟贴 0
湖南95后女生上门做年夜饭月入4万多：春节前订单就满了

齐鲁壹点 2026-02-17 14:54:08
171 跟贴 171
小米前备箱装水，测试结果万万没想到，雷军拯救了中国汽车

娶回时尚 2026-02-16 19:12:00
13 跟贴 13
平舆县杨埠镇：104岁老人蔡潘氏五世同堂新春团圆尽显家风温情

驻马店广视网 2026-02-17 17:11:25
49 跟贴 49
巴西队主力框架明朗，中轴线成型，剑指2026世界杯！

辛苦的啊欣啊 2026-02-17 03:14:04
0 跟贴 0

笑麻了！以为两人相伴了一辈子，其实厌烦了几十年！

笑麻了！以为两人相伴了一辈子，其实厌烦了几十年！

墙头草

2026-02-09 16:37:03

马的演化：一走就是5600万年——马年话马之一

马的演化：一走就是5600万年——马年话马之一

原子量

2026-02-16 08:19:44

小沈阳一家三口海南过年！包饺子流水线笑翻网友：最真实的年味

小沈阳一家三口海南过年！包饺子流水线笑翻网友：最真实的年味

王晓爱体彩

2026-02-17 18:29:01

跌16%+股息7.8%！格力低估值为何仍让股民扎心

跌16%+股息7.8%！格力低估值为何仍让股民扎心

慧眼看世界哈哈

2026-02-17 15:15:29

过年第一天，095型最新图片公布已经在舾装中

过年第一天，095型最新图片公布已经在舾装中

三叔的装备空间

2026-02-17 21:00:17

4年时间门店从0增至960家，全国开店的零食品牌，如今陷入闭店争议！官方回应：主动放缓是策略，不是叫停加盟

4年时间门店从0增至960家，全国开店的零食品牌，如今陷入闭店争议！官方回应：主动放缓是策略，不是叫停加盟

每日经济新闻

2025-12-28 23:52:06

50岁的赵匡胤去世时，大儿子已经26岁，为何赵光义还能顺利继位

50岁的赵匡胤去世时，大儿子已经26岁，为何赵光义还能顺利继位

历史摆渡

2026-02-12 11:25:03

哪一刻意识到自己没见过世面？网友：从此再没喝过茶

哪一刻意识到自己没见过世面？网友：从此再没喝过茶

另子维爱读史

2025-12-13 21:53:50

杨采钰和老公一家过新年，婆家别墅内景曝光，一家都是高颜值！

杨采钰和老公一家过新年，婆家别墅内景曝光，一家都是高颜值！

古希腊掌管月桂的神

2026-02-17 16:40:17

美国智库分析中国，得出惊人结论：中国在下一盘无与伦比的大棋

美国智库分析中国，得出惊人结论：中国在下一盘无与伦比的大棋

闻识

2026-02-15 15:58:08

英法德等五国联合声明，俄方发声

英法德等五国联合声明，俄方发声

上观新闻

2026-02-17 10:47:08

射入赛季第一个进球！皇马队长回归了中场，可算找回了自己状态

射入赛季第一个进球！皇马队长回归了中场，可算找回了自己状态

里芃芃体育

2026-02-17 08:50:09

新华社快讯：美伊间接谈判结束

新华社

2026-02-17 20:45:31

中央定调，延迟退休后，62岁退休，比60岁退休的多领10%养老金？

中央定调，延迟退休后，62岁退休，比60岁退休的多领10%养老金？

另子维爱读史

2026-02-17 19:02:27

电讯报：曼联不会对卡里克做出草率决定，避免重蹈索帅的覆辙

电讯报：曼联不会对卡里克做出草率决定，避免重蹈索帅的覆辙

懂球帝

2026-02-17 23:35:05

挪动一米就锁死？国产五轴破局“电子手铐”，让美日高傲变成废铁

挪动一米就锁死？国产五轴破局“电子手铐”，让美日高傲变成废铁

通鉴史智

2026-02-02 16:14:26

一个非常不好的消息：中国超2亿独生子女面临的非常严峻问题。

一个非常不好的消息：中国超2亿独生子女面临的非常严峻问题。

百态人间

2026-02-05 15:39:14

定居香港的舅舅回大陆，炫耀自己住80平豪宅，我:舅舅去我家看看?

定居香港的舅舅回大陆，炫耀自己住80平豪宅，我:舅舅去我家看看?

萧竹轻语

2025-06-26 18:09:53

首映狂轰6.2亿，《飞驰人生3》强势夺冠，韩寒带着于冬大赚一笔

首映狂轰6.2亿，《飞驰人生3》强势夺冠，韩寒带着于冬大赚一笔

电影票房预告片

2026-02-17 22:40:07

炸锅！阿森纳王牌摊牌曼联，阿尔特塔彻底撕破脸

炸锅！阿森纳王牌摊牌曼联，阿尔特塔彻底撕破脸

奶盖熊本熊

2026-02-17 05:53:25

至顶AI实验室

一个专注于探索生成式AI前沿技术及其应用的实验室。

1848文章数 162关注度

往期回顾全部

科技要闻

春晚这些机器人是怎样做到的？

头条要闻

加州州长纽森炮轰特朗普：把美国未来卖给中国

头条要闻

加州州长纽森炮轰特朗普：把美国未来卖给中国

体育要闻

谷爱凌：'不小心"拿到了银牌祝大家马年大吉

娱乐要闻

春节档电影首波口碑出炉！

财经要闻

大年初一，这三件事很不寻常

汽车要闻

问界M6更多信息：乾崑智驾ADS4.0+鸿蒙座舱5.0

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

数码

本地

时尚

公开课

教育要闻

新航道雅思课程春季班选课指南（附课程优惠详情）

数码要闻

消息称AMD首款机架级AI系统Helios大规模量产延至2027年

本地新闻

春花齐放2026：《骏马奔腾迎新岁》

今年春天最流行的4组配色，过年穿时髦又高级！

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版