网易首页 > 网易号 > 正文 申请入驻

盘和林:衡量AI发展可信、可控的标尺有三个维度

0
分享至

封面新闻记者 易弋力

9月15日,在2025年国家网络安全宣传周主论坛上,《人工智能安全治理框架》2.0版(以下简称《框架》2.0版)正式发布。此前,为落实《全球人工智能治理倡议》,《人工智能安全治理框架》1.0版(以下简称《框架》1.0版)于2024年9月发布,并受到国内外广泛关注。



《框架》1.0版发布到现在,人工智能技术和应用取得了哪些新突破?如何理解《框架》2.0版提到的“安全、可信、可控”等关键词? 9月17日,工信部信息通信经济专家委员会委员盘和林分享了他的观点。

盘和林表示,自《框架》1.0版发布以来,人工智能技术在多模态大模型、自主智能体(AI Agent)、具身智能等领域取得显著进展。多模态模型已实现文本、图像、音频、视频的跨模态生成与理解,自主智能体具备复杂任务规划和工具调用能力,人工智能与机器人结合的具身智能正在突破物理空间限制。同时,AI在生物医药、材料科学等垂直领域的应用深度不断增强。

这些发展也带来了新的安全风险,比如:新型滥用风险:深度伪造技术泛滥导致虚假信息传播难度降低,AI生成内容鉴别难度加大;系统级风险:自主智能体可能产生不可预测的涌现行为,多智能体交互可能产生复杂系统风险;产业安全风险:AI在关键基础设施领域的应用加深,使得单点故障可能引发系统性风险;伦理挑战升级:生成式AI的偏见嵌入更加隐蔽,算法歧视从显性转向隐性。面对这些变化,《框架》2.0版应运而生。

《框架》2.0版具体对哪些“规矩”进行了更新?盘和林表示,《框架》2.0版从静态治理到动态治理:要求建立适应技术迭代的敏捷治理体系,比如设置"监管沙盒"等弹性机制,将创新应用放在沙盒中进行观察,调整监管治理体系。从单一维度到多维治理:统筹技术安全、伦理安全、社会安全等多维度治理要求,而不是单一的网络安全维度。这样能够更加全面的应对当前技术发展带来的安全风险。从事后治理到前瞻治理:比如建立风险预警机制,对前沿技术方向进行预研预判,针对性的制定新规则。

具体来看:《框架》2.0版将要应对生成式AI带来的内容安全挑战,比如深度伪造技术的以假乱真的问题。将规范自主决策系统的责任认定机制,比如智驾撞人,责任在谁。将推动建立适应大模型即服务(MaaS)模式的新型监管体系。将平衡开源开放与安全可控的关系。

《框架》2.0版提到,培育安全、可靠、公平、透明的人工智能技术研发和应用生态。如何理解这四个关键词?

盘和林表示,安全:指AI系统应具备韧性抗扰能力,保障数据安全、模型安全和应用安全,建立端到端的安全保障体系。我认为这是一个多维度成体系的安全机制。可靠:要求AI系统行为可预期、输出稳定性和准确率高,在关键领域达到工业级可靠性标准。这里的关键在于精度,我们知道现在AI大模型存在幻觉,未来会要求AI大模型不断减少幻觉。公平:强调算法决策应避免偏见歧视,保障不同群体获得均等机会,实现技术普惠包容。技术应该带来公平,而不是新的贫富差异。透明:包含可解释性与可追溯性双重含义,既要实现决策过程可理解,又要确保数据来源可追溯。不能到处都用技术黑箱来搪塞用户,而是要给用户解释明白,我们的数据去了哪里,AI又是怎么辅助人类的。

《框架》2.0版还有两个关键词是“可信、可控”,衡量AI发展可信、可控的标尺在哪?

在盘和林看来,衡量标尺有三个维度:技术层面:我们可以通过验证测试(如红队测试)、形式化验证等方法量化安全性,也可以通过可信数据空间技术,联邦学习等安全技术,来控制安全变量,建立技术上的整套安全保障体系。要给示范方案。伦理层面:建立多维度评估矩阵(包括公平性、隐私保护、人性尊严等指标),这里就要提到,谁有权来对伦理下判断,我认为,应该是用户,所以,需要从用户中筛选一部分人,来对创新进行伦理评价。治理层面:实施分级分类管理,根据风险等级匹配相应监管强度,不同的应用具备不同的风险等级,不能一刀切,要分级分类的处置风险。

对于什么是AI可信,盘和林表示,预测决策可解释(提供人类可理解的决策依据),行为输出一致性(相同输入产生预期范围内的输出),错误率可控(在关键领域达到99.99%以上的准确率),偏见可控(通过偏见检测和缓解技术确保公平性)。

如何实现AI可控?设置人类监督节点(保留人类最终决策权),建立行为边界约束(通过宪法AI等技术设定行为边界),实现全生命周期监控(从训练到部署全程可审计)。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陪读妈妈半夜录视频引发争议,清凉装扮引发热议。

陪读妈妈半夜录视频引发争议,清凉装扮引发热议。

特约前排观众
2026-01-29 00:15:03
触球比门将还少!阿森纳巨星全场仅 4 次传球,阿尔特塔该醒醒了

触球比门将还少!阿森纳巨星全场仅 4 次传球,阿尔特塔该醒醒了

澜归序
2026-02-01 07:18:56
伊朗最高领袖顾问:已掌握敌方作战计划 将适时发动打击

伊朗最高领袖顾问:已掌握敌方作战计划 将适时发动打击

环球网资讯
2026-01-31 05:44:17
“毛孩子”也要过春节!宠物春节上门喂养爆单 专属年夜饭一份上百元

“毛孩子”也要过春节!宠物春节上门喂养爆单 专属年夜饭一份上百元

看看新闻Knews
2026-02-01 11:56:43
德日急眼了:我们垄断全球半个世纪,如今却被山西4万铁匠干翻

德日急眼了:我们垄断全球半个世纪,如今却被山西4万铁匠干翻

蜉蝣说
2026-01-30 11:00:49
四国演练击沉中国军舰,中方轻飘飘回了句英文,伤害不大侮辱性强

四国演练击沉中国军舰,中方轻飘飘回了句英文,伤害不大侮辱性强

墨兰史书
2026-01-30 17:25:04
三大运营商宣布调整电信服务增值税税率,由6%调至9%

三大运营商宣布调整电信服务增值税税率,由6%调至9%

IT之家
2026-02-01 17:56:09
吴君如很早就说过了,陈妍希私下就是这样穿

吴君如很早就说过了,陈妍希私下就是这样穿

八星人
2026-01-21 15:14:26
一块H200芯片,为何炸翻了整个汽车圈?

一块H200芯片,为何炸翻了整个汽车圈?

智驾在线
2026-01-30 20:48:37
北京阿姨通透,把十几年来买的金条全卖了,称:涨了不卖留着干啥

北京阿姨通透,把十几年来买的金条全卖了,称:涨了不卖留着干啥

我心纵横天地间
2026-02-01 13:18:57
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

戗词夺理
2026-01-24 16:05:41
内维尔:弗兰克简化了比赛;这支曼城没冠军脊梁,顶不住猛攻

内维尔:弗兰克简化了比赛;这支曼城没冠军脊梁,顶不住猛攻

懂球帝
2026-02-02 07:54:10
央视春晚第三次联排!近十年最强阵容,网友:今年春晚总算有救了

央视春晚第三次联排!近十年最强阵容,网友:今年春晚总算有救了

杨仔述
2026-01-31 18:16:31
筹码集中!最新股东户数环比减少10%以上的公司一览(2026.02.1)

筹码集中!最新股东户数环比减少10%以上的公司一览(2026.02.1)

A股数据表
2026-02-01 17:35:03
就在刚刚!中方强硬发声:90天内不支付358亿赔偿金

就在刚刚!中方强硬发声:90天内不支付358亿赔偿金

爱吃醋的猫咪
2026-02-01 19:34:35
难堪大用!曼联半亿水货沦为天坑 夏窗面临被清洗

难堪大用!曼联半亿水货沦为天坑 夏窗面临被清洗

球事百科吖
2026-02-02 05:36:58
很多人以为殉葬就是把活人关进地宫,门一关,他们只能哭喊着等死

很多人以为殉葬就是把活人关进地宫,门一关,他们只能哭喊着等死

忠于法纪
2026-01-18 17:42:24
抗战时,一个军阀手握20万重兵,却始终没动一兵一卒,这人是谁?

抗战时,一个军阀手握20万重兵,却始终没动一兵一卒,这人是谁?

卿昀
2025-01-25 21:22:58
媒体人传来消息!王钰栋加盟欧洲豪门悬念揭晓 徐彬外租下家曝光

媒体人传来消息!王钰栋加盟欧洲豪门悬念揭晓 徐彬外租下家曝光

侃球熊弟
2026-02-01 00:06:51
国台办果然没看错,郑丽文真面目被彻底揭露!小算盘到此为止了

国台办果然没看错,郑丽文真面目被彻底揭露!小算盘到此为止了

比利
2026-01-23 12:41:53
2026-02-02 08:15:00
封面新闻 incentive-icons
封面新闻
第一眼,看封面。了解权威信息,看真实新闻故事(互联网新闻信息服务许可证:51120170004)。
339295文章数 888273关注度
往期回顾 全部

科技要闻

10亿元宝红包突袭 复刻微信支付还是微视?

头条要闻

30岁男子如厕时猝死 妻子回忆事发前5天丈夫疼痛细节

头条要闻

30岁男子如厕时猝死 妻子回忆事发前5天丈夫疼痛细节

体育要闻

德约大度祝贺阿卡 幽默互动逗笑纳达尔

娱乐要闻

春晚第三次联排阵容曝光:全是实力派

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

本地
数码
游戏
房产
公开课

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

数码要闻

显存稀缺暴涨:三款RTX 50 GPU将占一季度总供应量75%!

魔兽时光服:又开启造富神话,价格突破66万金,这件装备有多牛?

房产要闻

藏不住的小城大事,海澄新城执掌自贸港风口,进阶兑现美好生活新篇

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版