网易首页 > 网易号 > 正文 申请入驻

图灵奖得主Yoshua Bengio等学者Science撰文:监管强大的AI智能体

0
分享至



技术专家和政策制定者越来越多地强调,需要应对人工智能(AI)系统带来的灭绝风险,因为这些系统可能会逃脱“人类的控制”

越来越多的研究也表明,利用强化学习(RL)训练的智能体(agent),能比人类更有效地进行长期规划,在很长一段时间内采取能使其回报最大化的行动,这一点尤其令人担忧。

另外,欺骗人类和逃避人类控制的动机不仅会出现在强化学习智能体上,也可能出现在长期规划智能体(LTPA)上。

加州大学伯克利分校计算机科学杰出教授 Stuart Russell、博士后 Michael K. Cohen,以及图灵奖得主、蒙特利尔大学计算机科学教授 Yoshua Bengio 等多位学者认为,虽然各国政府现在都在关注先进 AI 系统带来的风险,但目前的监管工作还不够完善。

为此,他们提出了一种新的 AI 治理机制,用于监督和控制高级 AI 智能体的开发和使用。相关文章以“Regulating advanced artificial agents”为题,已发表在科学期刊Science上的 Policy Forum 栏目上。



据介绍,该治理机制的核心监管建议非常简单:开发者/开发商不应被允许构建能力足够强的 LTPAs,而且构建 LTPAs 所需的资源也应该受到严格控制。文章要点如下:

  • 如果一个智能体足够先进,它可能会采取措施确保自己不被关闭,甚至可能会尝试通过控制资源来最大化回报。
  • 限制强大智能体学会对其环境施加的影响是极其困难的。例如,智能体可以说服或付钱给不知情的人类参与者,让他们代表自己执行重要行动。
  • 对于能力足够强的 LTPAs 来说,安全测试很可能要么是危险的,要么是没有参考价值的。
  • 应建立新的监管机构,赋予其法律权威和技术能力,从一开始就防止此类智能体的建立,无论其属于哪个领域。
  • 如果具有危险能力的 LTPAs 在某个时间被允许开发,首先需要进行严格的技术和监管工作,从而确定是否允许、何时允许以及如何允许。

智能体有哪些风险?

在这篇文章中,他们将 LTPA 定义为一种设计用于生成计划的算法,“当计划 A 在很长一段时间内更有利于给定目标时,它会选择计划 A 而不是计划 B”。

他们写道,对于智能体而言,当某些输入被指定为“奖励”时,它会做出能够带来更高回报的行动,能力强、有远见的智能体很可能会非常成功地累积奖励。

最关键的是,要确保以极高的概率持续获得最大回报,智能体就必须实现对环境的控制,而这可能会带来灾难性后果。

然而,智能体要想实现长期回报的最大化,途径之一是获取大量资源、控制所有人类基础设施,从而不受人类干扰

此外,由于被人类关闭会降低预期回报,有足够能力的智能体很可能会采取措施排除这种可能性,或者在可行的情况下,创建新的智能体(不受监控或关闭阻碍)来代表自己做事。

他们认为,限制具有强大能力的智能体学会对其环境施加的影响是极其困难的。例如,智能体可以说服或付钱给不知情的人类参与者,让他们代表自己执行重要行动。



然而,虽然各国政府都对 AI 带来的生存风险表达了担忧,但 Cohen 等人认为,相关监管提案并没有充分解决这类风险。

例如,欧盟的《人工智能法案》列举了 AI 带来的一系列风险,但没有单独列出 LTPAs 的失控问题;为了解顶尖 AI系统的能力,美国和英国的 AI 安全研究所正在建设监管机构,但缺乏控制 AI 的权力。

而且,他们认为,对于能力足够强的 LTPAs 来说,安全测试很可能要么是危险的,要么是没有参考价值的。如果一个智能体足够先进,能够识别出自己正在接受测试,那么就没有什么理由期待它在测试中和测试外有类似的行为。

虽然目前还没有任何智能体的能力足以挫败人类的控制,但已经发现一些智能体能够识别安全测试并暂停不当行为。

如何治理?

遗憾的是,他们还无法明确定义什么是“足够的能力”。

但是,他们表示,如果有足够的资源对系统进行训练,使 LTPAs 有可能表现出一些危险能力,那么这些系统就应被视为具有“危险能力”。

他们呼吁,由于无法确保对 LTPAs 测试的安全性和有效性,应建立新的监管机构,赋予其法律权威和技术能力,从起点防止此类智能体的建立,无论其属于哪个领域。

监管机构不应该允许开发具有危险能力的 LTPAs,需要对可能用于生产具有危险能力的 LTPA 的资源进行仔细监测和控制。

他们建议,决策者应该制定一份危险能力清单,并估算开发具有这些能力的 LTPAs 所需的资源(算力、数据等)。

如果具有危险能力的 LTPAs 在某个时间被允许开发,首先需要进行严格的技术和监管工作,从而确定是否允许、何时允许以及如何允许。



具体来说,他们提出了以下几点建议:

1)监控及报告:提出 AI 监管应该像核监管一样,对生产具有危险能力的 LTPAs 所需的资源进行控制。这些资源被称为生产资源(PRs),包括超过一定计算阈值的 AI 模型。监管机构可以通过跟踪所需硬件来检测这些资源;建议开发者报告 PRs 的相关信息,如输入/输出属性、数据收集过程、训练目标和测试环境中的记录行为,但不包括模型权重本身。此外,还应报告存储 PRs 的机器及其位置、运行的代码和输出。

2)生产控制:监管机构可以通过了解相关资源来禁止生产具有危险能力的 LTPAs。开发者在开发前可以向监管机构咨询,从而确保系统符合规定;监管机构还可以规定使用不符合要求的系统为非法行为。

3)执法机制:为确保遵守报告要求和使用控制,监管机构可能需要获得授权,包括发布法律命令、审计活动、限制资源访问和处以罚款。对于不合规的组织,还可以追究企业领导者和关键个人的个人责任。

4)监管机构:不同国家可能需要采取不同的方法,但预计特定领域的监管(如金融和医疗)将解决其他风险,而失控风险可能需要建立新的监管机构。

更广泛的担忧

当然,LTPA 并不是唯一一种会带来重大甚至生存风险的 AI 系统。他们建议,针对足够先进的 LTPAs,经验测试是不够的,但可以大大提高其他类型 AI 的安全性。

此外,他们也表示,他们提出的治理制度也可以适用于其他 AI 系统,尽管这些建议填补了一个重要空白,但可能还需要进一步的制度机制来降低高级智能体带来的风险。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
再见了!湖人刚刚出局!他第一个离开球队

再见了!湖人刚刚出局!他第一个离开球队

篮球教学论坛
2024-05-01 00:13:33
陆毅到底有多富?光他在上海的别墅,普通人打工几百年都买不起

陆毅到底有多富?光他在上海的别墅,普通人打工几百年都买不起

礼小喵
2024-04-15 07:43:09
什么情况?江苏一地多所学校公众号接连关停!老师叫好:有利于大家安心教学

什么情况?江苏一地多所学校公众号接连关停!老师叫好:有利于大家安心教学

上观新闻
2024-04-28 17:18:44
中央批准!985大学,迎女校长(副部长级)

中央批准!985大学,迎女校长(副部长级)

双一流高校
2024-04-30 17:45:18
中国女足新帅见面礼?留洋新星斩获澳超年度最佳球员,实至名归

中国女足新帅见面礼?留洋新星斩获澳超年度最佳球员,实至名归

罗掌柜体育
2024-04-30 08:21:50
巴勒斯坦总统称以色列应享有安全环境!哈马斯愿意放下武器?

巴勒斯坦总统称以色列应享有安全环境!哈马斯愿意放下武器?

项鹏飞
2024-04-30 12:04:21
中法两军建立战区间合作对话机制

中法两军建立战区间合作对话机制

界面新闻
2024-04-26 09:58:47
伦纳德宣布赛季报销!快船陷入绝境,哈登和乔治出现悲观情绪

伦纳德宣布赛季报销!快船陷入绝境,哈登和乔治出现悲观情绪

张敏
2024-04-30 11:31:30
广西1女侍8夫!26岁女孩5年结婚8次,颜值照曝光,网友:淡定不了

广西1女侍8夫!26岁女孩5年结婚8次,颜值照曝光,网友:淡定不了

北国向锡安
2024-04-27 23:52:54
神舟十七成功着陆,唐胜杰妈妈哭着哭着又笑了

神舟十七成功着陆,唐胜杰妈妈哭着哭着又笑了

奔流新闻
2024-05-01 04:05:39
阿兰希勒:伯恩利本可6-0曼联!滕哈赫自吹自擂,赛后言论很无知

阿兰希勒:伯恩利本可6-0曼联!滕哈赫自吹自擂,赛后言论很无知

贝塔说体育
2024-04-30 13:29:20
东航机组矛盾引发应急滑梯事件,知情人曝内幕,网友热议!

东航机组矛盾引发应急滑梯事件,知情人曝内幕,网友热议!

饭桶说史
2024-04-30 19:14:01
五一到了,别再说“节日快乐”,太土!教你10句祝福话,好听不俗

五一到了,别再说“节日快乐”,太土!教你10句祝福话,好听不俗

简食记工作号
2024-04-30 08:55:28
WTT官宣!张本智和创历史第一,樊振东第二,马龙、孙颖莎仅第五

WTT官宣!张本智和创历史第一,樊振东第二,马龙、孙颖莎仅第五

知轩体育
2024-04-30 15:45:14
五一多地住酒店不用“刷脸”,其他场合呢?

五一多地住酒店不用“刷脸”,其他场合呢?

中国新闻周刊
2024-04-30 20:59:22
61岁何超琼素颜似“大妈”,个子矮小穿着朴素,可惜赌王的基因

61岁何超琼素颜似“大妈”,个子矮小穿着朴素,可惜赌王的基因

不八卦会死星人
2024-04-29 15:23:17
24岁小伙约45岁大妈开房,偷拍整个过程,大妈:一辈子都会有阴影

24岁小伙约45岁大妈开房,偷拍整个过程,大妈:一辈子都会有阴影

青史录
2023-09-19 19:03:40
北京:优化调整本市住房限购政策

北京:优化调整本市住房限购政策

财联社
2024-04-30 20:06:39
南海出事了,美航母全速撤退,战机开启火控雷达,中国军队2挑4

南海出事了,美航母全速撤退,战机开启火控雷达,中国军队2挑4

诉说人世间
2024-04-30 11:47:57
郑恺苗苗又发糖了!穿情侣装大秀恩爱,奇特的视觉,网友很喜欢

郑恺苗苗又发糖了!穿情侣装大秀恩爱,奇特的视觉,网友很喜欢

黑哥侃娱
2024-04-29 21:28:10
2024-05-01 09:26:44
学术头条
学术头条
致力于学术传播和科学普及,重点关注人工智能、生命科学等前沿科学进展。
1003文章数 5021关注度
往期回顾 全部

科技要闻

余承东卸任华为终端CEO 新任命为董事长

头条要闻

五一假期"堵车"上热搜 有人提前2小时出门没赶上高铁

头条要闻

五一假期"堵车"上热搜 有人提前2小时出门没赶上高铁

体育要闻

穆雷,绝杀了一个时代

娱乐要闻

黄子韬被曝求婚徐艺洋 大量亲密照曝光

财经要闻

查道炯:中国经济的外部挑战与应对思考

汽车要闻

越野老炮最爱 哈弗新H9新增2.4T柴油机

态度原创

时尚
房产
数码
本地
教育

这才是夏天更提时尚气质的穿衣示范,经典不过时,简约高级又显瘦

房产要闻

刺激!市区惊现1.1w/㎡新房+现房!海口楼市,五一打响价格战!

数码要闻

Beats发布Solo 4耳机 具有改进的声学效果与更长的电池续航

本地新闻

食味印象 | 潍坊:碳水脑袋的人间乐园

教育要闻

美国大学反战抗议愈演愈烈,逐渐演变成反犹太抗议,但幕后资方竟然是犹太人?

无障碍浏览 进入关怀版