网易首页 > 网易号 > 正文 申请入驻

辛顿、姚期智等联名签署“上海共识”,呼吁给AI确立行为红线

0
分享至

“国际社会应确立具体、可操作、受全球认可的红线,确保人工智能系统在任何情况下均不得逾越。”7月25日, 由杰弗里·辛顿(Geoffrey Hinton)、姚期智、本吉奥(Yoshua Bengio)、斯图尔特·罗素(Stuart Russell)等20余位行业专家、学者共同签署的AI安全国际对话上海共识(以下简称“上海共识”)正式对外公开。

参与签署的部分中外科学家 来源:IDAIS官网

此次对话是“AI安全国际对话”(International Dialogues on AI Safety - IDAIS)系列的一部分”。作为本次共识发起方之一,图灵奖得主、上海期智研究院的院长姚期智当日表示,“我越来越相信,人类终将找到解决方案。”

联名签署现场

2024年3月,辛顿、姚期智、罗素、本吉奥等专家曾共同签署“北京共识”,主张限制AI系统复制、欺骗、武器开发等行为,尤其呼吁行业为AI的研发和应用戴上“紧箍咒”,避免相关技术被滥用,推动全球治理机构构建。姚期智透露,18个月前举办第一次安全共识会议时,AGI强大的破坏力就已经显现,人类甚至难以阐明其失控机制,不过随着相关会议的推进,已经看到若干有关基于“设计的安全”(Safe by design)提案,这意味着实际上人类可以找到确保AI安全的可行路径。

此次“上海共识”指出,当前人类正处于一个关键转折点:人工智能系统正迅速接近并可能超越人类智能水平。这些未来的系统可能在操作者毫不知情的情况下,执行并非操作者所期望或预测的行动。这可能导致失控,即一个或多个通用人工智能系统脱离任何人的控制,从而带来灾难性甚至是生存层面的风险。当前,对于能够在更高级的通用人工智能超越人类智能水平后,仍可靠地确保其对齐,并保持人类的有效控制尚无可行方法。

多位与会专家在参与讨论时也提及,当前构建真正有约束力且值得信赖的国际AI安全框架难度高、风险大。

上海人工智能实验室主任周伯文教授指出,目前Make AI Safe(使得AI安全)最大的问题在于它是事后价值对齐、修补的、被动回应的,通常是防御成本过高而攻击成本过低。而Make Safe AI(构建安全的AI)是主动的、在线共同演进的,同时防御成本低,能够在各级风险上都保持应变能力。

周伯文认为,在一定程度上,训练一个模型变得友善和训练一个模型变得聪明可能是两条不同的技术路径。但当性能发展到某个程度,这两种能力可能很难分开处理——就像经典牛顿定律可以有效解释静止或慢速物体的运动,但是一旦逼近光速,这套理论就失效了。所以他认为,下一代模型的“善”与“智”未必能完全独立、分开发展,而是相互影响、共同进化的。

参与签署的专家之一,担任约翰·霍普金斯大学人工智能对齐与治理方向杰出教授吉莉恩·哈德菲尔 (Gillian Hadfield)在接受包括澎湃科技在内的媒体采访时指出,必须通过设立AI“红线”来推动Make AI Safe(使得AI安全),全世界需要跨国界合作。此外,要建立相应的AI安全合规系统。

为防范与纠正此类行为的技术路径与治理机制,“上海共识”提出应对策略,并呼吁采取三项关键行动:要求前沿人工智能开发者提供安全保障、通过加强国际协调,共同确立并恪守可验证的全球性行为红线、投资基于设计的安全人工智能研究。

其中,对于开发者来说,“上海共识”要求开发者在模型部署前应先进行全面的内部检查和第三方评估,提交高可信的安全案例,以及开展深入的模拟攻防与红队测试。若模型达到了关键能力阈值(比如检测模型是否具备帮助没有专业知识的非法分子制造生化武器的能力),开发者应向政府(在适当时亦可向公众)说明潜在风险。

此外,呼吁国际社会需要合作划出人工智能开发不可以逾越的红线(即“高压线”),这些红线应聚焦于人工智能系统的行为表现,其划定需同时考量系统执行特定行为的能力及其采取该行为的倾向性。为落实这些红线,各国应建立一个具备技术能力、具有国际包容性的协调机构,汇聚各国人工智能安全主管机构,以共享风险相关信息,并推动评估规程与验证方法的标准化。

“上海共识”指出,短期内亟须建立可扩展的监管机制以应对人工智能的欺骗问题、提升模型对“越狱”等攻击手段的抵御能力、强化信息安保投入等,而长期则需要一个“基于设计的安全”的架构,而非问题出现后才被动应对。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
有其母必有其女!张柏芝母亲风流不输女儿,55岁全裸拍三级片

有其母必有其女!张柏芝母亲风流不输女儿,55岁全裸拍三级片

橙星文娱
2026-03-29 00:22:53
巴基斯坦战略专家:这三场战争已表明,中国才是世界最强超级大国

巴基斯坦战略专家:这三场战争已表明,中国才是世界最强超级大国

甜美蜜桃派
2026-05-07 18:35:53
张本智和再度豪言夺冠!日媒力挺:马龙樊振东隐退中国队实力大减

张本智和再度豪言夺冠!日媒力挺:马龙樊振东隐退中国队实力大减

颜小白的篮球梦
2026-05-10 08:32:23
人老了确实没太大意思,我妈今年72岁,独自在家每天就做这两件事

人老了确实没太大意思,我妈今年72岁,独自在家每天就做这两件事

心理观察局
2026-05-04 11:19:11
潘江:比赛主要输在篮板球上,对刘传兴的使用是赛前讨论过的

潘江:比赛主要输在篮板球上,对刘传兴的使用是赛前讨论过的

懂球帝
2026-05-10 22:57:35
从确诊到去世只15天,“央视最帅主持人”的遭遇给所有人提了个醒

从确诊到去世只15天,“央视最帅主持人”的遭遇给所有人提了个醒

娱小余
2026-05-10 23:40:39
特朗普懵了!最后一条路,也被堵死了!

特朗普懵了!最后一条路,也被堵死了!

大嘴说天下
2026-05-09 20:24:37
某地“日前”出现一例汉坦病毒致死病例

某地“日前”出现一例汉坦病毒致死病例

一个生物狗的科普小园
2026-05-10 08:51:13
预计11日1时至8时,济南历下区、市中区、槐荫区、天桥区、历城区、南山区和起步区将有雷阵雨,局部10级以上阵风!

预计11日1时至8时,济南历下区、市中区、槐荫区、天桥区、历城区、南山区和起步区将有雷阵雨,局部10级以上阵风!

鲁中晨报
2026-05-10 17:54:04
德媒主编访华归来:深圳街头看到的一幕,让我为欧洲捏了一把冷汗

德媒主编访华归来:深圳街头看到的一幕,让我为欧洲捏了一把冷汗

補懂事的孩紙
2026-05-10 15:27:34
“爱必享”糖果中检出“伟哥”?上海市监局回应

“爱必享”糖果中检出“伟哥”?上海市监局回应

闪电新闻
2026-05-09 13:01:47
5月10日俄乌:俄罗斯又耍无赖了

5月10日俄乌:俄罗斯又耍无赖了

山河路口
2026-05-10 20:11:00
不得不承认,俄罗斯已经走到了退无可退的悬崖边上!

不得不承认,俄罗斯已经走到了退无可退的悬崖边上!

阿七说史
2026-05-10 05:10:06
大伯出狱全家没人接,我开车去接他,他偷偷塞我一张卡说有1200万

大伯出狱全家没人接,我开车去接他,他偷偷塞我一张卡说有1200万

千秋文化
2026-05-09 20:08:48
一觉醒来,成了全球首富的老婆?和贝索斯太太撞名,22岁妹子被骂懵了...

一觉醒来,成了全球首富的老婆?和贝索斯太太撞名,22岁妹子被骂懵了...

英国那些事儿
2026-05-10 23:20:09
惯子如杀子!孩子这几种表现说明已经被惯坏了,再不改就来不及了

惯子如杀子!孩子这几种表现说明已经被惯坏了,再不改就来不及了

木言观
2026-04-29 22:28:49
全亚洲穿比基尼最好看的女人,身材到底有多迷人?

全亚洲穿比基尼最好看的女人,身材到底有多迷人?

书画艺术收藏
2026-04-03 19:30:09
奚梦瑶独自在香港逛街!手捂肚子表情好痛苦,小腹隆起引三胎猜疑

奚梦瑶独自在香港逛街!手捂肚子表情好痛苦,小腹隆起引三胎猜疑

漫婷侃娱乐
2026-05-07 22:25:01
值得警惕!万万没想到,伊朗真正的内鬼,根本不是人

值得警惕!万万没想到,伊朗真正的内鬼,根本不是人

华史谈
2026-05-10 09:19:37
阿斯:利物浦致电皇马,询问哈维-阿隆索接班斯洛特

阿斯:利物浦致电皇马,询问哈维-阿隆索接班斯洛特

懂球帝
2026-05-10 20:05:06
2026-05-11 01:16:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
894992文章数 5090857关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

旅游
教育
时尚
数码
本地

旅游要闻

重庆新增一夜景打卡点!磁器口步行街看大学生“脑洞”建筑

教育要闻

高考地理中的共享经济

真爱大牌|| 用了4年都不舍得换,终于把小贵的价格也磨下来了

数码要闻

你昂贵的DDR5内存可能是假货:穿着三星的马甲 心里却是SK海力士

本地新闻

用苏绣的方式,打开江西婺源

无障碍浏览 进入关怀版