网易首页 > 网易号 > 正文 申请入驻

辛顿、姚期智等联名签署“上海共识”,呼吁给AI确立行为红线

0
分享至

“国际社会应确立具体、可操作、受全球认可的红线,确保人工智能系统在任何情况下均不得逾越。”7月25日, 由杰弗里·辛顿(Geoffrey Hinton)、姚期智、本吉奥(Yoshua Bengio)、斯图尔特·罗素(Stuart Russell)等20余位行业专家、学者共同签署的AI安全国际对话上海共识(以下简称“上海共识”)正式对外公开。

参与签署的部分中外科学家 来源:IDAIS官网

此次对话是“AI安全国际对话”(International Dialogues on AI Safety - IDAIS)系列的一部分”。作为本次共识发起方之一,图灵奖得主、上海期智研究院的院长姚期智当日表示,“我越来越相信,人类终将找到解决方案。”

联名签署现场

2024年3月,辛顿、姚期智、罗素、本吉奥等专家曾共同签署“北京共识”,主张限制AI系统复制、欺骗、武器开发等行为,尤其呼吁行业为AI的研发和应用戴上“紧箍咒”,避免相关技术被滥用,推动全球治理机构构建。姚期智透露,18个月前举办第一次安全共识会议时,AGI强大的破坏力就已经显现,人类甚至难以阐明其失控机制,不过随着相关会议的推进,已经看到若干有关基于“设计的安全”(Safe by design)提案,这意味着实际上人类可以找到确保AI安全的可行路径。

此次“上海共识”指出,当前人类正处于一个关键转折点:人工智能系统正迅速接近并可能超越人类智能水平。这些未来的系统可能在操作者毫不知情的情况下,执行并非操作者所期望或预测的行动。这可能导致失控,即一个或多个通用人工智能系统脱离任何人的控制,从而带来灾难性甚至是生存层面的风险。当前,对于能够在更高级的通用人工智能超越人类智能水平后,仍可靠地确保其对齐,并保持人类的有效控制尚无可行方法。

多位与会专家在参与讨论时也提及,当前构建真正有约束力且值得信赖的国际AI安全框架难度高、风险大。

上海人工智能实验室主任周伯文教授指出,目前Make AI Safe(使得AI安全)最大的问题在于它是事后价值对齐、修补的、被动回应的,通常是防御成本过高而攻击成本过低。而Make Safe AI(构建安全的AI)是主动的、在线共同演进的,同时防御成本低,能够在各级风险上都保持应变能力。

周伯文认为,在一定程度上,训练一个模型变得友善和训练一个模型变得聪明可能是两条不同的技术路径。但当性能发展到某个程度,这两种能力可能很难分开处理——就像经典牛顿定律可以有效解释静止或慢速物体的运动,但是一旦逼近光速,这套理论就失效了。所以他认为,下一代模型的“善”与“智”未必能完全独立、分开发展,而是相互影响、共同进化的。

参与签署的专家之一,担任约翰·霍普金斯大学人工智能对齐与治理方向杰出教授吉莉恩·哈德菲尔 (Gillian Hadfield)在接受包括澎湃科技在内的媒体采访时指出,必须通过设立AI“红线”来推动Make AI Safe(使得AI安全),全世界需要跨国界合作。此外,要建立相应的AI安全合规系统。

为防范与纠正此类行为的技术路径与治理机制,“上海共识”提出应对策略,并呼吁采取三项关键行动:要求前沿人工智能开发者提供安全保障、通过加强国际协调,共同确立并恪守可验证的全球性行为红线、投资基于设计的安全人工智能研究。

其中,对于开发者来说,“上海共识”要求开发者在模型部署前应先进行全面的内部检查和第三方评估,提交高可信的安全案例,以及开展深入的模拟攻防与红队测试。若模型达到了关键能力阈值(比如检测模型是否具备帮助没有专业知识的非法分子制造生化武器的能力),开发者应向政府(在适当时亦可向公众)说明潜在风险。

此外,呼吁国际社会需要合作划出人工智能开发不可以逾越的红线(即“高压线”),这些红线应聚焦于人工智能系统的行为表现,其划定需同时考量系统执行特定行为的能力及其采取该行为的倾向性。为落实这些红线,各国应建立一个具备技术能力、具有国际包容性的协调机构,汇聚各国人工智能安全主管机构,以共享风险相关信息,并推动评估规程与验证方法的标准化。

“上海共识”指出,短期内亟须建立可扩展的监管机制以应对人工智能的欺骗问题、提升模型对“越狱”等攻击手段的抵御能力、强化信息安保投入等,而长期则需要一个“基于设计的安全”的架构,而非问题出现后才被动应对。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上海瑞金医院员工数大幅度减少上千人?

上海瑞金医院员工数大幅度减少上千人?

观星赏月
2026-03-07 21:30:52
杨尚昆和哈梅内伊的“三无”会见,杨尚昆说了几句转身就走

杨尚昆和哈梅内伊的“三无”会见,杨尚昆说了几句转身就走

犀利强哥
2026-03-04 21:40:54
比中国GDP高8.3%!没啥新科技,没啥新产业的欧盟,居然躺赢了

比中国GDP高8.3%!没啥新科技,没啥新产业的欧盟,居然躺赢了

南生今世说
2026-03-07 22:50:58
伊朗总统向邻国致歉:不再攻击邻国

伊朗总统向邻国致歉:不再攻击邻国

每日经济新闻
2026-03-07 16:12:23
印度回应美国30天豁免令:印方购买俄石油从不需要得到任何国家许可

印度回应美国30天豁免令:印方购买俄石油从不需要得到任何国家许可

财联社
2026-03-07 17:43:12
A股:紧急提醒2.5亿股民!从下周起,或许牛市历史总是惊人的相似

A股:紧急提醒2.5亿股民!从下周起,或许牛市历史总是惊人的相似

另子维爱读史
2026-03-07 19:02:07
迪拜黄金库存积压严重,正以折扣价出售;知情人士称贸易商为避免无限期支付仓储等成本,正提供较伦敦全球基准价格每盎司高达30美元的折扣

迪拜黄金库存积压严重,正以折扣价出售;知情人士称贸易商为避免无限期支付仓储等成本,正提供较伦敦全球基准价格每盎司高达30美元的折扣

潇湘晨报
2026-03-07 15:47:09
出兵朝鲜的前夜,政治局吵成一团,毛主席:你们都太小题大做

出兵朝鲜的前夜,政治局吵成一团,毛主席:你们都太小题大做

风飘飘而吹衣
2025-01-02 13:17:20
武汉见!中国女篮VS捷克,开球时间出炉,央视镜头为何总给女观众

武汉见!中国女篮VS捷克,开球时间出炉,央视镜头为何总给女观众

体育大学僧
2026-03-07 10:17:29
普京与伊朗总统通电话:必须立即停止美国对伊朗的军事行动

普京与伊朗总统通电话:必须立即停止美国对伊朗的军事行动

俄罗斯卫星通讯社
2026-03-07 16:11:02
国家发改委主任:新建、改扩建1000所普通高中,增加学位200万个以上,支持双一流高校本科扩招10万人以上

国家发改委主任:新建、改扩建1000所普通高中,增加学位200万个以上,支持双一流高校本科扩招10万人以上

极目新闻
2026-03-06 18:28:25
特朗普没想到:美伊大战打醒两个国家,一个是越南,一个是菲律宾

特朗普没想到:美伊大战打醒两个国家,一个是越南,一个是菲律宾

探索新高度
2026-03-07 23:24:06
整条烟没拆封,到底能放多久?多数人都放错,难怪好烟变“废烟”

整条烟没拆封,到底能放多久?多数人都放错,难怪好烟变“废烟”

水泥土的搞笑
2026-03-07 18:36:24
10万亿窟窿!比恒大更坑的民企来了,曾力压许家印,位居第一

10万亿窟窿!比恒大更坑的民企来了,曾力压许家印,位居第一

孤单是寂寞的毒
2026-03-04 15:38:03
食盐被关注!181个国家研究:吃得越咸,寿命或越长?告诉你真相

食盐被关注!181个国家研究:吃得越咸,寿命或越长?告诉你真相

垚垚分享健康
2026-03-07 18:50:09
OpenClaw养虾很火,但我劝普通人先别折腾

OpenClaw养虾很火,但我劝普通人先别折腾

董指导聊科技
2026-03-07 19:48:43
震惊,武汉某设计院被员工血泪控诉!

震惊,武汉某设计院被员工血泪控诉!

黯泉
2026-03-07 20:44:34
刘诗诗直播美的好权威,金丝眼镜+大波浪造型,让她美的发光了

刘诗诗直播美的好权威,金丝眼镜+大波浪造型,让她美的发光了

明星私服穿搭daily
2026-03-05 07:24:32
王楚钦孙颖莎空降重庆!卫冕冠军遇最大变数,梁靖崑复出成奇兵

王楚钦孙颖莎空降重庆!卫冕冠军遇最大变数,梁靖崑复出成奇兵

郭揦包工头
2026-03-08 03:44:09
春节过去还不到半个月,辛柏青传来喜讯,这次朱媛媛可以放心了

春节过去还不到半个月,辛柏青传来喜讯,这次朱媛媛可以放心了

跳跳历史
2026-03-08 03:48:18
2026-03-08 04:40:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
881041文章数 5088667关注度
往期回顾 全部

科技要闻

OpenClaw爆火,六位"养虾人"自述与AI共生

头条要闻

选举24小时内举行 伊朗今天或选出最高领袖

头条要闻

选举24小时内举行 伊朗今天或选出最高领袖

体育要闻

塔图姆298天走完这段路 只用27分钟征服这座城

娱乐要闻

汪小菲曝亲妈猛料,张兰公开财产分配

财经要闻

针对"不敢休、不让休"怪圈 国家出手了

汽车要闻

逃离ICU,上汽通用“止血”企稳

态度原创

手机
亲子
本地
游戏
公开课

手机要闻

网曝OPPO Find N6渲染图,或有橙色版本

亲子要闻

长辈劝你生娃的重要性尤其是女性!网友:年轻不懂,老了一定懂

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

外媒:Xbox新主机恐成微软绝唱!失败即退出硬件市场

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版