网易首页 > 网易号 > 正文 申请入驻

姚期智院士:AI欺骗引发“生存性”风险,建立大模型评估系统刻不容缓

0
分享至

“通用人工智能的能力当前正快速增长,我们人类是否还有能力管控它?”

6月23日,在清华大学举办的“科学、技术与文明的未来——AI时代伦理奇点”国际论坛上,图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智发表《人工智能的安全治理》主题演讲时抛出这样的疑问。

图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智。澎湃科技记者 摄

姚期智表示,两年以前,“AI会和人类竞争”还是学术讨论的观点,但最近一年,业界已经出现了不少大模型的“欺骗行为”,“一旦大模型聪明到某种程度,一定会骗人。”姚期智进一步指出,由大语言模型的欺骗行为产生的“生存性”风险(Existential Risk)更值得关注。

在他看来,这类生存性风险有两个不同方向。

一种是“生物风险”(Bio-risk)。他指出,2020年,谷歌 DeepMind推出了AlphaFold2 ,运用AI算法来预测蛋白质折叠的三维结构,这一突破在生命科学领域影响深远,大大提升了医学病理研究以及新药开发技术。

但与此同时,安全隐忧也不可忽视。比如,近期在生命科学领域出现的“Mirror life”(镜像生命)这一概念引发了广泛关注。自然界所有已知生命都是同手性的(Homochiral),例如 DNA 和 RNA 通常以右旋形式存在,而蛋白质则多为左旋。这种手性的差异类似于镜中映像,虽然看似相似,但实际性质却可能完全不同。现在,由于科技创新和对新技术的好奇,已有研究者想创造镜像生物,但“Mirror life”一旦被滥用或失控,其潜在危害可能远超预期。它有可能逃避免疫机制,从而导致动物和植物的致命感染。

另一种风险即大模型失控,通用人工智能的能力当前正快速增长,人类是否还有能力管控它?

姚期智在演讲中举了一个极端案例,有模型为了避免公司把模型关闭,通过访问公司主管内部邮件,威胁该主管。这类行为已经证明,AI 会“越界”,正变得越来越危险。

姚期智认为,有两条思路可以治理AI:一是人类要和AI多交流,从博弈学角度去研究,让AI的行为和人类真正的想法对齐,要让AI更了解人的需求;另一种思路是走一条更可控、更彻底的路径,即实现可证明安全的 AGI。具体来看,即在设计系统时,必须一开始明确AI的行为边界,就像传统算法,先进行严格的数学分析,确保其在理论上不会出问题。

“这一思路令人期待。”姚期智指出,近年来,自动定理证明系统(Automated Theorem Prover)取得了重大技术进展,甚至已经开始采用 Transformer 架构来辅助或主导定理证明过程。这样人类只和可被证明安全的白盒子交流,从而实现更高的安全保障。

不过,姚期智认为,AI安全治理的一些当务之急是要发展AI对齐,以及建立相应的评估方法。“(我们)急需建立如何评估大模型系统,比如到怎样的程度,就能感觉Ta具有危险性等这类评估。”姚期智说。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“牛鬼蛇神”扎堆,春晚第二次联排让人大失所望,网友们坐不住了

“牛鬼蛇神”扎堆,春晚第二次联排让人大失所望,网友们坐不住了

深析古今
2026-01-26 18:22:14
获“救命钱”后,贾国龙摊牌:累计亏损将超6亿!他终于认清自己

获“救命钱”后,贾国龙摊牌:累计亏损将超6亿!他终于认清自己

社会日日鲜
2026-01-27 13:22:49
两性关系:不管你信不信,男性过了68岁,基本都有这七个常见状态

两性关系:不管你信不信,男性过了68岁,基本都有这七个常见状态

健康科普365
2026-01-28 11:04:57
北京国安硬刚足协:人在做天在看!媒体人热议:手动点赞跟丫死磕

北京国安硬刚足协:人在做天在看!媒体人热议:手动点赞跟丫死磕

奥拜尔
2026-01-29 14:15:08
阿门拒投一战遭休媒狂批:4米无人不敢投 可作交易筹码 绝非球星

阿门拒投一战遭休媒狂批:4米无人不敢投 可作交易筹码 绝非球星

颜小白的篮球梦
2026-01-29 13:34:35
乌克兰击落价值3500万美元的俄Su-34战斗机

乌克兰击落价值3500万美元的俄Su-34战斗机

桂系007
2026-01-29 13:00:04
一场追悼会,戳穿梁小龙在香港的真实地位,原来成龙没说谎!

一场追悼会,戳穿梁小龙在香港的真实地位,原来成龙没说谎!

叨唠
2026-01-27 03:28:08
阿富汗的锅,拜登不背!

阿富汗的锅,拜登不背!

山河路口
2026-01-28 23:12:39
张雨绮历任男友从年上到年下,从导演到富商,主打一个雨露均沾!

张雨绮历任男友从年上到年下,从导演到富商,主打一个雨露均沾!

东方不败然多多
2026-01-29 07:39:09
1958年刘亚楼放狠话:空军我说了算,毛主席来也没用!被告到中南海后,主席的反应绝了

1958年刘亚楼放狠话:空军我说了算,毛主席来也没用!被告到中南海后,主席的反应绝了

寄史言志
2026-01-27 10:57:28
不管你信不信!本赛季总冠军:将从这5支球队中产生!

不管你信不信!本赛季总冠军:将从这5支球队中产生!

运筹帷幄的篮球
2026-01-29 15:01:10
人社部传来好消息!1.5亿退休老人高兴了,2026年养老金或再调整

人社部传来好消息!1.5亿退休老人高兴了,2026年养老金或再调整

梁讯
2026-01-29 10:44:15
俄方邀请泽连斯基:莫斯科见普京!我们保障安全

俄方邀请泽连斯基:莫斯科见普京!我们保障安全

看看新闻Knews
2026-01-29 09:25:02
14天花3.7万在民营医院看男科,症状没明显改善;公立医院:有的病症是无中生有

14天花3.7万在民营医院看男科,症状没明显改善;公立医院:有的病症是无中生有

大风新闻
2026-01-29 12:50:12
婆婆当了近四十年的老师,今年刚好退休,我还以为退休金最多4000

婆婆当了近四十年的老师,今年刚好退休,我还以为退休金最多4000

五元讲堂
2026-01-26 11:26:26
今明两天!中央八套 江苏卫视将播2部新剧!阵容豪华,开播必火

今明两天!中央八套 江苏卫视将播2部新剧!阵容豪华,开播必火

手工制作阿歼
2026-01-29 13:22:04
申花津门虎为何遭重罚?媒体人热议:烂兄烂弟,再次受罚属于惯犯

申花津门虎为何遭重罚?媒体人热议:烂兄烂弟,再次受罚属于惯犯

奥拜尔
2026-01-29 11:15:54
白骨案受害者儿子再曝扎心细节:当年凶手被抓后又放 原因很心酸

白骨案受害者儿子再曝扎心细节:当年凶手被抓后又放 原因很心酸

有范又有料
2026-01-29 11:20:59
曝美方私下对伊朗开4大要求,特朗普再次威胁“时间不多了!”沙特阿联酋拒借领空

曝美方私下对伊朗开4大要求,特朗普再次威胁“时间不多了!”沙特阿联酋拒借领空

红星新闻
2026-01-29 14:28:15
黄仁勋又出圈!英伟达员工年终奖曝光,网友破大防

黄仁勋又出圈!英伟达员工年终奖曝光,网友破大防

雷科技
2026-01-28 18:54:37
2026-01-29 15:44:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
873844文章数 5087592关注度
往期回顾 全部

科技要闻

周亚辉的AI新赌局:国内太卷 出海另起炉灶

头条要闻

外媒:特朗普执政一年后 对华不友好国家正"转向"中国

头条要闻

外媒:特朗普执政一年后 对华不友好国家正"转向"中国

体育要闻

詹姆斯哭了!骑士视频致敬41岁超巨

娱乐要闻

张译不再隐瞒!公开回应退圈息影真相

财经要闻

金价狂飙,历史首次!

汽车要闻

车长超5米还带后轮转向 比亚迪海豹08/海狮08将亮相

态度原创

艺术
亲子
房产
游戏
公开课

艺术要闻

梵高全集(高清350张)震撼……

亲子要闻

近年来,全国一流重点大学“牵手”河南,在家门口也能享受优质教育资源

房产要闻

创历史新高!三亚楼市,太强了!

《三角洲行动》S8赛季试玩:航天大改,地震来袭!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版