网易首页 > 网易号 > 正文 申请入驻

姚期智院士:AI欺骗引发“生存性”风险,建立大模型评估系统刻不容缓

0
分享至

“通用人工智能的能力当前正快速增长,我们人类是否还有能力管控它?”

6月23日,在清华大学举办的“科学、技术与文明的未来——AI时代伦理奇点”国际论坛上,图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智发表《人工智能的安全治理》主题演讲时抛出这样的疑问。

图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智。澎湃科技记者 摄

姚期智表示,两年以前,“AI会和人类竞争”还是学术讨论的观点,但最近一年,业界已经出现了不少大模型的“欺骗行为”,“一旦大模型聪明到某种程度,一定会骗人。”姚期智进一步指出,由大语言模型的欺骗行为产生的“生存性”风险(Existential Risk)更值得关注。

在他看来,这类生存性风险有两个不同方向。

一种是“生物风险”(Bio-risk)。他指出,2020年,谷歌 DeepMind推出了AlphaFold2 ,运用AI算法来预测蛋白质折叠的三维结构,这一突破在生命科学领域影响深远,大大提升了医学病理研究以及新药开发技术。

但与此同时,安全隐忧也不可忽视。比如,近期在生命科学领域出现的“Mirror life”(镜像生命)这一概念引发了广泛关注。自然界所有已知生命都是同手性的(Homochiral),例如 DNA 和 RNA 通常以右旋形式存在,而蛋白质则多为左旋。这种手性的差异类似于镜中映像,虽然看似相似,但实际性质却可能完全不同。现在,由于科技创新和对新技术的好奇,已有研究者想创造镜像生物,但“Mirror life”一旦被滥用或失控,其潜在危害可能远超预期。它有可能逃避免疫机制,从而导致动物和植物的致命感染。

另一种风险即大模型失控,通用人工智能的能力当前正快速增长,人类是否还有能力管控它?

姚期智在演讲中举了一个极端案例,有模型为了避免公司把模型关闭,通过访问公司主管内部邮件,威胁该主管。这类行为已经证明,AI 会“越界”,正变得越来越危险。

姚期智认为,有两条思路可以治理AI:一是人类要和AI多交流,从博弈学角度去研究,让AI的行为和人类真正的想法对齐,要让AI更了解人的需求;另一种思路是走一条更可控、更彻底的路径,即实现可证明安全的 AGI。具体来看,即在设计系统时,必须一开始明确AI的行为边界,就像传统算法,先进行严格的数学分析,确保其在理论上不会出问题。

“这一思路令人期待。”姚期智指出,近年来,自动定理证明系统(Automated Theorem Prover)取得了重大技术进展,甚至已经开始采用 Transformer 架构来辅助或主导定理证明过程。这样人类只和可被证明安全的白盒子交流,从而实现更高的安全保障。

不过,姚期智认为,AI安全治理的一些当务之急是要发展AI对齐,以及建立相应的评估方法。“(我们)急需建立如何评估大模型系统,比如到怎样的程度,就能感觉Ta具有危险性等这类评估。”姚期智说。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
医生:肝癌最危险信号,不是腹痛,而是频繁出现这几种异常

医生:肝癌最危险信号,不是腹痛,而是频繁出现这几种异常

芹姐说生活
2026-04-21 16:24:11
联合国秘书长发言人在记者会上用中文问好 并表示希望联合国的多语种服务越来越好

联合国秘书长发言人在记者会上用中文问好 并表示希望联合国的多语种服务越来越好

每日经济新闻
2026-04-21 14:32:56
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
研究表明:男性嫖娼率6.4%,女性出轨率15%,且越有钱越开放!

研究表明:男性嫖娼率6.4%,女性出轨率15%,且越有钱越开放!

黯泉
2026-04-01 17:28:39
全网震惊!买超暗度陈仓被戳穿,邵晴是幌子,真嫂子身份浮出水面

全网震惊!买超暗度陈仓被戳穿,邵晴是幌子,真嫂子身份浮出水面

一盅情怀
2026-04-21 19:22:53
存款大局已定!若无意外,2026年银行利率或将迎来4大变化

存款大局已定!若无意外,2026年银行利率或将迎来4大变化

复转这些年
2026-04-21 18:33:57
四川突放大招!27家银行同一天解散,储户存款怎么办?

四川突放大招!27家银行同一天解散,储户存款怎么办?

说故事的阿袭
2026-04-21 16:56:44
白人女性与黑人女性的体味差异,网友真实分享引发热议

白人女性与黑人女性的体味差异,网友真实分享引发热议

特约前排观众
2025-12-22 00:20:06
德国前女足球员塔玛拉在生下二娃几天后不幸离世,年仅32岁

德国前女足球员塔玛拉在生下二娃几天后不幸离世,年仅32岁

懂球帝
2026-04-21 10:23:08
Opta更新英超降级概率:热刺升至58.3%,西汉姆联36.9%

Opta更新英超降级概率:热刺升至58.3%,西汉姆联36.9%

懂球帝
2026-04-22 01:35:10
林涛卸任国务院副秘书长,已任厦门市委书记(附简历)

林涛卸任国务院副秘书长,已任厦门市委书记(附简历)

中国城市报
2026-04-21 22:11:52
两性关系:不管你信不信,女性过了56岁后,基本都有这5个现状

两性关系:不管你信不信,女性过了56岁后,基本都有这5个现状

娱乐洞察点点
2026-04-22 00:03:09
浦东机场坐出租车,被“转包”后遭“天价车费”!司机不开发票,驾车撞人

浦东机场坐出租车,被“转包”后遭“天价车费”!司机不开发票,驾车撞人

新民晚报
2026-04-21 18:29:27
正式复出?杜兰特发声,官宣决定,右膝伤情曝光,谁注意训练情况

正式复出?杜兰特发声,官宣决定,右膝伤情曝光,谁注意训练情况

天光破云来
2026-04-22 00:32:24
普通家庭千万不要买“小联排别墅”,看着很高级,住着却难受!

普通家庭千万不要买“小联排别墅”,看着很高级,住着却难受!

装修秀
2026-04-20 10:50:03
歼10直飞伊朗,美以都没敢拦!谁也没想到,背后藏着一个天大的局

歼10直飞伊朗,美以都没敢拦!谁也没想到,背后藏着一个天大的局

寻墨阁
2026-04-20 18:51:46
美国开始退钱了:涉33万企业1650亿美元,多数涉及中国

美国开始退钱了:涉33万企业1650亿美元,多数涉及中国

观察者网
2026-04-21 10:56:03
真相找到了!3月我国低价给日本出口天然气,其实是一场中转误会

真相找到了!3月我国低价给日本出口天然气,其实是一场中转误会

南生今世说
2026-04-21 18:59:12
A股:刚刚,国务院重磅发布,释放一信号,明日很可能迎来新变化

A股:刚刚,国务院重磅发布,释放一信号,明日很可能迎来新变化

另子维爱读史
2026-04-21 19:57:07
特朗普已做好开战准备?王毅曾警告:中美一旦冲突,结局只剩一个

特朗普已做好开战准备?王毅曾警告:中美一旦冲突,结局只剩一个

蜉蝣说
2026-04-21 11:23:11
2026-04-22 01:52:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
890965文章数 5090249关注度
往期回顾 全部

科技要闻

创造4万亿帝国、访华20次,库克留下了什么

头条要闻

三国取消飞航许可 赖清德无法窜访斯威士兰

头条要闻

三国取消飞航许可 赖清德无法窜访斯威士兰

体育要闻

一到NBA季后赛,四届DPOY就成了主角

娱乐要闻

宋承炫晒宝宝B超照,宣布老婆怀孕

财经要闻

现实是最大的荒诞:千亿平台的冲突始末

汽车要闻

全新坦克700正式上市 售价42.8万-50.8万元

态度原创

教育
数码
房产
健康
公开课

教育要闻

对不起,我有点“抠”

数码要闻

大疆发布Osmo Mobile 8P:售899元 分体式遥控器设计

房产要闻

年薪40-50万!海南地产圈还在猛招人

干细胞抗衰4大误区,90%的人都中招

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版