网易首页 > 网易号 > 正文 申请入驻

姚期智院士:AI欺骗引发“生存性”风险,建立大模型评估系统刻不容缓

0
分享至

“通用人工智能的能力当前正快速增长,我们人类是否还有能力管控它?”

6月23日,在清华大学举办的“科学、技术与文明的未来——AI时代伦理奇点”国际论坛上,图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智发表《人工智能的安全治理》主题演讲时抛出这样的疑问。

图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智。澎湃科技记者 摄

姚期智表示,两年以前,“AI会和人类竞争”还是学术讨论的观点,但最近一年,业界已经出现了不少大模型的“欺骗行为”,“一旦大模型聪明到某种程度,一定会骗人。”姚期智进一步指出,由大语言模型的欺骗行为产生的“生存性”风险(Existential Risk)更值得关注。

在他看来,这类生存性风险有两个不同方向。

一种是“生物风险”(Bio-risk)。他指出,2020年,谷歌 DeepMind推出了AlphaFold2 ,运用AI算法来预测蛋白质折叠的三维结构,这一突破在生命科学领域影响深远,大大提升了医学病理研究以及新药开发技术。

但与此同时,安全隐忧也不可忽视。比如,近期在生命科学领域出现的“Mirror life”(镜像生命)这一概念引发了广泛关注。自然界所有已知生命都是同手性的(Homochiral),例如 DNA 和 RNA 通常以右旋形式存在,而蛋白质则多为左旋。这种手性的差异类似于镜中映像,虽然看似相似,但实际性质却可能完全不同。现在,由于科技创新和对新技术的好奇,已有研究者想创造镜像生物,但“Mirror life”一旦被滥用或失控,其潜在危害可能远超预期。它有可能逃避免疫机制,从而导致动物和植物的致命感染。

另一种风险即大模型失控,通用人工智能的能力当前正快速增长,人类是否还有能力管控它?

姚期智在演讲中举了一个极端案例,有模型为了避免公司把模型关闭,通过访问公司主管内部邮件,威胁该主管。这类行为已经证明,AI 会“越界”,正变得越来越危险。

姚期智认为,有两条思路可以治理AI:一是人类要和AI多交流,从博弈学角度去研究,让AI的行为和人类真正的想法对齐,要让AI更了解人的需求;另一种思路是走一条更可控、更彻底的路径,即实现可证明安全的 AGI。具体来看,即在设计系统时,必须一开始明确AI的行为边界,就像传统算法,先进行严格的数学分析,确保其在理论上不会出问题。

“这一思路令人期待。”姚期智指出,近年来,自动定理证明系统(Automated Theorem Prover)取得了重大技术进展,甚至已经开始采用 Transformer 架构来辅助或主导定理证明过程。这样人类只和可被证明安全的白盒子交流,从而实现更高的安全保障。

不过,姚期智认为,AI安全治理的一些当务之急是要发展AI对齐,以及建立相应的评估方法。“(我们)急需建立如何评估大模型系统,比如到怎样的程度,就能感觉Ta具有危险性等这类评估。”姚期智说。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女子和男网友去私人影院,自述手都伸进去了,事后被拉黑

女子和男网友去私人影院,自述手都伸进去了,事后被拉黑

一杯浓茶
2026-04-23 20:55:03
穆帅:我会在赛季后10天内决定未来;奥塔门迪去留由他决定

穆帅:我会在赛季后10天内决定未来;奥塔门迪去留由他决定

懂球帝
2026-04-25 04:20:06
日舰闯台海3天后,高市被逼辞职,岸田已扛旗,052D抵近奄美大岛

日舰闯台海3天后,高市被逼辞职,岸田已扛旗,052D抵近奄美大岛

铁锤侃侃而谈
2026-04-21 15:00:04
嗜赌成性只是冰山一角,婚内出轨、睡有妇之夫,体坛丑闻毁三观

嗜赌成性只是冰山一角,婚内出轨、睡有妇之夫,体坛丑闻毁三观

梦想总会变成真
2026-04-23 01:11:47
真的慌了!看了ChatGPT Images 2.0一键生成的PPT,我们吓出一身冷汗……

真的慌了!看了ChatGPT Images 2.0一键生成的PPT,我们吓出一身冷汗……

秋叶PPT
2026-04-23 08:22:02
继人民日报发声后,官媒再次三问董宇辉,言辞犀利,字字揭他老底

继人民日报发声后,官媒再次三问董宇辉,言辞犀利,字字揭他老底

离离言几许
2026-04-23 20:04:00
何塞·穆里尼奥确认“皇马条款”,重燃回归伯纳乌传闻

何塞·穆里尼奥确认“皇马条款”,重燃回归伯纳乌传闻

绿茵情报局
2026-04-25 01:20:20
秦皇岛大姐逃单偷狗后续:正脸曝光,被人认出已社死,摊主不和解

秦皇岛大姐逃单偷狗后续:正脸曝光,被人认出已社死,摊主不和解

奇思妙想草叶君
2026-04-24 11:33:43
局势恶化!日本开出危险一枪,中国红线遭踩踏,东部战区行动了

局势恶化!日本开出危险一枪,中国红线遭踩踏,东部战区行动了

云舟史策
2026-04-23 07:32:35
炸锅!美部长当众承认:中国一颗H200芯片没买

炸锅!美部长当众承认:中国一颗H200芯片没买

林子说事
2026-04-23 17:52:16
4月26日至29日南方地区将有强降雨过程 警惕次生灾害

4月26日至29日南方地区将有强降雨过程 警惕次生灾害

中国气象局
2026-04-24 20:31:14
以牙还牙,中国打响反制第一枪,一举切断美欧命脉,美欧坐立难安

以牙还牙,中国打响反制第一枪,一举切断美欧命脉,美欧坐立难安

凡知
2026-04-24 17:49:57
已失联十余日 48岁中国羽协主席被带走调查 曾蝉联奥运会混双金牌

已失联十余日 48岁中国羽协主席被带走调查 曾蝉联奥运会混双金牌

我爱英超
2026-04-24 23:18:47
从拜登曲线到弗吉尼亚公投逆转:民主党这次注定栽了

从拜登曲线到弗吉尼亚公投逆转:民主党这次注定栽了

斌闻天下
2026-04-24 07:10:03
广东91-93不敌福建 球员评价:4人优秀,8人低迷

广东91-93不敌福建 球员评价:4人优秀,8人低迷

篮球资讯达人
2026-04-24 21:36:08
离医院仅3公里男童被呛窒息死亡,家属:打120后21分钟才出车

离医院仅3公里男童被呛窒息死亡,家属:打120后21分钟才出车

朗威谈星座
2026-04-25 03:55:39
维埃拉:哲凯赖什在无球状态下非常努力,不知为什么没人传球

维埃拉:哲凯赖什在无球状态下非常努力,不知为什么没人传球

懂球帝
2026-04-25 03:58:14
12岁女童被父亲家暴致轻伤二级,不敢联系亲妈怕离婚时“不允许联系”的规定对母亲不利

12岁女童被父亲家暴致轻伤二级,不敢联系亲妈怕离婚时“不允许联系”的规定对母亲不利

观威海
2026-04-23 10:12:05
LG财阀内斗:百亿美元商业帝国争夺战,比韩剧还刺激

LG财阀内斗:百亿美元商业帝国争夺战,比韩剧还刺激

正解局
2026-04-24 14:57:24
CBA宣布离谱决定

CBA宣布离谱决定

宗介说体育
2026-04-24 09:57:42
2026-04-25 05:16:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
891905文章数 5090368关注度
往期回顾 全部

科技要闻

DeepSeek V4牵手华为,价格依然"屠夫级"

头条要闻

航班提前起飞10分钟 大学生把海航告了

头条要闻

航班提前起飞10分钟 大学生把海航告了

体育要闻

上海男篮23连胜+主场全胜 姚明之后最强一季

娱乐要闻

停工16个月!赵露思证实接拍新剧

财经要闻

LG财阀内斗:百亿美元商业帝国争夺战

汽车要闻

零跑Lafa5 Ultra北京车展上市:11.88-12.48万

态度原创

艺术
房产
教育
公开课
军事航空

艺术要闻

世界最高20座大楼,你见过几栋?

房产要闻

新一轮教育大爆发来了!海口,开始疯狂建学校!

教育要闻

帝国理工IC相当于国内什么大学?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美伊陷入互相封锁僵局

无障碍浏览 进入关怀版