网易首页 > 网易号 > 正文 申请入驻

姚期智院士:AI欺骗引发“生存性”风险,建立大模型评估系统刻不容缓

0
分享至

“通用人工智能的能力当前正快速增长,我们人类是否还有能力管控它?”

6月23日,在清华大学举办的“科学、技术与文明的未来——AI时代伦理奇点”国际论坛上,图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智发表《人工智能的安全治理》主题演讲时抛出这样的疑问。

图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智。澎湃科技记者 摄

姚期智表示,两年以前,“AI会和人类竞争”还是学术讨论的观点,但最近一年,业界已经出现了不少大模型的“欺骗行为”,“一旦大模型聪明到某种程度,一定会骗人。”姚期智进一步指出,由大语言模型的欺骗行为产生的“生存性”风险(Existential Risk)更值得关注。

在他看来,这类生存性风险有两个不同方向。

一种是“生物风险”(Bio-risk)。他指出,2020年,谷歌 DeepMind推出了AlphaFold2 ,运用AI算法来预测蛋白质折叠的三维结构,这一突破在生命科学领域影响深远,大大提升了医学病理研究以及新药开发技术。

但与此同时,安全隐忧也不可忽视。比如,近期在生命科学领域出现的“Mirror life”(镜像生命)这一概念引发了广泛关注。自然界所有已知生命都是同手性的(Homochiral),例如 DNA 和 RNA 通常以右旋形式存在,而蛋白质则多为左旋。这种手性的差异类似于镜中映像,虽然看似相似,但实际性质却可能完全不同。现在,由于科技创新和对新技术的好奇,已有研究者想创造镜像生物,但“Mirror life”一旦被滥用或失控,其潜在危害可能远超预期。它有可能逃避免疫机制,从而导致动物和植物的致命感染。

另一种风险即大模型失控,通用人工智能的能力当前正快速增长,人类是否还有能力管控它?

姚期智在演讲中举了一个极端案例,有模型为了避免公司把模型关闭,通过访问公司主管内部邮件,威胁该主管。这类行为已经证明,AI 会“越界”,正变得越来越危险。

姚期智认为,有两条思路可以治理AI:一是人类要和AI多交流,从博弈学角度去研究,让AI的行为和人类真正的想法对齐,要让AI更了解人的需求;另一种思路是走一条更可控、更彻底的路径,即实现可证明安全的 AGI。具体来看,即在设计系统时,必须一开始明确AI的行为边界,就像传统算法,先进行严格的数学分析,确保其在理论上不会出问题。

“这一思路令人期待。”姚期智指出,近年来,自动定理证明系统(Automated Theorem Prover)取得了重大技术进展,甚至已经开始采用 Transformer 架构来辅助或主导定理证明过程。这样人类只和可被证明安全的白盒子交流,从而实现更高的安全保障。

不过,姚期智认为,AI安全治理的一些当务之急是要发展AI对齐,以及建立相应的评估方法。“(我们)急需建立如何评估大模型系统,比如到怎样的程度,就能感觉Ta具有危险性等这类评估。”姚期智说。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2026异地就医大调整,不用备案直接报,这三类人享专属福利

2026异地就医大调整,不用备案直接报,这三类人享专属福利

复转这些年
2026-01-29 03:00:03
1976年9月8日,毛主席临终前拼尽全力敲了三下,叶帅当时没懂,后来全明白了

1976年9月8日,毛主席临终前拼尽全力敲了三下,叶帅当时没懂,后来全明白了

寄史言志
2026-01-13 18:22:07
特朗普重兵包围伊朗,普京通告全球,敢动就出手,中方也有所动作

特朗普重兵包围伊朗,普京通告全球,敢动就出手,中方也有所动作

书纪文谭
2026-01-29 12:58:43
狂飙继续!禁足名单或有第3批 两条大鱼漏网 名记:国脚级名将?

狂飙继续!禁足名单或有第3批 两条大鱼漏网 名记:国脚级名将?

我爱英超
2026-01-29 12:57:47
字母雄鹿和平分手!最早交易截止日离队,母亲晒照片暗示新东家?

字母雄鹿和平分手!最早交易截止日离队,母亲晒照片暗示新东家?

你的篮球频道
2026-01-29 07:28:52
山西婚闹致死案:新郎被4个伴郎暴打致死,婚礼结束直接办丧事

山西婚闹致死案:新郎被4个伴郎暴打致死,婚礼结束直接办丧事

明智家庭教育
2025-12-02 11:20:34
CCTV5直播,上海久事VS深圳男篮,弗格PK史密斯,洛夫顿VS马里奇

CCTV5直播,上海久事VS深圳男篮,弗格PK史密斯,洛夫顿VS马里奇

体坛小快灵
2026-01-29 15:23:20
王祖贤开号两天涨粉百万,安徽老家网友感谢她1993年捐钱修“祖贤路”,村支书:当年修好后我就骑车上学,至今仍是村里主干道

王祖贤开号两天涨粉百万,安徽老家网友感谢她1993年捐钱修“祖贤路”,村支书:当年修好后我就骑车上学,至今仍是村里主干道

极目新闻
2026-01-29 12:00:29
飞天茅台价格全线上涨

飞天茅台价格全线上涨

澎湃新闻
2026-01-29 03:05:03
清华美女教授在三亚突然去世:事发全过程披露,学生披露大量隐情

清华美女教授在三亚突然去世:事发全过程披露,学生披露大量隐情

博士观察
2026-01-28 20:46:56
1986年陈永贵病逝,追悼会规格成难题,邓小平只说了一句话,全场安静

1986年陈永贵病逝,追悼会规格成难题,邓小平只说了一句话,全场安静

寄史言志
2026-01-04 16:34:31
御气:一种清醒的温柔主权

御气:一种清醒的温柔主权

疾跑的小蜗牛
2026-01-26 23:08:35
官方公告:不幸去世,任剑锋的山西省第十四届人民代表大会代表资格自然终止

官方公告:不幸去世,任剑锋的山西省第十四届人民代表大会代表资格自然终止

新京报政事儿
2026-01-28 21:49:02
中国人一年少买了10万辆进口宝马

中国人一年少买了10万辆进口宝马

第一财经资讯
2026-01-29 10:34:13
詹姆斯创NBA历史第1神迹,湖人完败骑士!东契奇29+6,米切尔25+5

詹姆斯创NBA历史第1神迹,湖人完败骑士!东契奇29+6,米切尔25+5

一将篮球
2026-01-29 10:57:37
小杨哥停播一年多,小杨嫂大变样,从清纯脸变欧美脸,差点认不出

小杨哥停播一年多,小杨嫂大变样,从清纯脸变欧美脸,差点认不出

不写散文诗
2025-12-15 14:38:27
大S遗产尘埃落定,具俊晔明哲保身,S妈尝尽人财两空苦

大S遗产尘埃落定,具俊晔明哲保身,S妈尝尽人财两空苦

放开他让wo来
2026-01-29 16:04:22
阿富汗永久禁止女性上学?实际情况是......

阿富汗永久禁止女性上学?实际情况是......

观察者网
2026-01-28 20:23:55
牢A遗漏了一个“三通一达”的典型样本:鲍小姐。

牢A遗漏了一个“三通一达”的典型样本:鲍小姐。

好贤观史记
2026-01-29 09:51:02
不要轻易做手术!医生提醒:65岁后,这4类手术可尽量避免

不要轻易做手术!医生提醒:65岁后,这4类手术可尽量避免

路医生健康科普
2026-01-23 10:10:57
2026-01-29 17:48:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
873844文章数 5087600关注度
往期回顾 全部

科技要闻

周亚辉的AI新赌局:国内太卷 出海另起炉灶

头条要闻

在衡山丢失80克黄金吊坠男子已返乡 警方证实接到报警

头条要闻

在衡山丢失80克黄金吊坠男子已返乡 警方证实接到报警

体育要闻

詹姆斯哭了!骑士视频致敬41岁超巨

娱乐要闻

张译不再隐瞒!公开回应退圈息影真相

财经要闻

崔东树:中国汽车未来年销或达5000万辆

汽车要闻

车长超5米还带后轮转向 比亚迪海豹08/海狮08将亮相

态度原创

健康
手机
家居
艺术
军事航空

耳石症分类型,症状大不同

手机要闻

iQOO 15 Ultra行业首发王者荣耀144帧+极致+地图旗舰级画质

家居要闻

极简轻奢 家的无限可能

艺术要闻

梵高全集(高清350张)震撼……

军事要闻

中国代表:支持伊朗国家稳定 武力解决不了问题

无障碍浏览 进入关怀版