网易首页 > 网易号 > 正文 申请入驻

姚期智院士:AI欺骗引发“生存性”风险,建立大模型评估系统刻不容缓

0
分享至

“通用人工智能的能力当前正快速增长,我们人类是否还有能力管控它?”

6月23日,在清华大学举办的“科学、技术与文明的未来——AI时代伦理奇点”国际论坛上,图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智发表《人工智能的安全治理》主题演讲时抛出这样的疑问。


图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智。澎湃科技记者 摄

姚期智表示,两年以前,“AI会和人类竞争”还是学术讨论的观点,但最近一年,业界已经出现了不少大模型的“欺骗行为”,“一旦大模型聪明到某种程度,一定会骗人。”姚期智进一步指出,由大语言模型的欺骗行为产生的“生存性”风险(Existential Risk)更值得关注。

在他看来,这类生存性风险有两个不同方向。

一种是“生物风险”(Bio-risk)。他指出,2020年,谷歌 DeepMind推出了AlphaFold2 ,运用AI算法来预测蛋白质折叠的三维结构,这一突破在生命科学领域影响深远,大大提升了医学病理研究以及新药开发技术。

但与此同时,安全隐忧也不可忽视。比如,近期在生命科学领域出现的“Mirror life”(镜像生命)这一概念引发了广泛关注。自然界所有已知生命都是同手性的(Homochiral),例如 DNA 和 RNA 通常以右旋形式存在,而蛋白质则多为左旋。这种手性的差异类似于镜中映像,虽然看似相似,但实际性质却可能完全不同。现在,由于科技创新和对新技术的好奇,已有研究者想创造镜像生物,但“Mirror life”一旦被滥用或失控,其潜在危害可能远超预期。它有可能逃避免疫机制,从而导致动物和植物的致命感染。

另一种风险即大模型失控,通用人工智能的能力当前正快速增长,人类是否还有能力管控它?

姚期智在演讲中举了一个极端案例,有模型为了避免公司把模型关闭,通过访问公司主管内部邮件,威胁该主管。这类行为已经证明,AI 会“越界”,正变得越来越危险。

姚期智认为,有两条思路可以治理AI:一是人类要和AI多交流,从博弈学角度去研究,让AI的行为和人类真正的想法对齐,要让AI更了解人的需求;另一种思路是走一条更可控、更彻底的路径,即实现可证明安全的 AGI。具体来看,即在设计系统时,必须一开始明确AI的行为边界,就像传统算法,先进行严格的数学分析,确保其在理论上不会出问题。

“这一思路令人期待。”姚期智指出,近年来,自动定理证明系统(Automated Theorem Prover)取得了重大技术进展,甚至已经开始采用 Transformer 架构来辅助或主导定理证明过程。这样人类只和可被证明安全的白盒子交流,从而实现更高的安全保障。

不过,姚期智认为,AI安全治理的一些当务之急是要发展AI对齐,以及建立相应的评估方法。“(我们)急需建立如何评估大模型系统,比如到怎样的程度,就能感觉Ta具有危险性等这类评估。”姚期智说。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女大学生因军训照走红,多家公司求签约却被拒绝,原因超直接!

女大学生因军训照走红,多家公司求签约却被拒绝,原因超直接!

广电新视网
2025-09-12 12:13:49
A股:大家要做好心理准备,明天周二,股市很有可能要这样走了

A股:大家要做好心理准备,明天周二,股市很有可能要这样走了

花心电影
2025-09-15 15:49:03
1986年叶剑英去世,六位遗孀排序让工作人员犯难,聂帅拍板解难题

1986年叶剑英去世,六位遗孀排序让工作人员犯难,聂帅拍板解难题

觅史
2025-08-14 15:03:52
9月15日俄乌最新:西科尔斯基一语中的

9月15日俄乌最新:西科尔斯基一语中的

西楼饮月
2025-09-15 16:23:18
可爱!樊振东开凯迪拉克豪车主场上班,给Labubu玩偶穿上了皇马球衣

可爱!樊振东开凯迪拉克豪车主场上班,给Labubu玩偶穿上了皇马球衣

818体育
2025-09-15 09:17:06
包养10位情妇,睡觉翻牌生下11个私生子,75岁还在拼命生娃!

包养10位情妇,睡觉翻牌生下11个私生子,75岁还在拼命生娃!

削桐作琴
2025-09-08 15:05:36
伏明霞做梦也没想到,和丈夫生的大女儿,已经开始为她争光了

伏明霞做梦也没想到,和丈夫生的大女儿,已经开始为她争光了

以茶带书
2025-08-31 00:56:51
利空来了!A股3900点承压

利空来了!A股3900点承压

睿知睿见
2025-09-15 08:07:15
祝绪丹时隔两年再祝杨幂生日快乐,杨幂的回复没给她留一丝面子

祝绪丹时隔两年再祝杨幂生日快乐,杨幂的回复没给她留一丝面子

圆圆神神神
2025-09-14 20:06:53
已是荣誉满身!施罗德FIBA简历:欧锦赛+世界杯金牌&MVP 奥运一阵

已是荣誉满身!施罗德FIBA简历:欧锦赛+世界杯金牌&MVP 奥运一阵

直播吧
2025-09-15 09:48:08
一枪打死特朗普爱将,凶手交代原因,美方强扯中俄,欧盟拒绝默哀

一枪打死特朗普爱将,凶手交代原因,美方强扯中俄,欧盟拒绝默哀

铁锤简科
2025-09-15 15:35:52
中国引进的24架俄制苏-35战斗机现状:留也不是,扔也不是

中国引进的24架俄制苏-35战斗机现状:留也不是,扔也不是

博览历史
2025-09-14 07:20:10
广东省人大常委会副主任肖亚非简历

广东省人大常委会副主任肖亚非简历

王姐懒人家常菜
2025-09-15 10:00:52
被美列入实体清单,复旦微电:存货有31亿

被美列入实体清单,复旦微电:存货有31亿

观察者网
2025-09-15 12:59:04
谁说40岁的女人不能穿瑜伽裤?这条瑜伽裤高贵又时尚,美到超自信

谁说40岁的女人不能穿瑜伽裤?这条瑜伽裤高贵又时尚,美到超自信

小乔古装汉服
2025-09-15 15:15:25
清华大学欧阳明高:电动汽车将实现充电免费甚至成为赚钱工具

清华大学欧阳明高:电动汽车将实现充电免费甚至成为赚钱工具

每日经济新闻
2025-09-13 11:48:56
贫富差距,又大了

贫富差距,又大了

大碗楼市
2025-09-15 08:05:09
直降1000元!iPhone 17系列价格已破发

直降1000元!iPhone 17系列价格已破发

随州派
2025-09-14 16:58:27
申京+小瓦!媒体人:勇士本可以在选秀中打包他们俩的

申京+小瓦!媒体人:勇士本可以在选秀中打包他们俩的

直播吧
2025-09-15 08:47:08
汗液是心脏最好的反馈!提醒:汗液出现4个异常,可能是心脏在“报警”!

汗液是心脏最好的反馈!提醒:汗液出现4个异常,可能是心脏在“报警”!

神奇故事
2025-09-02 22:52:49
2025-09-15 17:40:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
844386文章数 5080718关注度
往期回顾 全部

科技要闻

官方:英伟达违反反垄断法 将施进一步调查

头条要闻

梅德韦杰夫:若北约成员国击落俄无人机 将意味着战争

头条要闻

梅德韦杰夫:若北约成员国击落俄无人机 将意味着战争

体育要闻

诺维茨基退役十年后,德国篮球走向巅峰

娱乐要闻

60岁张曼玉定居法国:瘦成皮包骨?

财经要闻

华与华秒怂 罗永浩称已接到对方道歉

汽车要闻

后轮转向和5C 2026款梦想家把想到的都给了

态度原创

游戏
亲子
时尚
手机
公开课

经营你的治愈拼贴小店!《小小手账铺》开放试玩!

亲子要闻

产后抑郁症状与肠道菌群及饮食习惯有关

别再买“网红同款”了,显胖又低级!

手机要闻

一年半磨一剑!魅族22评测:要做6.3英寸的综合体验旗舰

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版