网易首页 > 网易号 > 正文 申请入驻

DeepMind撰文:AGI伤害人类的几种方式

0
分享至

如果您希望可以时常见面,欢迎标星收藏哦~

来源:内容编译自ars,谢谢。

随着人工智能炒作席卷互联网,科技和商业领袖已经开始展望下一步。AGI,即通用人工智能,是指具有类似人类的智能和能力的机器。如果当今的人工智能系统正在走向 AGI,我们将需要新的方法来确保这种机器不会违背人类的利益。

不幸的是,我们没有像艾萨克·阿西莫夫的机器人三定律那样优雅的东西。Google DeepMind 的研究人员一直在研究这个问题,并发布了一篇新的技术论文(PDF),解释了如何安全地开发 AGI,您可以随时下载。

这篇论文包含大量细节,除参考文献外总共有 108 页。尽管人工智能领域的一些人认为 AGI 只是一场白日梦,但 DeepMind 论文的作者预测它可能会在 2030 年实现。考虑到这一点,他们旨在了解类似人类的合成智能的风险,他们承认这可能会导致“严重伤害”。

AGI 可能危害人类的所有方式

这项研究确定了四种可能的 AGI 风险,并提出了如何减轻这些风险的建议。DeepMind 团队由公司联合创始人 Shane Legg 领导,将 AGI 的负面结果归类为误用、错位、错误和结构性风险。本文详细讨论了误用和错位,但对后两者只做了简要介绍。

第一个可能的问题,即滥用,与当前的人工智能风险基本相似。然而,由于 AGI 从定义上来说会更强大,因此它可能造成的损害要大得多。一个拥有 AGI 访问权限的无赖可能会滥用系统造成伤害,例如,要求系统识别和利用零日漏洞或创建可用作生物武器的设计病毒。

DeepMind 表示,开发 AGI 的公司必须进行大量测试,并制定强大的训练后安全协议。本质上,AI 护栏就是强化版。他们还建议设计一种完全抑制危险能力的方法,有时称为“取消学习”,但目前尚不清楚在不大幅限制模型的情况下是否可行。

对于目前存在的生成式人工智能,我们基本上不必担心错位问题。这种类型的 AGI 危害被设想为一台摆脱了设计者强加的限制的流氓机器。终结者,有人知道吗?更具体地说,人工智能会采取它知道开发人员没有打算采取的行动。DeepMind 表示,其错位标准比当前文献中看到的简单欺骗或阴谋更为先进。

为了避免这种情况,DeepMind 建议开发人员使用放大监督等技术,即两个 AI 副本相互检查彼此的输出,以创建不太可能失控的强大系统。如果失败,DeepMind 建议进行密集的压力测试和监控,以观察任何 AI 可能背叛我们的迹象。将 AGI 放在具有严格安全性和直接人工监督的虚拟沙箱中,可以帮助缓解因错位而引起的问题。基本上,确保有一个“关闭”开关。

另一方面,如果人工智能不知道其输出会造成伤害,而人类操作员也无意造成伤害,那么这就是一个错误。目前的人工智能系统就有很多这样的错误——还记得谷歌说要把胶水涂在披萨上吗?不过,AGI 的“胶水”可能要粘得多。DeepMind 指出,军方可能会因为“竞争压力”而部署 AGI,但这样的系统可能会犯下严重错误,因为它们将承担比今天的人工智能更复杂的功能。

这篇论文并没有提出很好的解决方案来减少错误。归根结底,就是首先不要让 AGI 变得太强大。DeepMind 呼吁缓慢部署并限制 AGI 权限。该研究还建议通过“屏蔽”系统传递 AGI 命令,以确保它们在实施前是安全的。

最后,还有结构性风险,DeepMind 将其定义为多智能体系统对我们本已复杂的人类生存的无意但真实的影响。例如,AGI 可能会产生虚假信息,这些信息太过可信,以至于我们不再知道该相信谁或什么。该论文还提出了这样一种可能性,即 AGI 可能会通过制定严厉的关税计划,对经济和政治体系的控制越来越多。然后有一天,我们抬起头来,发现机器代替我们掌权了。这类风险也是最难防范的,因为它取决于未来的人、基础设施和机构如何运作。

五年后实现 AGI?

没有人知道思考机器是否真的只需要几年时间就能出现,但有很多技术领袖对此充满信心。预测 AGI 出现的部分问题在于,我们仍然只是在推测类人智能将如何在机器中体现。过去几年使用过生成式人工智能系统的人都看到了真正的、切实的改进,但这种轨迹是否会带来真正的类人能力?

我们最近与谷歌 Gemini 产品管理总监 Tulsee Doshi 讨论了一系列人工智能主题,包括 AGI。“不同的人对 AGI 有不同的定义,因此,取决于你与谁交谈,我们距离 AGI 有多远是一个不同的话题,”Doshi 说。“我想说的是,法学硕士、Gemini 以及越来越智能的模型的训练正在走向具有极高智能的模型。这本身就具有巨大的价值。”

这篇论文并不是关于 AGI 安全性的最终定论——DeepMind 指出,这只是“重要对话的起点”。如果团队是正确的,并且 AGI 将在短短五年内改变世界,那么这些对话需要尽快进行。如果不是,那么很多人看起来会很傻。

https://arstechnica.com/ai/2025/04/google-deepmind-releases-its-plan-to-keep-agi-from-running-wild/

半导体精品公众号推荐

专注半导体领域更多原创内容

关注全球半导体产业动向与趋势

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4086期内容,欢迎关注。

『半导体第一垂直媒体』

实时 专业 原创 深度

公众号ID:icbank

喜欢我们的内容就点“在看”分享给小伙伴哦

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
香港再无董建华

香港再无董建华

华人星光
2025-11-25 12:01:27
陪睡陪玩只是冰山一角!万达蒸发800亿后,王思聪再次传出大丑闻

陪睡陪玩只是冰山一角!万达蒸发800亿后,王思聪再次传出大丑闻

甜柠聊史
2025-12-24 14:53:56
外交部:中方愿同洪方一道在一个中国原则基础上共同推动中洪关系不断向前发展

外交部:中方愿同洪方一道在一个中国原则基础上共同推动中洪关系不断向前发展

环球网资讯
2025-12-25 15:27:05
广东高铁逆袭战:1.5亿人用脚投票的硬核突围

广东高铁逆袭战:1.5亿人用脚投票的硬核突围

纪百事
2025-12-22 17:33:29
四川华西医院有多牛?网友:医术和医德不能画等号

四川华西医院有多牛?网友:医术和医德不能画等号

带你感受人间冷暖
2025-12-25 00:15:06
姜昆在美国过圣诞,被调侃“此生不悔入华夏,家住加利福尼亚”=

姜昆在美国过圣诞,被调侃“此生不悔入华夏,家住加利福尼亚”=

非常先生看娱乐
2025-12-25 17:49:57
狂轰42分,爆砍33分!NBA历史首人!这就是他成最强状元的原因

狂轰42分,爆砍33分!NBA历史首人!这就是他成最强状元的原因

篮球扫地僧
2025-12-25 15:35:24
杨鸣为莫兰德庆生:他在场的兢兢业业和生活中的幽默风趣令人印象深刻

杨鸣为莫兰德庆生:他在场的兢兢业业和生活中的幽默风趣令人印象深刻

懂球帝
2025-12-25 12:20:05
海南封关运作后,就相当于中国版的新加坡正式上线了。

海南封关运作后,就相当于中国版的新加坡正式上线了。

流苏晚晴
2025-12-21 16:05:12
大幅涨价500元!6999元起售小米17 Ultra值得冲吗?

大幅涨价500元!6999元起售小米17 Ultra值得冲吗?

真义科技
2025-12-25 20:44:34
《南渡北归》书中记录了原南京博物院院长曾昭燏自尽始末

《南渡北归》书中记录了原南京博物院院长曾昭燏自尽始末

总在茶余后
2025-12-22 23:40:49
古天乐透露电影《寻秦记》因片长限制有删减,林峯再演嬴政有压力

古天乐透露电影《寻秦记》因片长限制有删减,林峯再演嬴政有压力

TVB剧评社
2025-12-25 22:38:28
陪睡陪玩不过是皮毛!万达百亿资产蒸发后,王思聪又曝惊天丑闻

陪睡陪玩不过是皮毛!万达百亿资产蒸发后,王思聪又曝惊天丑闻

牛锅巴小钒
2025-12-24 10:39:19
胖东来新店试营业,首日销售额突破千万

胖东来新店试营业,首日销售额突破千万

河南交通广播1041
2025-12-25 09:12:05
2025年,消失的公司年会。

2025年,消失的公司年会。

爱吃糖的猫cat
2025-12-24 19:01:36
吃他汀,不吃柚子,能吃桔子、橙子和柠檬吗?医生解答

吃他汀,不吃柚子,能吃桔子、橙子和柠檬吗?医生解答

健康之光
2025-12-24 09:12:42
斯诺克明日开杆!8老将受邀参赛,2大世界冠军首秀,新王开门红?

斯诺克明日开杆!8老将受邀参赛,2大世界冠军首秀,新王开门红?

刘姚尧的文字城堡
2025-12-25 18:40:21
雷军、刘强东都穿的跑鞋,成了进入中产的新“敲门砖”?

雷军、刘强东都穿的跑鞋,成了进入中产的新“敲门砖”?

新10亿商业参考
2025-12-23 18:42:48
这家深圳工厂突放2个月长假,发低保清空宿舍?员工:年关怎么过

这家深圳工厂突放2个月长假,发低保清空宿舍?员工:年关怎么过

捣蛋窝
2025-12-25 20:48:10
柬埔寨“生命科学院”全中文服务,网友炸锅:私人订制

柬埔寨“生命科学院”全中文服务,网友炸锅:私人订制

胡严乱语
2025-12-24 19:10:52
2025-12-25 23:24:49
半导体行业观察 incentive-icons
半导体行业观察
专注观察全球半导体行业资讯
12542文章数 34730关注度
往期回顾 全部

科技要闻

小米17Ultra发布,徕卡2亿像素 ,6999元起

头条要闻

韩国"最毒"财阀千金被捕 韩国人称"经过她身边就会死"

头条要闻

韩国"最毒"财阀千金被捕 韩国人称"经过她身边就会死"

体育要闻

约基奇有多喜欢马?

娱乐要闻

朱孝天把阿信好意当球踢!

财经要闻

新规来了,年化超24%的小贷被即刻叫停

汽车要闻

速来!智界在上海西岸准备了年末潮流盛典

态度原创

房产
手机
时尚
艺术
公开课

房产要闻

太猛了!单月新增企业4.1万家,又一波巨头涌向海南!

手机要闻

一加Turbo系列定位「性能续航超新星」,即将发布

上新|| 今年火出圈的这件毛衣,最近穿上身美到被反复夸!

艺术要闻

缅怀 | 著名油画家宫立龙逝世,享年73岁

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版