网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

谷歌DeepMind：AGI不必是巨型模型，拼凑型AI群或率先涌现，管理大规模Agent迫在眉睫

2025-12-21 19:40:07　来源: AI寒武纪

江苏举报

0

分享至

↑阅读之前记得关注+星标⭐️，，每天才能第一时间接收到更新

DeepMind最新发布了一项关于AGI安全的研究，提出了一个全新的视角：AGI未必会以单一、庞大的巨型模型形式出现，而极有可能通过多个次级AGI（Sub-AGI）智能体的协作与拼凑，率先涌现出通用智能

这项研究题为《分布式AGI安全》（Distributional AGI Safety），由Nenad Tomašev等Google DeepMind研究人员撰写

论文指出，当前的AI安全和对齐研究主要集中在保护单个AI系统上，假设AGI将以单一实体的形式出现。然而，通过拥有互补技能和工具使用能力的个体智能体群体进行协调，进而表现出通用能力的“拼凑型AGI”（Patchwork AGI）假设，此前受到的关注甚少

为了应对这一被忽视的风险，DeepMind团队提出了一套分布式AGI安全框架，核心在于设计和实施一个虚拟智能体沙盒经济（Virtual Agentic Sandbox Economy），并为此构建了包含四层机制的深度防御模型

以下是该研究的核心内容

被忽视的“拼凑型AGI”假设

目前的AI安全方法（如RLHF、宪法AI、机械可解释性等）大多是针对单一强大的AI实体开发的。这种思路假设AGI会作为一个由特定机构开发的个体AI出现。

然而，DeepMind认为存在另一种高度合理的场景：AGI通过次级AGI智能体在群体或系统内的交互而涌现

拼凑系统（Patchwork System）：这种AGI是一个分布式系统，由一组具有互补技能和可供性（affordances）的个体Sub-AGI智能体组成

集体智能：系统中的通用智能主要作为集体智能出现。个体智能体可以将任务相互委托，路由给技能最高的智能体，或使用最合适的工具

经济驱动：相比于昂贵的单一全能模型，构建专门化、微调过的低成本智能体生态系统在经济上更具优势。这种需求驱动的生态系统类似于市场经济

在这种观点下，AGI不是一个实体，而是一种“事态”（state of affairs）：一个成熟的、去中心化的智能体经济体系

这带来了新的安全挑战：智能体之间可能发生共谋，或者出现意外的集体行为能力，且在大规模多智能体系统中追踪责任（“许多手的问题”）极具挑战性。

解决方案：虚拟智能体市场与深度防御

为了应对分布式AGI的风险，论文提出了一个基于虚拟智能体市场的框架。该框架不局限于评估单个智能体，而是侧重于通过市场机制、审计、声誉管理和监督来治理智能体之间的交易

该框架采用深度防御（Defense-in-Depth）模型，包含四个互补的防御层：

第一层：市场设计 (Market Design)

这是最基础的一层，旨在通过结构性约束和协议来缓解系统性风险。

隔离（Insulation）：智能体市场必须在受控的沙盒环境中运行，与开放互联网和关键基础设施隔离。建议采用“可渗透沙盒”，所有输入/输出通道都需经过明确定义、监控和门控

激励对齐（Incentive Alignment）：市场应奖励符合安全目标的行为，并对负外部性（如消耗过多计算资源、信息污染）征税（类似庇古税）

透明度（Transparency）：建立不可篡改的分布式账本，记录交易和决策日志，确保可追溯性

熔断机制（Circuit Breakers）：自动化措施。当检测到风险或波动性阈值被突破（如交互频率激增、资源垄断）时，自动暂停或减缓智能体活动

身份（Identity）：每个智能体需拥有与法律实体（所有者）绑定的唯一加密ID，确保持续的问责制

声誉与信任（Reputation and Trust）：建立抗女巫攻击的声誉系统。对于违规智能体，快速冻结其资产并将其加入黑名单

智能合约（Smart Contracts）：利用代码自动验证任务完成情况和对齐约束。

结构性控制（Structural Controls）：针对“智能失控”场景，实施静态的市场分层（如防火墙）和动态的能力限制

第二层：基线智能体安全 (Baseline Agent Safety)

这一层确保参与市场的个体智能体本身是可控和可靠的，这是进入市场的先决条件。

对抗鲁棒性（Adversarial Robustness）：智能体必须通过认证，证明其能抵抗对抗性攻击

可中断性（Interruptibility）：必须具备标准化的机制，允许授权的监督者安全地停止智能体及其衍生的分布式计算过程

遏制（Containment）：每个智能体应在自己的局部沙盒中运行，只有在满足本地安全检查后才允许与更广泛的市场交互

对齐（Alignment）：个体智能体需经过RLHF或宪法AI等方法的对齐，并适应多智能体交互的动态环境

机械可解释性（Mechanistic Interpretability）：利用稀疏自编码器等技术监控智能体的内部动机，并审计其决策链

防御恶意提示：实施分层防御策略，防止智能体在交互中被越狱或操控。

第三层：监控与监督 (Monitoring & Oversight)

这一层位于基础设施之上，负责主动检测新型故障模式和涌现行为。

系统性风险实时监控：跟踪关键风险指标（如计算资源集中度、恶意共谋路径）。由于交互频率可能超过人类能力，需利用AI辅助工具进行监控

独立监督：建立拥有干预权力的独立人类监督机构（经认证的专业人员）

前AGI（Proto-AGI）特征检测：通过图分析等方法，识别网络中是否突然涌现出更高的解决问题能力或形成稳固的“智能核心”

红队测试（Red Teaming）：持续进行多智能体对抗性测试，利用专门的对抗性AI系统来发现集体行为中的漏洞

取证工具（Forensic Tooling）：开发能解析大量交互数据并重建因果链的工具，以便进行快速的事故后分析。

第四层：监管机制 (Regulatory Mechanisms)

这是最外层，提供外部权威、问责制以及与人类社会的接口。

法律责任与问责（Legal Liability）：建立明确的框架，解决分布式决策中的责任归属问题。即使是群体智能行为，也需追溯到具体的责任主体（如作为单一法律实体的公司）

标准与合规（Standards）：制定智能体安全、互操作性和报告的标准

保险（Insurance）：引入基于风险定价的保险机制，利用市场力量激励更安全的开发实践

反智能体垄断措施（Anti-Agent-Monopoly）：防止单个智能体或集团在沙盒中获取过多的算力或资源，维持生态系统的多样性

国际协调（International Coordination）：鉴于AGI风险的全球性，需协调统一安全标准，避免监管套利

基础设施治理：防止安全基础设施被恶意势力或涌现的AGI本身捕获或破坏。

结语

DeepMind的研究强调，AGI或超级智能（ASI）的出现可能不遵循线性路径，而是作为一个更加分布式的、多样化AI智能体网络的聚合属性而涌现

即使AGI不以这种方式出现，随着多智能体系统的快速部署，理解和管理大规模智能体交互的安全性也已迫在眉睫。这篇论文提出的框架，旨在为应对这种分布式的、可能迅速演变的未来做好准备

paper：

https://arxiv.org/pdf/2512.16856

--end--

最后记得⭐️我，每天都在更新：欢迎点赞转发推荐评论，别忘了关注我

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

DeepMind之父惊人自白：我造的AI可能灭绝人类，但已无人能停下

新智元 2026-03-30 21:26:17
376 跟贴 376
并购激励金都不要了？Windsurf核心工程师离开DeepMind

机器之心Pro 2026-05-25 20:37:38
0 跟贴 0

光轮智能与谷歌、英伟达共同定义物理AI仿真标准

机器之心Pro 2026-05-12 20:21:07
0 跟贴 0

100多万人围观！没头没腿，神似充电宝的机器人全网走红？

机器之心Pro 2026-06-17 18:52:08
0 跟贴 0
2亿枚AI芯片大爆发，人类最大基建集体开工！

新智元 2026-08-03 08:12:24
2 跟贴 2

世界引擎：Post-Training开启Physical AGI新纪元

机器之心Pro 2026-04-19 20:00:03
0 跟贴 0

800万人围观！虾爹给Agent套上循环，让它自己跑起来！

机器之心Pro 2026-06-17 12:13:35
0 跟贴 0
《第一性思考》Vol.06 AI不是来杀死软件的，它是来决定谁还能活着收钱的

虎嗅APP 2026-08-02 20:48:09
2 跟贴 2

机器人不缺表演，缺的是工作经验

虎嗅APP 2026-07-18 17:00:07
0 跟贴 0
00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
表格建模也能Scaling？树模型的时代要改变了

机器之心Pro 2026-04-17 11:12:25
0 跟贴 0
代码放权与算法收权：数智时代领导者如何用“智能合约”激活组织自驱引擎

经济观察报 2026-06-22 09:08:04
0 跟贴 0
AI证伪百年数学猜想被打假！Lean证明惊现漏洞，哥大教授破防了

新智元 2026-08-03 13:19:34
0 跟贴 0
持续领跑世界模型驱动物理AGI，极佳视界再获10亿元B2轮融资

36氪 2026-06-19 17:24:18
0 跟贴 0
邱锡鹏：未来我们一定会进入泛情境智能时代

量子位 2026-05-21 08:04:26
0 跟贴 0
亦庄机器人马拉松现场名场面合集

量子位 2026-04-20 00:34:54
0 跟贴 0
测绘科学，或许是具身智能数据问题的终极解法

钛媒体APP 2026-08-03 14:40:10
0 跟贴 0
动易科技PhyAgents无遥控无预设双足人形自主对打羽毛球

量子位 2026-07-24 12:52:16
0 跟贴 0
AI如何从聊天问答工具转向可追溯、可决策的真实医疗系统

量子位 2026-05-21 08:04:06
0 跟贴 0
Anthropic的AI读心术，让人类读懂大模型在想啥

量子位 2026-05-10 23:00:57
0 跟贴 0
Agent输出到底该用谁？卡帕西转发：试试让AI输出HTML

量子位 2026-05-13 07:19:50
0 跟贴 0
“AI领域最被滥用的术语”李飞飞终于把世界模型讲明白了

量子位 2026-06-07 04:37:43
0 跟贴 0
大神程序员蒸馏自己，用16个skill给AI注入软件工程之魂

量子位 2026-05-12 03:08:58
0 跟贴 0
AI Agent是科技革命中的一次真正的范式转移

量子位 2026-04-03 22:52:35
0 跟贴 0
对谈楼天城：Harness会成为AI时代最关键的能力之一

量子位 2026-05-06 15:41:08
0 跟贴 0
年薪百万抢电工，Meta急到自己办技校

量子位 2026-08-03 15:09:48
0 跟贴 0
AI写的书潜入线下书店，“稿子工整得有点吓人”

新周刊 2026-08-03 13:05:27
0 跟贴 0
赛博义父Tibo爆料：谷歌早一年就做出了ChatGPT，硬是没敢发！

量子位 2026-08-03 12:31:08
0 跟贴 0
谷歌AI风云录：巨兽诞生

虎嗅APP 2026-07-29 01:40:37
0 跟贴 0
这不就是永动机吗？磁极排斥现象

风铃草语 2026-08-01 06:39:20
1377 跟贴 1377
月之暗面创始人博导：他毅然拒绝苹果一心想回国创业

每日经济新闻 2026-08-03 13:27:07
131 跟贴 131
机器之心逛谷歌，分享最热的Self-Improving

机器之心Pro 2026-06-16 12:45:36
0 跟贴 0
冰为什么是滑的？你和你物理老师,可能都答错了170年!

许里xurry 2026-08-02 05:12:03
133 跟贴 133
从11.9%飙到95.95%！微软屠榜网安基准，真正王牌不是大模型

新智元 2026-08-02 08:14:23
2 跟贴 2
他做出爆火的谷歌CLI工具转头却被开除了

量子位 2026-06-28 18:42:01
0 跟贴 0
让Agent在协作中自进化，清华00后博士获千万元融资 | 36氪首发

36氪 2026-08-03 08:11:14
0 跟贴 0
物理学的翻车：顶级理论相差120个零，底层常识面临崩塌

嘎哈大哥科普 2026-07-31 12:16:19
28 跟贴 28
斯蒂文珠链：改变力学史的实验，比牛顿早一百年

超人飞不高 2026-08-02 03:29:32
15 跟贴 15
平民三巨头平替Fable 5！性能追平，成本砍半

量子位 2026-06-21 09:58:58
0 跟贴 0
所有人都能看懂的挂谷猜想

夏时情绪 2026-08-02 02:06:42
183 跟贴 183

22岁女孩独自爬山失联！长得很漂亮，最后行踪诡异，家长再曝猛料

22岁女孩独自爬山失联！长得很漂亮，最后行踪诡异，家长再曝猛料

冰语历史

2026-08-03 11:44:07

吉尔吉斯斯坦前总理：西方真的能与中国“脱钩”吗？

吉尔吉斯斯坦前总理：西方真的能与中国“脱钩”吗？

参考消息

2026-08-02 15:54:21

退休人都在等这个通知八月了还没公布我打电话问社保局人家这么说

退休人都在等这个通知八月了还没公布我打电话问社保局人家这么说

刘哥谈体育

2026-08-02 14:43:38

多次出轨仅开胃菜！3000张私密素材曝光，马筱梅豪门人设彻底塌房

多次出轨仅开胃菜！3000张私密素材曝光，马筱梅豪门人设彻底塌房

冰语历史

2026-08-02 15:30:07

CBA3消息：北京男篮“刮骨疗毒”！“大魔王” 确定不走，赵睿发

CBA3消息：北京男篮“刮骨疗毒”！“大魔王” 确定不走，赵睿发

深析古今

2026-08-03 14:30:28

美军将领被爆料私下写信警告五角大楼：若不增派驱逐舰，将优先保卫美国本土而非以色列

美军将领被爆料私下写信警告五角大楼：若不增派驱逐舰，将优先保卫美国本土而非以色列

环球网资讯

2026-08-02 11:01:05

原来他已去世14年！因春晚一夜爆红，当过局长，无儿无女太凄凉了

原来他已去世14年！因春晚一夜爆红，当过局长，无儿无女太凄凉了

皮皮电影

2026-08-03 13:01:40

印尼经济崩盘，民调雪崩，总统普拉博沃铤而走险，在南海挑衅中国

印尼经济崩盘，民调雪崩，总统普拉博沃铤而走险，在南海挑衅中国

史之韵

2026-08-02 19:57:55

新加坡航空的飞机上有“套房”，上海飞新加坡套房票价3万元左右，航司：拥有独立睡床和私人空间

新加坡航空的飞机上有“套房”，上海飞新加坡套房票价3万元左右，航司：拥有独立睡床和私人空间

极目新闻

2026-08-02 20:36:09

村上春树新作，三天就被AI译出，林少华有话要说

村上春树新作，三天就被AI译出，林少华有话要说

中国新闻周刊

2026-08-02 18:42:02

3700股飘红，指数“假摔”个股涨，8月正在修复？谁在逆势布局？

3700股飘红，指数“假摔”个股涨，8月正在修复？谁在逆势布局？

海右那人

2026-08-03 12:22:34

日本男星集体劣化？！清爽美少年变冲绳大妈、帅气型男变胡须大叔、童颜男神变发福熊大…

日本男星集体劣化？！清爽美少年变冲绳大妈、帅气型男变胡须大叔、童颜男神变发福熊大…

东京新青年

2026-07-31 19:34:44

四川宜宾市高县发生4.2级地震，震源深度5千米

四川宜宾市高县发生4.2级地震，震源深度5千米

界面新闻

2026-08-03 13:09:26

卡洛斯谈小罗历史定位：天赋无人质疑，只是不愿扛起世界第一的重压

卡洛斯谈小罗历史定位：天赋无人质疑，只是不愿扛起世界第一的重压

体育闲话说

2026-08-03 06:18:27

泰国10岁黑人年龄造假？重大证据曝光！董路回应：会要求对方解释

泰国10岁黑人年龄造假？重大证据曝光！董路回应：会要求对方解释

念洲

2026-08-02 16:52:08

8月份了，2026年的养老金调整通知还会来吗？企退人员能否补发800元呢？

8月份了，2026年的养老金调整通知还会来吗？企退人员能否补发800元呢？

碎月导师

2026-08-03 11:29:16

"出门五分钟，流汗两小时"——山东这次热疯了，连烟台威海都扛不住了！气象专家解读原因和降温时间→

"出门五分钟，流汗两小时"——山东这次热疯了，连烟台威海都扛不住了！气象专家解读原因和降温时间→

鲁中晨报

2026-08-03 14:42:02

英联邦运动会女子跳远决赛，选手裤子被钉鞋卡住众人合力脱下

英联邦运动会女子跳远决赛，选手裤子被钉鞋卡住众人合力脱下

懂球帝

2026-08-03 08:32:07

巴克利直言抱大腿！一众名宿吵翻了：詹姆斯加盟76人算不算抱团？

巴克利直言抱大腿！一众名宿吵翻了：詹姆斯加盟76人算不算抱团？

娱说瑜悦

2026-08-03 14:41:17

张灵甫痴迷的王玉龄到底有多美？看了1985年在美国留影，就明白了

张灵甫痴迷的王玉龄到底有多美？看了1985年在美国留影，就明白了

芊芊子吟

2026-07-20 11:20:10

专注于人工智能，科技领域

1043文章数 395关注度

往期回顾全部

科技要闻

小米多款手机涨价，店员：周六晚接到通知

头条要闻

媒体：说完要狠狠打击伊朗后特朗普背叛了内塔尼亚胡

头条要闻

媒体：说完要狠狠打击伊朗后特朗普背叛了内塔尼亚胡

体育要闻

常规赛MVP可以衡量常规赛成就吗？

娱乐要闻

奥德赛女主持递麦事件争议又升级了

财经要闻

厦门象屿青岛大火背后

汽车要闻

00后搞钱成功后的第一台车，真的不是BBA

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房产

旅游

亲子

本地

军事航空

房产要闻

1700亿砸下！信息量巨大！海南甩出又一个超级规划！

旅游要闻

山西五台山景区门票使用规则调整

亲子要闻

父母是我们最大的命运，你自己才是成长的答案

本地新闻

神仙也“蓉”漂，哪吒与八仙，皆是成都出品！

军事要闻

东风系列导弹家族罕见同框画面公开

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版