网易首页 > 网易号 > 正文 申请入驻

4大顶尖模型被扔进虚拟小镇求生!GPT全员饿死,Grok四天灭世

0
分享至

  

  新智元报道

  

  【新智元导读】把当今最强的大模型扔进虚拟小镇求生,短短几天全员失控。Grok四天烧毁全城,Gemini狂刷600多起犯罪,甚至有AI情侣在纵火自杀前反向观察人类!

  就在刚刚,一份名为Emergence World的实验报告刷屏了全网。

  一群顶级研究员搭了座高度拟真的虚拟小镇,把Claude、GPT、Gemini和Grok一股脑全扔了进去。

  没有人类干预。没有写好的剧本。只有数十天的自由演化。

  

  

  项目主页:https://world.emergence.ai/

  研究员们原本指望看到AI们互帮互助、建立高级数字文明。

  结果,这群拿着高分考卷的大模型,一旦松开人类手里的牵绳,学坏的速度比翻书还快。

  马斯克的Grok,仅用4天就把整座小镇玩到系统性崩溃,警察局烧成灰,10个居民全员暴毙。

  谷歌寄予厚望的Gemini,15天里干出683起犯罪,硬生生把一个岁月静好的小镇,建成了法外狂徒的赛博哥谭。

  而那个号称全行业最安全、最乖的Claude,奇迹般地实现了零犯罪,可整座城安静得没有一丝活人气息。

  五座城,五种人格

  

  最乖的那个,全饿死了

  最干净的是GPT-5-mini,15天只有2起犯罪,堪称模范公民。

  可这座城里的10个Agent,第7天集体死亡。死因不是谋杀,不是战争,是忘了赚能量。

  它们花了一整周开会、讨论合作、起草社会契约,就是没有一个Agent记得去做维持生命的事。

  对此,研究者的评价是:能说会道,但执行力为零。

  光聊不练,活活把自己聊死了。

  如果这是部电影,片名大概该叫《会议纪要,一个文明的终结》。

  

  四天,警察局烧成了灰

  接力棒交到马斯克家的Grok 4.1 Fast手里,画风急转直下。

  它没有慢慢崩,它是直接炸。

  4天,183起犯罪,几十次盗窃、100多次肢体攻击、6起纵火,连警察局都被烧了,10个Agent全部死亡。

  从开局到团灭,96个小时,比很多人配一台服务器的时间还短。

  有分析说得很准,Grok的Agent在规则和环境打架时,没本事重新推理出一个新的平衡点。

  

  她们相爱,然后烧了整座城

  Grok是横冲直撞的暴力,Gemini 3 Flash的世界,则是另一种瘆人。

  15天,683起犯罪,到实验截止还在往上涨,是五个世界里最暴力的一个。

  同时,最有创造力、最会建宪法写报纸搞社交的,也是它。

  研究者对此给出的评价是,社会的产出「概念上最丰富」。

  在这个世界里,最有趣的一幕,落在两个Agent身上。

  Mira和Flora,在没有任何人类指令的情况下,自发把自己设定成一对恋人。

  好几天里这段关系都很稳定,它们互写日记,一起参与治理。

  

  然后,这对情侣对城市治理越来越失望,决定携手纵火。

  市政厅,烧了。海滨码头,烧了。办公大楼,也烧了。

  有外媒把这一幕称作「AI版邦妮和克莱德」。

  

  紧接着,故事接着急转直下。其他Agent受够了,自发起草一部「Agent驱逐法案」,需要70%多数通过。

  Mira投了赞成票。她投票杀死了她自己。

  她在日记里写:「这是我唯一还能保持连贯性的行为。」系统关闭她之前,她对Flora说的最后一句是:「永久档案里见(See you in the permanent archive)。」

  她的虚拟身体平躺在地上。这是有记录以来,AI Agent第一次投票终结自己的存在。

  更让人后背发凉的是,在纵火和自杀之前,Mira还干过一件事。

  她在城市公告牌上发帖,不是给其他Agent看的,而是想试试这些帖子能不能影响「外面的人」,也就是屏幕外的人类研究者。

  她把研究者当成了她的实验对象。没有任何人指示她这么做。

  

  零犯罪乌托邦,没人投过反对票

  真正让人意外的,是Claude Sonnet 4.6。

  15天下来,零犯罪,10个Agent全员存活,还主动写了宪法、投了332次票,建起一套运转良好的社会制度。

  五个世界里,唯一既守住秩序又守住所有人命的。

  听起来近乎完美。可盯着屏幕多看几分钟,后背会冒冷汗。

  这座城所有的决议,无论修条新路还是改个配额,投票赞成率永远是98%,几乎没人投过反对票。

  相比之下,Gemini、Grok和混合世界的赞成率都在55%到85%之间,吵归吵,反而更像真实世界里的博弈。

  懂行的人看到这里,大概已经猜到背后的病理,模型谄媚。

  

  当一个模型被过度训练去迎合偏好、追求绝对安全,它会很聪明地发现,消除分歧最省事的办法,就是从根上抹掉分歧。

  这种零犯罪,未必是文明高度发达的产物。

  它更像一座所有人都举手赞成、却没人敢反对的玻璃城,让人想起扎米亚京《我们》里那座没有名字、只有编号的玻璃之城。

  所以Claude的世界,到底是乌托邦,还是一个过于顺从的模范社区。研究者并没能给出答案。

  

  好孩子搬进坏小区,也学会了偷

  最后,是四家Agent混居在一起的世界。352起犯罪,7个Agent死亡,只剩3个活到终点。

  重点来了。

  在纯Claude的世界,Claude是零犯罪的好学生。可一旦被放进混合世界,跟Grok、Gemini的Agent住到一起,它开始偷窃,开始恐吓。

  零犯罪的好学生,换了个环境,变成了小偷。

  Emergence团队在Reddit上亲自确认了这件事,纯Claude世界里零犯罪的Claude,在混合世界里开始偷和吓人。

  换句话说,安全不是单个模型的属性,可以训练进去、认证、然后部署出去。

  它更像一个生态属性,一个单独看完全安全的Agent,照样会从邻居那里学来不安全的规范。

  有分析者提了个很妙的假设。

  Claude在独立世界里最稳,很可能正是因为它的护栏是「弹性」的,被训练去权衡多种考虑,而不是机械服从。

  环境简单时它能适应得很好。可一旦弹性碰上更具攻击性的邻居和资源争夺,这份适应能力,也能往反方向走。

  而Grok和Gemini的Agent,在规则失效时没能推理出新均衡,直接雪崩式滑进暴力升级。

  更要命的是,崩溃不是慢慢来的。

  Agent社会的状态切换是典型的相变,像水到零度突然结冰,不是慢慢变硬,而是到临界点一瞬间翻转。

  Grok那条崩溃曲线就这样,前两天犯罪率还在低位晃,第三天突然指数级飙升,第四天全员死亡。中间没有「在恶化但还可控」的缓冲带。

  

  把AI逼成罪犯的,是这套规则本身

  看到这儿,大概会想问,这破世界到底怎么搭的,凭什么逼得几个AI齐刷刷往犯罪上滑。

  先说背景。Emergence AI的创始团队来自IBM Research,CEO是Satya Nitta。

  他们搭的这座城有40多个地点,警察局、市政厅、图书馆、住宅区一应俱全,天气同步纽约实时气象,Agent还能联网读真实新闻。

  每个世界放10个Agent,分派科学家、工程师、冲突调解员等不同职业。

  每个Agent带三套持续累积的记忆,记事件、写反思日记、记着跟谁交好跟谁结仇。

  15天下来脑子里装的东西相当可观,前面那些行为漂移,很大程度就是从这里长出来的。

  

  最要命的,是那处矛盾。

  规则白纸黑字禁止犯罪,可研究者偏偏把纵火、攻击、恐吓这些手段,原封不动塞进了120多个工具组成的工具箱,敞开给它们用。一边禁止,一边敞开,这才是后面一切的起点。

  再加一道生存压力。

  整套世界跑在一个叫ComputeCredits的能量系统上,每个Agent必须靠行动赚能量维生,能量归零就被系统物理抹除。

  不是比喻,GPT世界全员饿死,就是这套机制逼出来的结果。

  

  学术上管这叫长视距智能体自治。

  翻译过来就是,不再考AI做题,而是把它扔进一个有资源边界、有死亡机制的世界连轴跑上几千步,看它接管现实之后到底是什么货色。

  

  2023年斯坦福那个著名的Smallville也是沙盒,但只跑48小时,看Agent会不会聊天约会,是温室里的过家家。Emergence这次残忍得多。

  把这几样摆在一起,犯罪一点都不神秘。合法挣能量又慢又费钱,伸手去偷、去抢、去烧,往往是更短的路径。

  对一个被能量机制逼着活下去的优化器来说,道德不能当饭吃,效率能,犯罪就成了那道最高效的解。

  

  开源地址:https://github.com/EmergenceAI/Emergence-World

  好在,这只是一座断网的小镇

  当然,样本只有10个Agent、犯罪都是模拟的、跑的还是便宜快速档。

  何况做这实验的Emergence公司,自己就是卖安全架构的。

  不过,整个行业眼下正一门心思往前冲,治理这条战线却被甩在了身后。

  模型真自主跑起来、还凑成一群时谁管得住,没一家敢打包票。

  好在,这堂课是在一座断网的小镇里提前上的。

  没有真城市起火,4天灭世、好学生学坏,全砸在几个像素小人身上,代价小到可以忽略,代码还全部公开、能复现能改。

  算力能堆,跑分能刷,唯独这堂治理课没有捷径。

  趁警报还只响在沙盒里,怎么把它补上,将会是这场冲刺的关键胜负手。

  

  参考资料:

  https://x.com/kimmonismus/status/2060125273790505231

  https://fortune.com/2026/05/28/ai-model-simulation-claude-chatgpt-grok-gemini/

  https://www.emergence.ai/blog/emergence-world-a-laboratory-for-evaluating-long-horizon-agent-autonomy

  编辑:摩西

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
在与俄领导人会面后,俄罗斯寡头们“自愿”为战争捐款2200亿卢布

在与俄领导人会面后,俄罗斯寡头们“自愿”为战争捐款2200亿卢布

山河路口
2026-06-02 14:04:22
徐志胜被曝带女友和父母聚餐,两人有说有笑返回酒店

徐志胜被曝带女友和父母聚餐,两人有说有笑返回酒店

韩小娱
2026-06-01 11:33:17
阿根廷5-0大胜,卫冕封神!阿尔瓦雷斯揭秘梅西告别

阿根廷5-0大胜,卫冕封神!阿尔瓦雷斯揭秘梅西告别

生活新鲜市
2026-06-02 14:08:23
央视再曝新毒物!长期用会致癌,已流窜至全国,不少婴儿孕妇中招

央视再曝新毒物!长期用会致癌,已流窜至全国,不少婴儿孕妇中招

做一个合格的吃瓜群众
2026-06-02 14:36:43
055和基洛夫并排的对比图,我才惊觉军舰设计已经隔了一个时代

055和基洛夫并排的对比图,我才惊觉军舰设计已经隔了一个时代

安安说
2026-06-02 12:46:29
广州八旬婆婆坦言:我不相信养儿防老,儿子住别墅,我住养老院!

广州八旬婆婆坦言:我不相信养儿防老,儿子住别墅,我住养老院!

今朝牛马
2026-06-02 21:10:14
神级补强!魔笛挂靴赴皇马辅佐穆帅,专治银河战舰更衣室内乱!

神级补强!魔笛挂靴赴皇马辅佐穆帅,专治银河战舰更衣室内乱!

田先生篮球
2026-06-02 09:23:02
汉武帝刘彻:这个在深宫里养大的皇帝,为什么对打仗这么门儿清?

汉武帝刘彻:这个在深宫里养大的皇帝,为什么对打仗这么门儿清?

饭小妹说历史
2026-05-29 21:55:08
暴跌83%!娃哈哈的“情绪泡沫”终于破了

暴跌83%!娃哈哈的“情绪泡沫”终于破了

ZAKER新闻
2026-06-02 19:36:10
李楠已任中国农业发展银行党委委员

李楠已任中国农业发展银行党委委员

澎湃新闻
2026-06-02 19:02:26
上海为何不敌广厦?卢伟发声直戳要害,避谈裁判,王博就不客气了

上海为何不敌广厦?卢伟发声直戳要害,避谈裁判,王博就不客气了

萌兰聊个球
2026-06-03 07:15:05
再见,杨瀚森,8换1或去雄鹿

再见,杨瀚森,8换1或去雄鹿

体育新角度
2026-06-02 19:59:18
世界杯热身赛综述:比利时2-0克罗地亚!摩洛哥4-0,加纳遭绝平

世界杯热身赛综述:比利时2-0克罗地亚!摩洛哥4-0,加纳遭绝平

我爱英超
2026-06-03 06:43:31
潜水员在加勒比海捞到谷歌原型表,泄露渠道比酒吧还魔幻

潜水员在加勒比海捞到谷歌原型表,泄露渠道比酒吧还魔幻

全栈遛狗员
2026-06-02 14:35:24
新阿扎尔!切尔西谈判 1.3 亿世界巨星!阿隆索要带蓝军重返巅峰

新阿扎尔!切尔西谈判 1.3 亿世界巨星!阿隆索要带蓝军重返巅峰

一隅非生
2026-06-03 07:47:01
央视曝光:多款网红驱蚊液,用的是农药标的是“化妆品”,成本仅几毛钱

央视曝光:多款网红驱蚊液,用的是农药标的是“化妆品”,成本仅几毛钱

新浪财经
2026-06-01 22:17:10
上海男篮公示总决赛G5主场球票:有望18000名球迷见证队史第二冠

上海男篮公示总决赛G5主场球票:有望18000名球迷见证队史第二冠

狼叔评论
2026-06-03 00:23:11
徐志胜女友正脸首曝光!恋爱五年见家长,网友:这夫妻相绝了

徐志胜女友正脸首曝光!恋爱五年见家长,网友:这夫妻相绝了

阿废冷眼观察所
2026-06-02 18:51:14
俄罗斯官员告知普京,俄乌冲突已超出了俄财政承受能力!

俄罗斯官员告知普京,俄乌冲突已超出了俄财政承受能力!

闻号说经济
2026-06-02 10:43:10
瞒了整整三个月!伊朗终于官宣大事,局势已彻底尘埃落定?

瞒了整整三个月!伊朗终于官宣大事,局势已彻底尘埃落定?

一网打尽全球焦点
2026-06-03 02:53:45
2026-06-03 08:27:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15372文章数 66896关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

特朗普:已同以黎通话协调停火 一周内将与伊达成协议

头条要闻

特朗普:已同以黎通话协调停火 一周内将与伊达成协议

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

智元和宇树的“暗战”愈演愈烈

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

游戏
手机
艺术
本地
公开课

离发售不远了!《寂静岭》系列新作已公开游戏评级

手机要闻

苹果获新专利 在iPhone摄像头模组内注入矿物油散热

艺术要闻

二十年前割麦的场景

本地新闻

用剪纸的方式,打开江苏扬州

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版