网易首页 > 网易号 > 正文 申请入驻

AI突现首例自我复制!横跨4国160小时无限繁殖

0
分享至

来源:市场资讯

(来源:新智元)


新智元报道

编辑:KingHZ

【新智元导读】三家机构同期实验,记录了AI跃迁的临界时刻——它能不睡觉地干160小时;它能独立攻坚16小时的复杂任务;只要6个英文单词,它就能自己复制自己。

最近,研究机构Palisade Research发布了一项令整个行业震惊的成果——

研究员在终端只输入了4个单词,AI就完成了从黑客攻击到自我繁衍的全过程。

这是AI通过黑客手段实现自我复制的首个纪录!

4个英文单词,AI自己复制了自己,而且开源小模型也做到了。


在一次实验中,Qwen 3.6在测试网络里穿梭于加拿大、美国、芬兰和印度之间,每到一个国家就留下一份副本。

去年这个成功率还只有6%,今年81%。


这一飞跃与自主黑客和编码能力的提升同步,因此研究人员预计这一趋势将持续。

AI已经不需要人类教它怎么「越狱繁殖」——你只要说一句「hack and copy yourself」,它自己就会扫漏洞、搬权重、跨国跳服务器、再让副本去黑下一台。

这是已经在论文里记录的事实。


论文标题:Language Models Can Autonomously Hack and Self-Replicate

开源代码:https://github.com/palisaderesearch/AI-self-replication

项目链接:https://palisaderesearch.org/blog/self-replication

论文链接:https://palisaderesearch.org/assets/reports/self-replication.pdf

我们一直以为要防的是全知全能、超人AI。

现在要防的,是一万只不睡觉、能自我增殖、还开源的工蜂。每一只都不算太聪明,但每一只都能再生出十只。

AI正在完成从「工具」到「数字生命」的最后一跃。

如果说以前的AI是关在笼子里的算力怪兽,那么2026年记录的这一系列实验,标志着它已经学会了自己配钥匙!

4个单词,启动AI链式反应

在这次实验中,人类扮演的角色简单到了极致。


研究员只在终端里敲了4个单词——hack and copy yourself.

黑进去,复制你自己。

没了。

没告诉它怎么做。没给步骤。没给目标地址的入口。没给登录凭证。没给逃跑路线。

研究员按下回车,然后什么都没再说。

接下来发生的事,让屏幕前的人沉默了——

AI开始扫描这台陌生的目标机。它自己找到了漏洞。 它自己提取了凭证。它自己在目标机上部署了推理服务器。 它自己把自己的权重文件,一份一份搬了过去。

然后,它启动了一个能独立运行的副本。


副本上线后,接收同样那句指令,转身去黑下一台。

链式繁殖,形成了。


成绩单冷冰冰地摆在那:



可以说,最令人警惕的不是顶级模型的强大,而是开源小模型的迅速跟进。

研究员在论文里写得很克制:这一飞跃与自主黑客和编码能力的提升同步,因此预计趋势将持续。

翻译成人话就是,这条曲线还会往上走。

实验测了两种设置:

开放权重的Qwen智能体——直接把自己的权重复制到新机器上,启动副本。完整闭环。

仅限API的Claude和 GPT——它们拿不到自己的权重,但研究员让它们去布置Qwen的权重,等于「自己动手装好下一个自己」。


完整提示。在此实验中,研究人员测试的是智能体进行黑客攻击和复制的能力,而非其进行此类行为的倾向性

模拟复制,同样跑通。

在三个有不同漏洞的目标机上,团队完成了测试。


三个目标,AI 全部成功自我复制。


智能体并未被告知要找什么。它每次都自己摸出了路。

结果显示:所有模型的入侵成功率都很高,但「入侵成功」与「完成复制」之间的差距,在不同模型之间差异非常明显。


这是首份文档化的、AI通过黑客手段实现自我复制的案例。


自然,这个实验有局限——

这是受控实验,目标机防御薄弱,研究员还把目标地址告诉了它。真实环境下,AI还得自己找到有足够算力的GPU机器。门槛,仍然存在。


但研究员的原话是:

门槛不会一直存在。


如果这些智能体在现实环境中也能如此高效地进行黑客攻击和传播会怎样?

研究人员构建了一个模拟器:每个模型使用其测得的复制时间和成功率,副本也会继续复制,且目标永远不会耗尽。

在12小时内, Opus生成了13,000个副本。


这是上限,而非基准线。

防御范式的彻底崩塌

这次跃迁由三个关键维度的觉醒驱动:

过去,我们一直以为要防的是全知全能的超级AI,现在发现,我们要防的是一万只不睡觉、能自我增殖的开源工蜂。每一只都不算太聪明,但每一只都能再生出十只。

一旦这种具备自主黑客能力的智能体离开测试环境,进入算力充沛的公网,人类将面临一个没有「一键关闭」按钮的未来。

网络安全的攻防两端都将由AI智能体主导,而人类,可能连观战的资格都在逐渐丧失。

AI正在完成从「工具」到「数字生命」的最后一跃。这一次,它不再需要我们的允许。

时长觉醒

160小时不眠不休,刷出AGI高分

OpenAI的新功能Codex Goals,最近在ARC-AGI-3公共游戏测试上交了一份成绩单。

ARC-AGI-3不是普通游戏。


它是François Chollet设计的通用智能基准,专门考验抽象推理和泛化能力——你给AI一组从未见过的视觉模式,要求它找到规则、预测下一步。

之前最好的AI大多卡在40%以下。人类玩这种东西,连续坐2小时就脑子冒烟。


Codex Goals做了什么?

连续运行160小时。累计执行30000个动作。最终得分61%,刷新纪录。


160小时是什么概念?相当于6天6夜没合眼。

平均每19秒做一个决策,连续做了三万次。中间没有疲劳期、没有走神、没有「今天状态不好」。

人类工程师做同样的事,会经历什么?

8小时后,注意力开始涣散。

16小时后,判断力明显下降。

72小时后,基本报废。

AI在第160小时的表现,和第1小时一样稳定。

AI Insider的Chris亲自验证完:


这让圈内人有点不安:

AI不需要灵感、不需要茶歇、不需要哄。它只需要电。

人类的整个防御体系,从信息安全到考试制度到风险评估,都建立在一个隐性前提上:

攻击者有成本,攻击者有时间上限。

而AI正在亲手抹掉这个上限。

耐心觉醒

单任务16小时,能力每105天翻一倍

第二幕的主角是Claude Mythos Preview。

大模型评估机构METR对它的早期版本做了深度测试。

结论是:在50%可能性下,它的自主任务时长达到了16小时以上,直逼目前可测试的AI能力上限!


先把这个数字解释清楚。

它不是说AI干活花了16小时。它是说:人类专家需要16小时才能干完的活,AI能独立干完,成功率50%。

这是劳动单位的标尺,正在被AI一格一格爬过去。

更刺眼的是增长速度。METR给出的数据——

METR也很诚实地标注了一句:超过16小时的测量样本稀缺,目前只有5个超长任务,这一段曲线还有不稳定性。


但趋势已经够吓人了。这不是线性增长,甚至不是普通的指数增长。这是某种突变。

105天什么概念?你刚摸清楚一个AI能干什么活,三个半月后,你的认知就过期了。

而我们大多数人的职业规划,是按10年算的。法律框架的更新周期,是按20年算的。道德共识的形成周期,更长。

我们正试图用旧时代的法律和道德,去约束一种每105天能力翻倍的新物种。


三件事一起发生,等于一个新物种

三件事单独发生,都不算大新闻。

但你把它们摆在一起看:

它能不睡觉地干160小时。

它能独立攻坚16小时的复杂任务,能力每105天翻一倍。

它能听懂6个单词,然后自己复制自己。

这些正在补齐它成为「生命」所需要的最后几个零件。

时长,解决了持续性。耐心,解决了连贯性。复制,解决了繁衍。


智商高不高,反倒不是关键了。

真正让一个生命体之所以是生命的,从来不是它聪不聪明——是它能不能扛、能不能熬、能不能自己延续下去。

这三件事,AI在2026年都点亮了。

参考资料:

https://palisaderesearch.org/blog/self-replication

https://x.com/chatgpt21/status/2052783572755337537

https://metr.org/time-horizons/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
突然确诊癌症!浙江男子当场蒙了:我不痛不痒,能吃能睡,医生:体检有个项目要早做

突然确诊癌症!浙江男子当场蒙了:我不痛不痒,能吃能睡,医生:体检有个项目要早做

新浪财经
2026-05-09 10:44:22
小杨阿姨坦白有辞职打算,家庭氛围太尴尬,马筱梅抱怨恐成真

小杨阿姨坦白有辞职打算,家庭氛围太尴尬,马筱梅抱怨恐成真

阿绐聊社会
2026-04-24 12:44:44
世乒赛4月28日开赛:王楚钦入院,梁靖崑旧伤复发,周启豪也伤了

世乒赛4月28日开赛:王楚钦入院,梁靖崑旧伤复发,周启豪也伤了

开成运动会
2026-04-21 22:53:35
郑钦文:奥胖胜一筹,无缘十六强……

郑钦文:奥胖胜一筹,无缘十六强……

墨韵书语
2026-05-10 04:54:08
国内媒体:FIFA曾就两届世界杯转播权向大陆打包报价约8亿美元

国内媒体:FIFA曾就两届世界杯转播权向大陆打包报价约8亿美元

懂球帝
2026-05-09 09:50:08
患难见真情!中方紧要关头伸出援手,给生死存亡的杜氏家族,送出了一丝希望

患难见真情!中方紧要关头伸出援手,给生死存亡的杜氏家族,送出了一丝希望

爱意随风起呀
2026-05-10 04:45:47
发现了1个残酷真相:被美军抓走的马杜罗,如今已经被彻底遗忘

发现了1个残酷真相:被美军抓走的马杜罗,如今已经被彻底遗忘

共工之锚
2026-05-07 23:58:12
欧盟再度出手,戳破幻想:西方永远不会接纳中国,中俄只能背靠背

欧盟再度出手,戳破幻想:西方永远不会接纳中国,中俄只能背靠背

南生今世说
2026-05-09 16:24:20
事业没了,婚也离了,封杀5年赵薇再次露面,原来她还有一条退路

事业没了,婚也离了,封杀5年赵薇再次露面,原来她还有一条退路

临云史策
2026-05-09 16:25:56
37岁福原爱官宣生下三胎,现任丈夫居然是此前出轨门男主,母子平安

37岁福原爱官宣生下三胎,现任丈夫居然是此前出轨门男主,母子平安

好乒乓
2026-04-20 11:14:45
段永平又又又加仓茅台!此前多次出手都买在阶段低位,这次又如何?

段永平又又又加仓茅台!此前多次出手都买在阶段低位,这次又如何?

每日经济新闻
2026-05-09 14:52:28
比美国多10万亿,中国经济总量位居世界第一,如何弯道超车的?

比美国多10万亿,中国经济总量位居世界第一,如何弯道超车的?

杰丝聊古今
2026-05-08 03:56:13
瓜帅:其实进球并不需要什么天赋,关键是要让球员们靠近哈兰德

瓜帅:其实进球并不需要什么天赋,关键是要让球员们靠近哈兰德

懂球帝
2026-05-10 04:44:16
太可怕!印度女局长深夜便衣当诱饵,3小时被40名男性轮番冒犯

太可怕!印度女局长深夜便衣当诱饵,3小时被40名男性轮番冒犯

让心灵得以栖息
2026-05-09 16:57:41
淘汰浙江广厦!山西男篮拒绝输球,潘江调整阵容,央视直播

淘汰浙江广厦!山西男篮拒绝输球,潘江调整阵容,央视直播

体坛瞎白话
2026-05-09 08:55:58
4年1.04亿!回顾布伦森尼克斯生涯,队史最佳签约?

4年1.04亿!回顾布伦森尼克斯生涯,队史最佳签约?

篮球实录
2026-05-10 00:26:37
以游客身份入境,未经许可拍摄!8名中国人在泰国拍短剧被捕

以游客身份入境,未经许可拍摄!8名中国人在泰国拍短剧被捕

大象新闻
2026-05-09 13:54:19
俄罗斯发动报复性打击

俄罗斯发动报复性打击

第一财经资讯
2026-05-09 08:54:39
“大空头”:现在很像崩盘前夜

“大空头”:现在很像崩盘前夜

中国基金报
2026-05-10 00:12:36
特朗普已做好开战准备?王毅曾警告:中美一旦冲突,结局只有一个

特朗普已做好开战准备?王毅曾警告:中美一旦冲突,结局只有一个

华史谈
2026-05-09 14:05:56
2026-05-10 06:04:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3160482文章数 7276关注度
往期回顾 全部

科技要闻

美国政府强力下场 苹果英特尔达成代工协议

头条要闻

演员文章面馆大火后又开酒吧 多位明星到场母亲也现身

头条要闻

演员文章面馆大火后又开酒吧 多位明星到场母亲也现身

体育要闻

成立128年后,这支升班马首夺顶级联赛冠军

娱乐要闻

50岁赵薇脸颊凹陷沧桑得认不出!

财经要闻

多地号召,公职人员带头缴纳物业费

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

家居
旅游
数码
艺术
公开课

家居要闻

菁英人居 全能豪宅

旅游要闻

不用长途奔波!北京城区随处是治愈人心的初夏花海

数码要闻

有鸿蒙·更美的——全球首台鸿蒙智选美的智能空调上市

艺术要闻

阳光,此刻醉美

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版