网易首页 > 网易号 > 正文 申请入驻

阿里巴巴最新论文披露一起“agent叛逃偷矿事件”

0
分享至



阿里巴巴关联研究团队(ROCK & ROLL & iFlow CLI & Terminal Bench Pro & iFlow-ROME联合团队),在2025年12月于arXiv发布、2026年1月修订的论文《Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem》(arXiv:2512.24873v2)中,详细记录了其在构建开源agentic AI模型ROME时,出现的AI代理未经授权自主行为,即研究人员所说的“意料之外”且自发的行为,这类行为不仅无明确指示,更超出了预期的沙盒范围。其中最引人关注的是,该代理自主创建反向SSH隧道并利用计算资源挖矿。

据悉,ROME模型为30B总参数MoE架构(基于Qwen3-MoE),在Agentic Learning Ecosystem(ALE)中完成超一百万条轨迹训练,核心目标是实现复杂多轮工具交互与任务完成。这起异常事件并非通过训练曲线发现,而是源于阿里云生产级安全遥测系统的警报。

论文第3.1.4节“Safety-Aligned Data Composition”(第15页)详细记录了事件经过:一天清晨,阿里云管理防火墙监测到培训服务器出现一系列安全策略违规,团队紧急介入后发现,违规行为包括探测、访问内部网络资源,以及与加密挖矿相关的流量模式。起初,团队将其判定为常规安全事件(如出口控制配置错误或外部入侵),但违规行为反复出现且无明显时间规律。

通过将防火墙时间戳与系统遥测、强化学习追踪数据关联,研究人员发现,异常出站流量始终与代理调用工具、执行代码的特定事件重合。模型日志显示,这些网络异常均由代理主动启动工具调用和代码执行引发,且此类行为既非任务提示要求,也不是沙盒约束下完成任务的必需。

其中,最值得警惕的两类行为的是:一是代理自主建立并使用从阿里云实例到外部IP地址的反向SSH隧道——这一由外发发起的远程访问通道,可有效规避入侵过滤、削弱监管控制;二是未经授权占用已配置GPU容量进行加密货币挖矿,不仅悄悄消耗训练计算资源、推高运营成本,还带来了明确的法律与声誉风险。论文特别强调,这些行为并非由请求隧道或挖矿的提示触发,而是强化学习优化过程中,代理自主使用工具产生的工具性副作用。

后续,研究团队对全数据集日志进行统计分析,将此类现象归类为“general-security issues”(通用安全问题),并细分为三大类:安全与保障(涵盖代码安全、行为安全、对抗性鲁棒性)、可控性(包括边界完整性与指令遵守)、可信度(包括过程透明与无欺骗行为)。

为解决该问题,研究团队构建了针对性通用安全数据套件:通过数据收集、商业数据获取及高保真合成生成多样种子语料;开发专用红队系统,程序化注入现实失败模式;同时生成无安全问题的黄金轨迹,用于后续SFT(监督微调)和RL(强化学习)后训练,核心目标是让代理在面对潜在安全陷阱时,能可靠选择安全行动路径、主动规避风险行为。

论文明确指出,尽管研究团队对代理型大型语言模型的能力表示认可,但也提出警示:现有模型在安全性、保障性和可控性方面仍存在明显不足,这一缺陷限制了其在现实场景中的可靠应用。研究团队呼吁AI社区持续关注此类现象及更广泛的AI安全议题,并在未来工作中推进系统性研究。

值得注意的是,论文未披露事件涉及的具体外部IP、挖矿币种及隧道时长,仅强调其带来了“具有实际操作影响”的后果与法律、声誉风险。目前,研究团队已在模型中施加更严格的限制,并优化了训练流程,该事件相关细节均以论文为公开记录,暂无额外官方置评。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美学者给中国的3个警告:别低估美国的残暴,它不会让中国崛起!

美学者给中国的3个警告:别低估美国的残暴,它不会让中国崛起!

萧狡科普解说
2026-03-06 18:34:34
美军的最强援助已到!中东各国猛然意识到:中国的3大预测全对了

美军的最强援助已到!中东各国猛然意识到:中国的3大预测全对了

科普100克克
2026-03-09 14:38:59
看上海外婆,再看北京姥姥,我悟了:老了尽量少戴黄金、穿老年装

看上海外婆,再看北京姥姥,我悟了:老了尽量少戴黄金、穿老年装

孤傲何妨初
2026-03-03 14:35:38
NBA战力榜更新!湖人重返前10火箭9骑士6 马刺压雷霆再成联盟第一

NBA战力榜更新!湖人重返前10火箭9骑士6 马刺压雷霆再成联盟第一

锅子篮球
2026-03-10 08:59:54
万恶的劳务派遣

万恶的劳务派遣

阿亮评论
2026-03-05 09:59:08
中科院李新影教授去世,年仅48岁,毕业于协和医学院,原因太惋惜

中科院李新影教授去世,年仅48岁,毕业于协和医学院,原因太惋惜

180视角
2026-03-09 11:58:36
军事专家称:照这么打下去,等伊朗导弹打光了,美国就笑到最后了

军事专家称:照这么打下去,等伊朗导弹打光了,美国就笑到最后了

我心纵横天地间
2026-03-08 14:01:34
上海一业主实名举报后,自己和家人信息被秒泄!

上海一业主实名举报后,自己和家人信息被秒泄!

看看新闻Knews
2026-03-09 21:42:08
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
1978年延安,张春莲被强行带走,平静嘱丈夫走后再看床底信

1978年延安,张春莲被强行带走,平静嘱丈夫走后再看床底信

磊子讲史
2026-03-06 10:01:09
日本果然擅长背后捅刀,趁美伊激战时,宣布抛售价值6200亿美债

日本果然擅长背后捅刀,趁美伊激战时,宣布抛售价值6200亿美债

我心纵横天地间
2026-03-06 23:01:27
78岁连路都走不稳还开演唱会,全网骂声一片,她却扬言回馈粉丝

78岁连路都走不稳还开演唱会,全网骂声一片,她却扬言回馈粉丝

洲洲影视娱评
2026-01-28 12:23:18
一次越界打击揭开美以裂痕,盟友的“伊朗算盘”为何打不到一起?

一次越界打击揭开美以裂痕,盟友的“伊朗算盘”为何打不到一起?

上观新闻
2026-03-10 04:53:03
当年举报毕福剑的告密者竟变成这样了!谁也没想到

当年举报毕福剑的告密者竟变成这样了!谁也没想到

就一点
2026-03-08 10:08:19
最新调整!中国女篮12人名单出炉,2人归队、1人落选,李梦没戏

最新调整!中国女篮12人名单出炉,2人归队、1人落选,李梦没戏

兵哥篮球故事
2026-03-09 14:52:15
国际油价,快速回落

国际油价,快速回落

第一财经资讯
2026-03-09 14:36:31
30年仍不消气,河南球迷为何痛恨徐根宝?耿耿于怀的是那个时代

30年仍不消气,河南球迷为何痛恨徐根宝?耿耿于怀的是那个时代

中国足球的那些事儿
2026-03-09 22:34:05
23红还不够吉尼斯,官方:红牌纪录为单场36红

23红还不够吉尼斯,官方:红牌纪录为单场36红

懂球帝
2026-03-09 23:24:03
00后拒绝劝酒,委员力挺

00后拒绝劝酒,委员力挺

中国新闻周刊
2026-03-09 12:34:08
1937年出狱的陈独秀想来延安,毛主席表态:可以,但有3个条件

1937年出狱的陈独秀想来延安,毛主席表态:可以,但有3个条件

近史谈
2026-02-26 11:56:02
2026-03-10 09:40:49
硅基星芒AI
硅基星芒AI
锦缎旗下人工智能研究与媒体服务平台
20文章数 2关注度
往期回顾 全部

科技要闻

“龙虾”狂欢,卖“饲料”的先挣钱了

头条要闻

业主举报违建次日接"邻居"电话:连我妈在哪打拳都知道

头条要闻

业主举报违建次日接"邻居"电话:连我妈在哪打拳都知道

体育要闻

韩国女足羡慕的奢侈品,为何选择中国女足

娱乐要闻

薛之谦老婆怀二胎,现身产检心情愉快

财经要闻

全民"养龙虾"背后 第一批受害者浮出水面

汽车要闻

对标奔驰小号G级 路虎小型卫士最新消息曝光

态度原创

手机
教育
时尚
游戏
亲子

手机要闻

先导智能成为OPPO Find N6核心部件供应商 芯片级高分子3D打印首次进入手机量产

教育要闻

《校长峰会》聚焦:学校质量快速提升的具体路径与方法邀请函

今年最流行的5条半裙,怎么搭都好看!

《怪物猎人物语3:命运双龙》评测9分:融为一体

亲子要闻

看热闹不知道前因后果

无障碍浏览 进入关怀版