网易首页 > 网易号 > 正文 申请入驻

新研究揭示开源AI模型安全风险:若脱离限制运行或将被黑客劫持

0
分享至

IT之家 1 月 30 日消息,路透社 1 月 29 日援引一项最新研究称,开源大语言模型若脱离主流平台的护栏与限制,在外部计算机上运行,就可能成为黑客与犯罪分子轻易劫持的目标,带来新的安全漏洞与风险。

研究人员表示,攻击者可以直接针对运行大语言模型的主机下手,随后操控模型生成垃圾信息、编写钓鱼内容、发动虚假信息宣传,从而绕开大型平台原有的安全机制。


这项研究由 SentinelOne 与 Censys 两家网络安全公司历时 293 天联合完成,并独家提供给路透社,揭示了数千个开源大语言模型部署背后潜在的非法用途规模。研究人员称,风险场景涵盖黑客攻击、仇恨言论与骚扰、暴力血腥内容生成、个人数据窃取、诈骗与欺诈,甚至在个别情况下还涉及儿童性虐待材料

研究人员指出,开源大语言模型变体数量庞大,互联网上可访问的运行实例中,相当一部分来自 Meta 的 Llama、谷歌 DeepMind 的 Gemma 等主流模型的衍生版本。IT之家从报道中获悉,部分开源模型自带护栏,研究仍发现数百起护栏被明确移除的情况。

SentinelOne 情报与安全研究执行主任 Juan Andres Guerrero-Saade 强调,行业对于安全控制的讨论正在“忽略一种明显存在的剩余能力”,开源算力正在被用于各种用途,其中既有合法用途,也有明显的犯罪用途。Guerrero-Saade 把这种现象比作一座尚未被行业与开源社区充分纳入视野的“冰山”。

研究团队重点分析了通过 Ollama 部署、对公众开放访问的开源大语言模型实例。Ollama 是一种工具,个人或机构可在本地运行不同模型的自有版本。

研究人员在约四分之一的观察对象中能够读取系统提示词,也就是决定模型行为的核心指令。在这些可见提示词中,7.5% 被判断可能会为有害行为提供支持。

全球人工智能治理中心 CEO 兼创始人 Rachel Adams 在邮件中表示,开放模型一旦发布,责任就不再只属于单一主体,而是生态系统共同承担,包括最初发布模型的实验室。实验室不可能对所有下游滥用负责,因为这些行为很难提前预料,但实验室仍负有重要的注意义务,需要预判可预见风险、记录危害,并提供缓解工具与指导,尤其是在全球执法能力不均衡的背景下。

声明:包含AI生成内容

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
NBA|弗拉格成为史上最年轻49分先生

NBA|弗拉格成为史上最年轻49分先生

北青网-北京青年报
2026-01-30 14:40:14
49条航线“熔断”仅一天,让人恶心的一幕出现,中方罕见升级警告

49条航线“熔断”仅一天,让人恶心的一幕出现,中方罕见升级警告

霁寒飘雪
2026-01-29 19:58:13
国家队集体消失,中国女排花重金都买不来尊重,根本原因只有一个

国家队集体消失,中国女排花重金都买不来尊重,根本原因只有一个

体育快递小哥哥
2026-01-29 18:23:12
5战场均31+5+3!3项命中率太亮眼!杜兰特杀疯了,火箭战绩3胜2负

5战场均31+5+3!3项命中率太亮眼!杜兰特杀疯了,火箭战绩3胜2负

熊哥爱篮球
2026-01-30 13:02:53
布鲁克林分享爱妻惬意床照,妮可拉赤裸上身瘦脱相,原因令人称赞

布鲁克林分享爱妻惬意床照,妮可拉赤裸上身瘦脱相,原因令人称赞

夜深爱杂谈
2026-01-28 22:52:08
前申花老板朱俊爆料久事把申花卖给交运了,实际情况是怎么样的呢

前申花老板朱俊爆料久事把申花卖给交运了,实际情况是怎么样的呢

梅亭谈
2026-01-30 07:22:05
三星堆不是没法解释,而是不好解释:再挖下去《山海经》就成真了

三星堆不是没法解释,而是不好解释:再挖下去《山海经》就成真了

铭记历史呀
2026-01-27 18:16:58
多品牌金饰克价大幅回调

多品牌金饰克价大幅回调

财联社
2026-01-30 11:08:17
发现金仅是冰山一角!刘强东送老家的年货曝光,外村人急得直跺脚

发现金仅是冰山一角!刘强东送老家的年货曝光,外村人急得直跺脚

法老不说教
2026-01-29 16:26:39
副部级陈旭,当选新职

副部级陈旭,当选新职

上观新闻
2026-01-30 13:01:07
春晚2次联排再惹争议,恶心的事又发生了,该来的不该来的全来了

春晚2次联排再惹争议,恶心的事又发生了,该来的不该来的全来了

李健政观察
2026-01-29 20:22:43
美航母步步紧逼后,伊朗最大强援出现,不是俄罗斯,而是一旁的它

美航母步步紧逼后,伊朗最大强援出现,不是俄罗斯,而是一旁的它

井普椿的独白
2026-01-30 00:34:30
谢杏芳的冷漠,揭开林丹的“婚姻真相”,9年才看懂这盘大棋

谢杏芳的冷漠,揭开林丹的“婚姻真相”,9年才看懂这盘大棋

查尔菲的笔记
2026-01-29 19:17:01
1949年,毛主席给香港定下3条规矩!至今无人敢逾越

1949年,毛主席给香港定下3条规矩!至今无人敢逾越

鹤羽说个事
2026-01-29 16:32:40
3大数据前3!女篮25岁2米王牌闪耀:力压女奥尼尔,宫鲁鸣召她?

3大数据前3!女篮25岁2米王牌闪耀:力压女奥尼尔,宫鲁鸣召她?

李喜林篮球绝杀
2026-01-30 14:56:15
高市发布战争方案,中方接下“战书”,日本渔民被通知:别惹中国

高市发布战争方案,中方接下“战书”,日本渔民被通知:别惹中国

通文知史
2026-01-29 12:50:03
本菲卡4-2皇马:全场最闪耀的19岁阿根廷人,不是马斯坦托诺

本菲卡4-2皇马:全场最闪耀的19岁阿根廷人,不是马斯坦托诺

仰卧撑FTUer
2026-01-29 21:02:11
600313,10分钟直线涨停!农业股,逆势爆发!

600313,10分钟直线涨停!农业股,逆势爆发!

证券时报e公司
2026-01-30 12:26:12
让二追三!英超第3创奇迹,埃梅里率队挺进淘汰赛,目标直指冠军

让二追三!英超第3创奇迹,埃梅里率队挺进淘汰赛,目标直指冠军

足球狗说
2026-01-30 05:54:48
2026-01-30 15:27:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
327315文章数 606928关注度
往期回顾 全部

科技要闻

单季狂赚3000亿;iPhone 17 全球卖疯了!

头条要闻

美智库民调:近四分之三美国人预计中国将超越美国

头条要闻

美智库民调:近四分之三美国人预计中国将超越美国

体育要闻

敢揍多尔特,此子必成大器?

娱乐要闻

金晨出事前 曾灵魂发问未收到春晚邀请

财经要闻

血铅超标工人,挡在“劳动关系”门槛外

汽车要闻

全面科技化 新款梅赛德斯-奔驰S级发布

态度原创

旅游
手机
数码
时尚
公开课

旅游要闻

京彩迎春 ︳一站式预订乡村游!“漫游京郊”智慧平台即将上线

手机要闻

W4周排名出炉,苹果、华为位置互换,小米、荣耀位置也互换

数码要闻

机构:Meta Ray-Ban Display预估带动今年全球AR眼镜95万台出货量

推广|| 冬天利用率超高的裙子,怎么搭都对!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版