网易首页 > 网易号 > 正文 申请入驻

新研究揭示开源AI模型安全风险:若脱离限制运行或将被黑客劫持

0
分享至

IT之家 1 月 30 日消息,路透社 1 月 29 日援引一项最新研究称,开源大语言模型若脱离主流平台的护栏与限制,在外部计算机上运行,就可能成为黑客与犯罪分子轻易劫持的目标,带来新的安全漏洞与风险。

研究人员表示,攻击者可以直接针对运行大语言模型的主机下手,随后操控模型生成垃圾信息、编写钓鱼内容、发动虚假信息宣传,从而绕开大型平台原有的安全机制。


这项研究由 SentinelOne 与 Censys 两家网络安全公司历时 293 天联合完成,并独家提供给路透社,揭示了数千个开源大语言模型部署背后潜在的非法用途规模。研究人员称,风险场景涵盖黑客攻击、仇恨言论与骚扰、暴力血腥内容生成、个人数据窃取、诈骗与欺诈,甚至在个别情况下还涉及儿童性虐待材料

研究人员指出,开源大语言模型变体数量庞大,互联网上可访问的运行实例中,相当一部分来自 Meta 的 Llama、谷歌 DeepMind 的 Gemma 等主流模型的衍生版本。IT之家从报道中获悉,部分开源模型自带护栏,研究仍发现数百起护栏被明确移除的情况。

SentinelOne 情报与安全研究执行主任 Juan Andres Guerrero-Saade 强调,行业对于安全控制的讨论正在“忽略一种明显存在的剩余能力”,开源算力正在被用于各种用途,其中既有合法用途,也有明显的犯罪用途。Guerrero-Saade 把这种现象比作一座尚未被行业与开源社区充分纳入视野的“冰山”。

研究团队重点分析了通过 Ollama 部署、对公众开放访问的开源大语言模型实例。Ollama 是一种工具,个人或机构可在本地运行不同模型的自有版本。

研究人员在约四分之一的观察对象中能够读取系统提示词,也就是决定模型行为的核心指令。在这些可见提示词中,7.5% 被判断可能会为有害行为提供支持。

全球人工智能治理中心 CEO 兼创始人 Rachel Adams 在邮件中表示,开放模型一旦发布,责任就不再只属于单一主体,而是生态系统共同承担,包括最初发布模型的实验室。实验室不可能对所有下游滥用负责,因为这些行为很难提前预料,但实验室仍负有重要的注意义务,需要预判可预见风险、记录危害,并提供缓解工具与指导,尤其是在全球执法能力不均衡的背景下。

声明:包含AI生成内容

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
帮儿子带6年娃,孙女要上小学了,儿媳怀上二胎,我果断回了老家

帮儿子带6年娃,孙女要上小学了,儿媳怀上二胎,我果断回了老家

清水家庭故事
2026-05-06 15:00:27
龚正率上海市代表团在辽宁沈阳与许昆林王新伟会谈交流,共商沪辽交流合作大计

龚正率上海市代表团在辽宁沈阳与许昆林王新伟会谈交流,共商沪辽交流合作大计

澎湃新闻
2026-05-11 22:58:26
世乒赛女团决赛:3-2险胜背后,孙颖莎力挽狂澜,续写七连冠传奇

世乒赛女团决赛:3-2险胜背后,孙颖莎力挽狂澜,续写七连冠传奇

小噎论事
2026-05-12 02:46:21
林诗栋跳球台庆夺冠,会被罚款吗?答案很明显

林诗栋跳球台庆夺冠,会被罚款吗?答案很明显

youyou喜欢你
2026-05-11 17:31:34
郑丽文这招太狠!国民党民众党史无前例联手,民进党气到跳脚

郑丽文这招太狠!国民党民众党史无前例联手,民进党气到跳脚

兰妮搞笑分享
2026-05-12 03:21:17
外交部透露特朗普访华安排

外交部透露特朗普访华安排

南方都市报
2026-05-11 15:44:37
在获得中方关键支持后,杜特尔特家族出手反击了

在获得中方关键支持后,杜特尔特家族出手反击了

回京历史梦
2026-05-11 19:15:38
皇马更衣室提前站队?3大核心力挺穆里尼奥,除贝林厄姆还有谁

皇马更衣室提前站队?3大核心力挺穆里尼奥,除贝林厄姆还有谁

万花筒体育球球
2026-05-11 17:37:10
炸锅!穆里尼奥回归皇马条件曝光,5 大球星要被扫地出门

炸锅!穆里尼奥回归皇马条件曝光,5 大球星要被扫地出门

奶盖熊本熊
2026-05-11 00:35:03
跌30%!上海明星板块,也撑不住了?

跌30%!上海明星板块,也撑不住了?

新浪财经
2026-05-11 20:08:13
他套现百亿,留下27万股民和一张ST废纸,闻泰科技给投资者上了一课

他套现百亿,留下27万股民和一张ST废纸,闻泰科技给投资者上了一课

A活着
2026-05-09 20:47:26
西宁女生、安康男孩,失联细节太相似了:都是夜间去复印试卷

西宁女生、安康男孩,失联细节太相似了:都是夜间去复印试卷

魔都姐姐杂谈
2026-05-11 22:08:26
麻雀变凤凰!全球射程最远空空导弹PL-17已集成至中国歼-10C战机

麻雀变凤凰!全球射程最远空空导弹PL-17已集成至中国歼-10C战机

军迷战情室
2026-05-11 23:38:07
陈丽华去世1个月,迟重瑞近况曝光,外出游玩气色好,笑容很温和

陈丽华去世1个月,迟重瑞近况曝光,外出游玩气色好,笑容很温和

东方不败然多多
2026-05-12 03:22:28
英特尔盘前涨幅扩大至8%

英特尔盘前涨幅扩大至8%

每日经济新闻
2026-05-11 17:58:41
出乎所有人预料,特朗普修改访华计划,中方官宣,他必须多来一天

出乎所有人预料,特朗普修改访华计划,中方官宣,他必须多来一天

影孖看世界
2026-05-11 18:05:24
塞尔主持:姆巴佩可能以为皇马是主队2-0领先,才发了Hala Madrid

塞尔主持:姆巴佩可能以为皇马是主队2-0领先,才发了Hala Madrid

懂球帝
2026-05-11 12:09:08
一个手握千亿男装帝国的富二代,为什么突然疯了呢?

一个手握千亿男装帝国的富二代,为什么突然疯了呢?

流苏晚晴
2026-05-09 19:01:09
王仕鹏孙悦杨鸣齐开口!京粤生死战谁能笑到最后,三人观点出奇一致

王仕鹏孙悦杨鸣齐开口!京粤生死战谁能笑到最后,三人观点出奇一致

慢歌轻步谣
2026-05-11 13:46:16
CPI保持温和回升、PPI涨幅扩大——透视4月份物价数据

CPI保持温和回升、PPI涨幅扩大——透视4月份物价数据

新华社
2026-05-11 17:05:04
2026-05-12 05:20:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
343715文章数 607202关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

母女二人一年用水量高达400多吨 警方发现背后隐情

头条要闻

母女二人一年用水量高达400多吨 警方发现背后隐情

体育要闻

梁靖崑:可能是最后一届了,想让大家记住这个我

娱乐要闻

“孕妇坠崖案”王暖暖称被霸凌协商解约

财经要闻

宗馥莉罢免销售负责人 部分业务将外包

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

健康
时尚
数码
旅游
亲子

干细胞能让人“返老还童”吗

今年夏天最流行的5双凉鞋,配裙子绝美!

数码要闻

荣耀600系列全解读:肖战代言、幸运星设计、2亿影像,值得冲吗?

旅游要闻

打卡同色系风景 带火城市微旅行

亲子要闻

你们都喜欢哪些科目啊?

无障碍浏览 进入关怀版