网易首页 > 网易号 > 正文 申请入驻

新研究揭示开源AI模型安全风险:若脱离限制运行或将被黑客劫持

0
分享至

IT之家 1 月 30 日消息,路透社 1 月 29 日援引一项最新研究称,开源大语言模型若脱离主流平台的护栏与限制,在外部计算机上运行,就可能成为黑客与犯罪分子轻易劫持的目标,带来新的安全漏洞与风险。

研究人员表示,攻击者可以直接针对运行大语言模型的主机下手,随后操控模型生成垃圾信息、编写钓鱼内容、发动虚假信息宣传,从而绕开大型平台原有的安全机制。


这项研究由 SentinelOne 与 Censys 两家网络安全公司历时 293 天联合完成,并独家提供给路透社,揭示了数千个开源大语言模型部署背后潜在的非法用途规模。研究人员称,风险场景涵盖黑客攻击、仇恨言论与骚扰、暴力血腥内容生成、个人数据窃取、诈骗与欺诈,甚至在个别情况下还涉及儿童性虐待材料

研究人员指出,开源大语言模型变体数量庞大,互联网上可访问的运行实例中,相当一部分来自 Meta 的 Llama、谷歌 DeepMind 的 Gemma 等主流模型的衍生版本。IT之家从报道中获悉,部分开源模型自带护栏,研究仍发现数百起护栏被明确移除的情况。

SentinelOne 情报与安全研究执行主任 Juan Andres Guerrero-Saade 强调,行业对于安全控制的讨论正在“忽略一种明显存在的剩余能力”,开源算力正在被用于各种用途,其中既有合法用途,也有明显的犯罪用途。Guerrero-Saade 把这种现象比作一座尚未被行业与开源社区充分纳入视野的“冰山”。

研究团队重点分析了通过 Ollama 部署、对公众开放访问的开源大语言模型实例。Ollama 是一种工具,个人或机构可在本地运行不同模型的自有版本。

研究人员在约四分之一的观察对象中能够读取系统提示词,也就是决定模型行为的核心指令。在这些可见提示词中,7.5% 被判断可能会为有害行为提供支持。

全球人工智能治理中心 CEO 兼创始人 Rachel Adams 在邮件中表示,开放模型一旦发布,责任就不再只属于单一主体,而是生态系统共同承担,包括最初发布模型的实验室。实验室不可能对所有下游滥用负责,因为这些行为很难提前预料,但实验室仍负有重要的注意义务,需要预判可预见风险、记录危害,并提供缓解工具与指导,尤其是在全球执法能力不均衡的背景下。

声明:包含AI生成内容

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
FIFA反对!伊朗退出世界杯进倒计时,韩媒反常:国足递补希望增大

FIFA反对!伊朗退出世界杯进倒计时,韩媒反常:国足递补希望增大

越岭寻踪
2026-03-20 03:26:17
卡福:15年来,巴西队几乎没一个同级别的球员能帮内马尔分担责任

卡福:15年来,巴西队几乎没一个同级别的球员能帮内马尔分担责任

懂球帝
2026-03-20 07:01:04
人到晚年才醒悟:跟兄弟姐妹断亲,是你这辈子最贵的一笔账

人到晚年才醒悟:跟兄弟姐妹断亲,是你这辈子最贵的一笔账

孤酒老巷QA
2026-03-01 09:55:04
5300亿资金撤离被严查!国家重拳整治1.5万富豪移民,这次动真格

5300亿资金撤离被严查!国家重拳整治1.5万富豪移民,这次动真格

老特有话说
2026-03-19 17:15:40
伊朗人终于开窍了:用爱泼斯坦当武器,比导弹好使多了

伊朗人终于开窍了:用爱泼斯坦当武器,比导弹好使多了

荷兰豆爱健康
2026-03-16 09:41:44
翁晓玲质疑赖清德是“日本人后代”,让绿鹰犬们气急败坏

翁晓玲质疑赖清德是“日本人后代”,让绿鹰犬们气急败坏

郭茂辰海峡传真
2026-03-19 20:52:43
首个特朗普金卡中国买家曝光,系全球WiFi之王,正被美商务部调查

首个特朗普金卡中国买家曝光,系全球WiFi之王,正被美商务部调查

肖兹探秘说
2026-03-20 17:15:27
男子赚够钱后买房车潇洒养老,仅6年突然破产:刚知老婆负债3千万

男子赚够钱后买房车潇洒养老,仅6年突然破产:刚知老婆负债3千万

嫹笔牂牂
2026-03-19 07:12:18
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
同济大学教授的晚年困境:条件好的家庭,不要把孩子养得利欲熏心

同济大学教授的晚年困境:条件好的家庭,不要把孩子养得利欲熏心

洞见
2026-03-19 09:38:23
独居女性家门口出现不明符号,公安提醒:立即清除符号

独居女性家门口出现不明符号,公安提醒:立即清除符号

齐鲁壹点
2026-03-20 05:46:00
旗袍映江南,玉足踏古巷

旗袍映江南,玉足踏古巷

艾斯莱斯奈斯
2026-03-20 11:55:02
CCTV5直播!下午17点,亚洲杯决赛,日本队决战澳大利亚队争冠

CCTV5直播!下午17点,亚洲杯决赛,日本队决战澳大利亚队争冠

何老师呀
2026-03-21 01:40:03
中俄联手都镇不住高市早苗,知名学者判断:中日一个月内或有空战

中俄联手都镇不住高市早苗,知名学者判断:中日一个月内或有空战

安安说
2026-03-02 13:42:53
实探金价暴跌后的北京菜百:有人下单200克金条即拿即走,有人下单后未付款观望金价变化

实探金价暴跌后的北京菜百:有人下单200克金条即拿即走,有人下单后未付款观望金价变化

极目新闻
2026-03-20 15:48:20
英国暴发疫情,已扩散至法国

英国暴发疫情,已扩散至法国

中国经济网
2026-03-19 16:10:06
中产返贫四件套,普通人一个都别碰!

中产返贫四件套,普通人一个都别碰!

时评人李文君
2026-03-19 21:26:56
美以伊开打20天,下一步最大威胁,是粮食和淡水危机

美以伊开打20天,下一步最大威胁,是粮食和淡水危机

红星新闻
2026-03-19 18:45:22
老了才懂:兄弟姐妹中,最自私、最会算计的人,最后都活成了这样

老了才懂:兄弟姐妹中,最自私、最会算计的人,最后都活成了这样

风起见你
2026-03-18 20:14:28
“一辈子都写不出来的人生金句,句句入心,值得收藏”

“一辈子都写不出来的人生金句,句句入心,值得收藏”

心灵悦读
2026-03-19 06:55:32
2026-03-21 05:00:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
335189文章数 607077关注度
往期回顾 全部

科技要闻

宇树招股书拆解,人形机器人出货量第一!

头条要闻

英国授权美军用其基地打伊朗 伊外长:将行使自卫权回应

头条要闻

英国授权美军用其基地打伊朗 伊外长:将行使自卫权回应

体育要闻

6年前的一场悲剧,造就了“法国瓦尔迪”

娱乐要闻

总台首届电影盛典,“沈马”CP再合体

财经要闻

金融法草案向社会公开征求意见

汽车要闻

何小鹏坦白局:每月3亿的“慌”与通向L4的坚定

态度原创

本地
艺术
亲子
教育
公开课

本地新闻

春色满城关不住|绍兴春日顶流,这片樱花海藏不住了

艺术要闻

一位画家跟美少女保姆模特的那个事

亲子要闻

为什么有钱人家孩子一般长相都不错?网友:要有钱有闲

教育要闻

爸爸身上的钱是妈妈的两倍,还少八元,请问爸爸身上有多少钱

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版