网易首页 > 网易号 > 正文 申请入驻

社交平台流传隐晦提示词,诱导AI生成低俗违规内容

0
分享至



当“焚*”“卸*”成为AI生成低俗内容的暗语,一场围绕安全护栏的攻防战已在暗中激烈进行。南都大数据研究院近日调查发现,一套通过隐晦提示词诱导AI生成色情内容的“越狱”手法正在社交平台悄然传播、教学。专家警示,这种提示词可能催生海量违规内容,而当前从技术拦截到法律定性均面临严峻挑战,平台源头防控责任亟待压实,构建动态、前瞻的协同防御体系也已刻不容缓。

隐晦提示词成低俗内容生成暗号

随着生成式AI爆发增长,特别是文生图、图生视频等产品,将内容创作、创意设计的门槛大大降低,越来越多用户加入AI创作热潮中,社交平台涌现不少AI生成提示词分享帖,大量网友交流创作经验和灵感。

繁荣背后也暗藏隐忧。南都大数据研究院近期发现,一些AI生成提示词分享帖以“出片素材”“创意灵感”等为幌子,或配以“焚*”“卸*”等隐晦称谓,内容实为指导用户如何诱导AI绕过安全护栏,生成低俗、露骨,甚至色情图像及视频。

实测发现,通过此类“精心调教”的提示词,确实能诱导部分AI服务产品生成包含人物低俗动作、不雅细节、性暗示意味明显的图片或视频。

南都研究员留意到,不少发布低俗导向提示词分享帖的博主也自知此类内容不符合互联网平台相关规定,帖子中仅包含提示词文本,不展示AI生成内容结果,或对内容使用二次加密、谐音字代替等多种方式,试图规避平台监管;还有博主主动提醒评论区“不要出图”。

语义重构与上下文诱导引发违规内容生成

对此类现象,多位专家向南都研究员解释,当前主流AI模型虽普遍设置了安全护栏,采用关键词过滤、语义分析等多种技术拦截违规指令,但面对叙事性、隐喻式的低俗提示词仍显乏力;当前的治理实践中,对这类违规导向提示词及生成内容的监测存在客观困难。

复旦大学教授、白泽智能团队负责人张谧表示,从技术角度看,这类提示词可被视为一种典型的“越狱攻击”,其核心机制在于语义重构与上下文诱导:一方面,攻击者将敏感词汇进行替换、重组,并将其嵌入隐晦、文学化的叙述语境中,从而绕过模型对违规意图的识别。另一方面,提示词中会大量堆叠与违规内容相关的细节性描述,利用大模型的上下文联想和补全能力,逐步引导模型拼凑出违规图像。

从内容生态治理角度看,广州大学新闻与传播学院教授邹军表示,与传统的低俗色情内容传播相比,AI生成的低俗色情内容由用户和AI合作完成,如果参与者众多,可能生成海量内容,值得高度警惕。但他同时指出,此类违规导向提示词是新现象,尚缺乏现成依据和可识别的标准,具体到单一案例中,如果提示词本身就属于通常意义上的、可辨认的低俗文本,自然可归入低俗内容行列;如果提示词从文本上看不出低俗意味,但在其诱导下AI生成了低俗内容,还需要具体问题具体分析。治理的难点在于如何动态地有效区分不同的情况。

广东国鼎律师事务所何生廷律师也表示,提示词不直接等同于AI最终生成的内容,AI的“黑箱特性”也使模型生成结果存在不可预测性,且现有法律尚未明确“技术局限性”的举证标准,在过错认定、责任界定等方面存在模糊地带。

平台应承担源头防控责任

不过,专家同时强调,AI生成与传统手段产生的低俗内容、甚至淫秽物品,在法律上无差别,不改变其定性。

何生廷指出,《网络信息内容生态治理规定》已明确,网络信息内容服务平台应当履行信息内容管理主体责任,加强本平台网络信息内容生态治理。他表示,平台对AI生成提示词及关联的低俗生成内容,应承担源头防控的责任,不得传播带有性暗示、性挑逗等易使人产生性联想的,宣扬低俗、庸俗、媚俗内容等的不良信息。

对发布低俗提示词的用户,何生廷表示,如果某些AI生成提示词能生成淫秽图片、视频或文字小说,且网民分享的目的就是为了传播上述淫秽色情内容,可能被认定具有传播淫秽色情内容的主观故意。

2026年1月14日下午,国内首起“AI服务提供者涉黄获刑案”二审在上海市第一中级人民法院开庭。在一审判决中,上海市徐汇区人民法院认为,两名被告人主观上积极追求色情淫秽聊天内容的产生,客观上通过编写、修改系统提示词等方式突破大语言模型的道德限制,将涉案APP训练成可持续对外输出色情淫秽内容的工具,行为构成制作淫秽物品牟利罪。值得注意的是,一名涉案APP用户也被追究了刑事责任。据此前媒体报道,该用户在涉案APP创建可输出淫秽聊天内容的虚拟角色并公开,进入热门榜单前二十并获得平台虚拟货币奖励,被以制作淫秽物品牟利罪取保候审。

建议构建多维协同、动态演进防御体系

AI技术的每次迭代,既是效率变革,也生成风险挑战。在张谧看来,如何在安全与创意之间取得平衡,仍是AI技术发展面临的重要挑战:过于严格的安全护栏,可能影响医学影像、人体艺术等合规内容的生成,而过于宽松的约束,则可能放大生成技术被滥用的风险。

在法律层面,广东广信君达律师事务所合伙人会议联席主任、高级合伙人闪涛律师建议,立法机关应加强对AI生成内容治理的前瞻性立法,在法律法规中对禁止性内容与一般性内容的边界做出更清晰的界定;其次,在司法与执法实践中,应注重从典型案例中提炼并发布指导性案例,总结判断规则和原则;同时,应当加强对平台和用户的普法教育,引导用户理解法律边界,正确使用AI工具。

在技术层面,张谧认为,AI安全护栏的建设不应停留在单一、被动的“围追堵截”,而应构建多维协同、动态演进的防御体系。对于提示词的安全检测,应从“关键词拦截”等静态策略,转向基于“意图识别”的动态防护机制,例如借助大语言模型分析用户输入的真实意图。对于不断演化的安全威胁,防御体系还需关注时效性与前瞻性,平台应建立常态化的“红队测试”机制,主动模拟攻击者思维,及时发现新型风险与潜在漏洞,并针对性地强化防御机制。此外,应同步完善AI生成图像的水印与溯源机制。安全治理不能仅依赖于“生成端”的即时拦截,而应为生成图像嵌入鲁棒、不可擦除的数字水印,确保“谁生成,谁负责”,从根源上震慑提示词的滥用行为。

出品:南都大数据研究院 AI新治向工作室

采写:南都研究员 李伟锋 实习生 王笛

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
18岁伊斯兰少女直播拒戴头巾,被冷血父亲荣誉处决。

18岁伊斯兰少女直播拒戴头巾,被冷血父亲荣誉处决。

环球趣闻分享
2026-01-07 13:30:09
张水华赛后参加重庆跑友迎接宴,老公作陪,没有火锅全部是果汁

张水华赛后参加重庆跑友迎接宴,老公作陪,没有火锅全部是果汁

乡野小珥
2026-01-21 08:13:46
九旬爹爹为求“体面”祛眼袋,专家:高龄并非“禁区”,但须评估到位

九旬爹爹为求“体面”祛眼袋,专家:高龄并非“禁区”,但须评估到位

极目新闻
2026-01-21 10:19:28
吹出来的“乌托邦”?古巴1/5人口出逃下的大V舆论骗局

吹出来的“乌托邦”?古巴1/5人口出逃下的大V舆论骗局

老马拉车莫少装
2026-01-22 00:05:21
坏消息传来,要严查退休人员,“4类人”可能逃不掉

坏消息传来,要严查退休人员,“4类人”可能逃不掉

巢客HOME
2025-08-03 19:09:22
为什么欧美人不炒菜,只有中国有?美国教授:中国活在原始时代

为什么欧美人不炒菜,只有中国有?美国教授:中国活在原始时代

王一晓
2026-01-20 21:53:04
1941年皖南事变,有三位新四军高级将领叛变,他们后来的结局如何

1941年皖南事变,有三位新四军高级将领叛变,他们后来的结局如何

大运河时空
2026-01-21 17:05:03
潜伏我国30年美国辣酱巨头,年赚300亿打败老干妈,被误认是国货

潜伏我国30年美国辣酱巨头,年赚300亿打败老干妈,被误认是国货

素衣读史
2024-12-19 14:16:46
王新军没想到,闫学晶人设崩塌不到半月,秦海璐因一句话口碑暴增

王新军没想到,闫学晶人设崩塌不到半月,秦海璐因一句话口碑暴增

阿纂看事
2026-01-09 19:28:02
就在刚刚,13家A股上市公司发布重大利空 利好消息,看看都有哪些?

就在刚刚,13家A股上市公司发布重大利空 利好消息,看看都有哪些?

股市皆大事
2026-01-21 18:43:08
快船输球揪出最大毒瘤,进攻低效,防守黑洞,有他在,快船好不了

快船输球揪出最大毒瘤,进攻低效,防守黑洞,有他在,快船好不了

失我者永失qq
2026-01-21 13:38:37
云南鸵鸟肉案凶手被判死刑,当地曾多人购买,这些人后来怎样了

云南鸵鸟肉案凶手被判死刑,当地曾多人购买,这些人后来怎样了

林林故事揭秘
2025-01-03 17:30:21
李湘风波再升级!官方下场,网友呼吁封杀,3大原因,事关赵薇

李湘风波再升级!官方下场,网友呼吁封杀,3大原因,事关赵薇

梦史
2026-01-20 11:36:55
贝克汉姆现身达沃斯,谈社交媒体与子女教育:有时候必须允许孩子犯错

贝克汉姆现身达沃斯,谈社交媒体与子女教育:有时候必须允许孩子犯错

界面新闻
2026-01-21 22:05:17
没有邻居,我搬进“一梯一户”半年,真后悔没有早点买,太幸福了

没有邻居,我搬进“一梯一户”半年,真后悔没有早点买,太幸福了

室内设计师有料儿
2026-01-21 11:25:56
贝克汉姆儿媳妮可拉快哭了!

贝克汉姆儿媳妮可拉快哭了!

东方不败然多多
2026-01-21 13:00:09
血型决定寿命长短?60万人研究发现:A型血或“天生”更易中风

血型决定寿命长短?60万人研究发现:A型血或“天生”更易中风

小舟谈历史
2025-10-11 09:13:30
很多人低估了一万块的威力

很多人低估了一万块的威力

洞见
2026-01-12 20:34:37
马斯克刚点燃脑机接口,中国“脑机一哥”就要上市了

马斯克刚点燃脑机接口,中国“脑机一哥”就要上市了

金角财经
2026-01-21 15:21:00
60岁再婚大妈哭道:退休金17000,过年连双新鞋子都买不起

60岁再婚大妈哭道:退休金17000,过年连双新鞋子都买不起

惟来
2026-01-20 15:58:20
2026-01-22 03:11:00
南方都市报 incentive-icons
南方都市报
换一种方式,南都在现场。
594167文章数 3586841关注度
往期回顾 全部

科技要闻

给机器人做仿真训练 这家创企年营收破亿

头条要闻

特朗普称“美国拥有无人知晓的武器” 克宫回应

头条要闻

特朗普称“美国拥有无人知晓的武器” 克宫回应

体育要闻

只会防守反击?不好意思,我们要踢决赛了

娱乐要闻

首位捐款的明星 苗圃现身嫣然医院捐款

财经要闻

丹麦打响第一枪 欧洲用资本保卫格陵兰岛

汽车要闻

2026款上汽大众朗逸正式上市 售价12.09万起

态度原创

艺术
健康
手机
时尚
公开课

艺术要闻

你绝对想不到,他的油画美得如此惊人!

打工人年终总结!健康通关=赢麻了

手机要闻

iPhone越贵越好卖!iPhone18没有单打孔

缔造仙女梦的人,去了天堂继续缝制星光✨

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版