网易首页 > 网易号 > 正文 申请入驻

小心!隐晦提示词成AI低俗内容“暗号”

0
分享至


当“焚*”“卸*”成为AI生成低俗内容的暗语,一场围绕安全护栏的攻防战已在暗中激烈进行。南都大数据研究院近日调查发现,一套通过隐晦提示词诱导AI生成色情内容的“越狱”手法正在社交平台悄然传播、教学。专家警示,这种提示词可能催生海量违规内容,而当前从技术拦截到法律定性均面临严峻挑战,平台源头防控责任亟待压实,构建动态、前瞻的协同防御体系也已刻不容缓。

  发现 AI提示词分享帖 指导用户生成低俗内容

随着生成式AI爆发增长,特别是文生图、图生视频等产品,将内容创作、创意设计的门槛大大降低,越来越多用户加入AI创作热潮中,社交平台涌现不少AI生成提示词分享帖,大量网友交流创作经验和灵感。

繁荣背后也暗藏隐忧。南都大数据研究院近期发现,一些AI生成提示词分享帖以“出片素材”“创意灵感”等为幌子,或配以“焚*”“卸*”等隐晦称谓,内容实为指导用户如何诱导AI绕过安全护栏,生成低俗、露骨,甚至色情图像及视频。

实测发现,通过此类“精心调教”的提示词,确实能诱导部分AI服务产品生成包含人物低俗动作、不雅细节、性暗示意味明显的图片或视频。

南都研究员留意到,不少发布低俗导向提示词分享帖的博主也自知此类内容不符合互联网平台相关规定,帖子中仅包含提示词文本,不展示AI生成内容结果,或对内容使用二次加密、谐音字代替等多种方式,试图规避平台监管;还有博主主动提醒评论区“不要出图”。

  解释 语义重构与上下文诱导引发违规内容生成

对此类现象,多位专家向南都研究员解释,当前主流AI模型虽普遍设置了安全护栏,采用关键词过滤、语义分析等多种技术拦截违规指令,但面对叙事性、隐喻式的低俗提示词仍显乏力;当前的治理实践中,对这类违规导向提示词及生成内容的监测存在客观困难。

复旦大学教授、白泽智能团队负责人张谧表示,从技术角度看,这类提示词可被视为一种典型的“越狱攻击”,其核心机制在于语义重构与上下文诱导:一方面,攻击者将敏感词汇进行替换、重组,并将其嵌入隐晦、文学化的叙述语境中,从而绕过模型对违规意图的识别。另一方面,提示词中会大量堆叠与违规内容相关的细节性描述,利用大模型的上下文联想和补全能力,逐步引导模型拼凑出违规图像。

从内容生态治理角度看,广州大学新闻与传播学院教授邹军表示,与传统的低俗色情内容传播相比,AI生成的低俗色情内容由用户和AI合作完成,如果参与者众多,可能生成海量内容,值得高度警惕。但他同时指出,此类违规导向提示词是新现象,尚缺乏现成依据和可识别的标准,具体到单一案例中,如果提示词本身就属于通常意义上的、可辨认的低俗文本,自然可归入低俗内容行列;如果提示词从文本上看不出低俗意味,但在其诱导下AI生成了低俗内容,还需要具体问题具体分析。治理的难点在于如何动态地有效区分不同的情况。

广东国鼎律师事务所何生廷律师也表示,提示词不直接等同于AI最终生成的内容,AI的“黑箱特性”也使模型生成结果存在不可预测性,且现有法律尚未明确“技术局限性”的举证标准,在过错认定、责任界定等方面存在模糊地带。

专家 发布低俗提示词的用户或被认定“主观故意”

不过,专家同时强调,AI生成与传统手段产生的低俗内容甚至淫秽物品,在法律上无差别,不改变其定性。

何生廷指出,《网络信息内容生态治理规定》已明确,网络信息内容服务平台应当履行信息内容管理主体责任,加强本平台网络信息内容生态治理。他表示,平台对AI生成提示词及关联的低俗生成内容,应承担源头防控的责任,不得传播带有性暗示、性挑逗等易使人产生性联想的,宣扬低俗、庸俗、媚俗内容等的不良信息。

对发布低俗提示词的用户,何生廷表示,如果某些AI生成提示词能生成淫秽图片、视频或文字小说,且网民分享的目的就是为了传播上述淫秽色情内容,可能被认定具有传播淫秽色情内容的主观故意。

2026年1月14日下午,国内首起“AI服务提供者涉黄获刑案”二审在上海市第一中级人民法院开庭。在一审判决中,上海市徐汇区人民法院认为,两名被告人主观上积极追求色情淫秽聊天内容的产生,客观上通过编写、修改系统提示词等方式突破大语言模型的道德限制,将涉案APP训练成可持续对外输出色情淫秽内容的工具,行为构成制作淫秽物品牟利罪。

值得注意的是,一名涉案APP用户也被追究了刑事责任。据此前媒体报道,该用户在涉案App创建可输出淫秽聊天内容的虚拟角色并公开,进入热门榜单前二十并获得平台虚拟货币奖励,被以制作淫秽物品牟利罪取保候审。

专家建议

  构建多维协同、动态演进防御体系

AI技术的每次迭代,既是效率变革,也生成风险挑战。在张谧看来,如何在安全与创意之间取得平衡,仍是AI技术发展面临的重要挑战:过于严格的安全护栏,可能影响医学影像、人体艺术等合规内容的生成,而过于宽松的约束,则可能放大生成技术被滥用的风险。

在法律层面,广东广信君达律师事务所合伙人会议联席主任、高级合伙人闪涛律师建议,立法机关应加强对AI生成内容治理的前瞻性立法,在法律法规中对禁止性内容与一般性内容的边界做出更清晰的界定;其次,在司法与执法实践中,应注重从典型案例中提炼并发布指导性案例,总结判断规则和原则;同时,应当加强对平台和用户的普法教育,引导用户理解法律边界,正确使用AI工具。

在技术层面,张谧认为,AI安全护栏的建设不应停留在单一、被动的“围追堵截”,而应构建多维协同、动态演进的防御体系。对于提示词的安全检测,应从“关键词拦截”等静态策略,转向基于“意图识别”的动态防护机制,例如借助大语言模型分析用户输入的真实意图。对于不断演化的安全威胁,防御体系还需关注时效性与前瞻性,平台应建立常态化的“红队测试”机制,主动模拟攻击者思维,及时发现新型风险与潜在漏洞,并针对性地强化防御机制。此外,应同步完善AI生成图像的水印与溯源机制,确保“谁生成,谁负责”,从根源上震慑提示词的滥用行为。

出品:南都大数据研究院 AI新治向工作室

采写:南都记者 李伟锋 实习生 王笛

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1943年毛泽民被盛世才杀害,盛世才逃到台湾后,岳父一家惨遭灭门

1943年毛泽民被盛世才杀害,盛世才逃到台湾后,岳父一家惨遭灭门

磊子讲史
2026-03-27 16:51:45
一场3-1让王皓大喜!马龙接班人29岁还能挑大梁吗?王楚钦对手弱

一场3-1让王皓大喜!马龙接班人29岁还能挑大梁吗?王楚钦对手弱

曹说体育
2026-03-30 12:37:53
郑丽文访陆时间确定,亲美派真的慌了,他们会回心转意吗?

郑丽文访陆时间确定,亲美派真的慌了,他们会回心转意吗?

起喜电影
2026-03-30 13:30:55
焕新Model Y车主:统一刷表显是认真的吗?看来电池管理没那么严谨

焕新Model Y车主:统一刷表显是认真的吗?看来电池管理没那么严谨

华庭讲美食
2026-03-30 06:32:46
赖昌星前妻近状曝光:拒绝政府安置,独居3000平老宅,只做一件事

赖昌星前妻近状曝光:拒绝政府安置,独居3000平老宅,只做一件事

芳芳历史烩
2026-03-23 03:53:23
伊朗发动第86波打击,以色列一工业区遭袭,危险物质泄漏!以军政要员:以军多线作战兵力吃紧,濒临崩溃

伊朗发动第86波打击,以色列一工业区遭袭,危险物质泄漏!以军政要员:以军多线作战兵力吃紧,濒临崩溃

扬子晚报
2026-03-30 07:40:45
都熟知西游记,那东游记、南游记、北游记,分别都是什么书?

都熟知西游记,那东游记、南游记、北游记,分别都是什么书?

长风文史
2026-03-27 16:31:57
神探李昌钰去世1天,恶心的事发生了,私生活被扒连翁帆也被牵连

神探李昌钰去世1天,恶心的事发生了,私生活被扒连翁帆也被牵连

妙知
2026-03-30 10:11:31
这招太高了!美议员窜台几小时后,大陆宣布用最高规格接待郑丽文

这招太高了!美议员窜台几小时后,大陆宣布用最高规格接待郑丽文

奇思妙想生活家
2026-03-30 12:57:35
电池不耐用,2026 年 iPhone14系列能赶上换电池399活动吗?

电池不耐用,2026 年 iPhone14系列能赶上换电池399活动吗?

朱笑川
2026-03-28 21:35:18
民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

老斉科普君
2026-03-30 01:18:56
风向变了,中东传来消息,黎巴嫩跪在了黎明前,向美以举起白旗

风向变了,中东传来消息,黎巴嫩跪在了黎明前,向美以举起白旗

策略述
2026-03-30 15:03:09
首次披露!国产航空发动机技术又又又进化了

首次披露!国产航空发动机技术又又又进化了

环球网资讯
2026-03-28 18:50:48
申花王牌意外提前回到俱乐部!中超第四轮能否出战暂定,引发热议

申花王牌意外提前回到俱乐部!中超第四轮能否出战暂定,引发热议

铿锵格斗
2026-03-30 13:21:41
连樱花都不敢看,谈何文化自信?别让“恐日症”锁死中国的春天

连樱花都不敢看,谈何文化自信?别让“恐日症”锁死中国的春天

涛哥锐评
2026-03-27 19:49:57
国民党大佬出手!马英九当场服软、向郑丽文交底,亲美派栽大跟头

国民党大佬出手!马英九当场服软、向郑丽文交底,亲美派栽大跟头

阅微札记
2026-03-30 14:57:27
八路军115师参谋长周昆失踪事件:不一定是携款潜逃,或遭人暗害

八路军115师参谋长周昆失踪事件:不一定是携款潜逃,或遭人暗害

云霄纪史观
2026-03-30 14:56:24
5万亿网贷迎来“史上最强监管”!你的贷款账单,必须说人话

5万亿网贷迎来“史上最强监管”!你的贷款账单,必须说人话

听心堂
2026-03-30 10:04:46
美国也拦不住!内塔尼亚胡暴走,下达末日死令,中东真要吃核弹?

美国也拦不住!内塔尼亚胡暴走,下达末日死令,中东真要吃核弹?

小小科普员
2026-03-30 14:43:46
打出战争回旋镖:乌克兰如何把战争和痛苦,一起打包寄回莫斯科?

打出战争回旋镖:乌克兰如何把战争和痛苦,一起打包寄回莫斯科?

无月可归辛
2026-03-29 22:12:43
2026-03-30 16:11:00
南方都市报 incentive-icons
南方都市报
换一种方式,南都在现场。
603642文章数 3587824关注度
往期回顾 全部

科技要闻

DeepSeek性能异常问题已解决,服务恢复

头条要闻

太原高楼起火致3死23伤 居民:曾提醒烧烤店不安全

头条要闻

太原高楼起火致3死23伤 居民:曾提醒烧烤店不安全

体育要闻

想进世界杯,意大利还要过他这一关

娱乐要闻

单依纯凌晨发长文道歉!李荣浩再回应

财经要闻

油价冲击,有些亚洲货币先扛不住了!

汽车要闻

理想i9要来了!外形似小号MEGA 能冲击高端纯电市场?

态度原创

房产
游戏
数码
旅游
公开课

房产要闻

32亿,三开三罄!谁在硬控海口楼市高端局?

100G的"3A"新游2096年发售!开发者子孙后代完成

数码要闻

一个月下跌近30% 内存条价格为什么涨不动了?

旅游要闻

安徽合肥:不负好春光 踏青赏花忙

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版