网易首页 > 网易号 > 正文 申请入驻

如何识别人工智能生成的文本?他们让AI去找到同类

0
分享至

“考试和分数不应该是学生生活的全部。除了分数,我还可以去关心窗前第一排柳芽的萌动;去欣赏天上金黄的满月,让后羿嫦娥、吴刚玉兔的传说在心中流过;去盛装的西湖边骑行,淋一点小雨,吹无数的风……可是,家长的教诲又让人无法反驳:‘你知道吗,中考差一分,就是一个操场的人!’

这,就是我的烦恼。 ”

以上这段文字是AI生成的,还是人写的?

我问了7个人,有5个认为由AI生成,主要理由是“辞藻堆砌”。

AI通用模型的文本生成能力持续进阶,已经到了人无法准确辨别的程度,因此,其不当使用可能带来的虚假新闻、学术不端行为、恶意产品评价等问题引起社会高度关注。

据公安部网络安全局官方公众号,因使用AI捏造“顶流明星在澳门输了10亿”的谣言,一名男子被处以行政拘留8日。据介绍,3月10日,网民徐某强为博流量、谋取非法利益,使用软件“某书”中AI智慧生成功能,输入热点词,制作“顶流明星被曝境外豪赌输光十亿身价引发舆论海啸”的谣言信息并在网上发布,造成谣言迅速扩散,引发大量网民议论,诱发相关谣言、话题等频繁登上热搜热榜,严重扰乱公共秩序。

2023年2月16日,“杭州市政府3月1号取消机动车依尾号限行”的“新闻”疯传。据浙江之声报道,当天杭州某小区业主群讨论ChatGPT,一位业主开玩笑说尝试用它写“杭州取消限行”的“新闻”,在群里直播了用ChatGPT写作的过程,并把文章发在群里,其他业主不明就里,截图转发。

人工智能、人类智能——面对一个文本,该如何鉴别其“真伪”?

3月24日,西湖大学自然语言处理实验室的博士生鲍光胜团队研发的AI应用程序Fast-DetectGPT,将开头那段“我的烦恼”的文字输入,程序很快给出判断结果:由AI生成的概率为19%。

它说对了,这段文字摘自杭州一名七年级学生的作文。

Fast-DetectGPT页面截图

文本究竟是人脑构思的,还是电脑生成的?或许人难以判断,但它能够被判断——鉴别者可以是AI自己。这是研究者的思路。

Fast-DetectGPT在开源模型GPT-Neo 2.7B上运行,无需训练即可识别各种AI大语言通用模型生成的文本内容,对GPT3.5、GPT4生成的文本,识别率分别达到96%、90%。与斯坦福大学2023年提出的DetectGPT相比,检测速度提高340倍,识别错误率降低75%。去年,以鲍光胜为第一作者、西湖大学工学院副院长张岳教授为通讯作者的相关论文在深度学习领域顶级会议——2024国际表征学习大会上发表。

张岳2003年毕业于清华大学计算机科学专业,此后在牛津大学获得该专业硕士、博士学位,在剑桥大学从事博士后研究,现为西湖大学终身教授,主要研究自然语言处理、文本挖掘、机器学习和人工智能。鲍光胜是他的博士生,曾在微软(中国)、阿里巴巴工作多年,三年前进入西湖大学。今年,他们关于Fast-DetectGPT的私有大模型扩展Glimpse的论文已被4月将在新加坡举行的2025国际表征学习大会收录。

澎湃新闻:对于AI生成的文本,目前主流的识别方法有哪些?

张岳:主要有监督分类器法、零样本分类器法、水印法。使用监督分类器法要收集大量已知数据,包括AI生成文本和人类创作文本,做分类学习。对训练时见过的大语言模型生成的文本,它的识别准确率较高;但遇到未见过的模型生成的文本,识别准确率下降。

Fast-DetectGPT、DetectGPT属于零样本分类器法,无需收集数据进行训练,主要通过AI文本的特征来“找同类”。

水印法是在生成AI文本时打上“水印”。国家互联网信息办公室、工信部、公安部、国家广电总局已发布《人工智能生成合成内容标识办法》,将于9月起实施,要求相关服务提供者对生成合成内容添加显式标识,或在生成合成内容的文件元数据中添加隐式标识,就属于此类。这种方法的准确率高,但存在标记被人为弱化甚至移除的风险。

澎湃新闻:Fast-DetectGPT的工作原理是什么?

鲍光胜:简单地说, AI更懂AI,Fast-DetectGPT“认出”了同类。

所谓“生成”文本,就是机器通过上文来选择下文,选择依据是词汇、句式等在其学习的数据集中的使用概率,概率越大,越可能被选中——可以想象一下搜索引擎中跳动的下拉提示框。

Fast-DetectGPT的工作基于一个前提:人类和AI通用模型在文本形成中有不同的选择。人类写文章时的选择比较多样,个体间的差异大;而不同AI通用模型间的差异不明显——因为在语料库上预训练的通用模型反映的是人类作为集体的写作行为,生成文本时也倾向于选择有更高模型概率的词汇、句式。因此,两种文本在词汇使用、句子结构、语法复杂度、语义连贯性等方面有不同,我们提取覆盖这些区别特征的统计量“条件概率曲率”,分析它们在两类文本的分布,当被测文本的统计特征值主要落在AI生成文本的分布中,则大概率为AI生成的。

不妨这样理解:作为AI,Fast-DetectGPT面对被测文本,先在不改变原意的情况下改写,再将自己的文本与被测文本对比,如果被测文本是AI写的,相似性会比较显著。

张岳:人类的思考是因果性的——它来自于行为及其反馈、后果、互动等,而通用模型的思考偏向统计性。写文章,AI的写法是学习现有数据,根据词与词之间“共现性”的概率高低等来选择下文,缺少“泛化性”,也就是将在训练数据集中所习,通过背后的因果逻辑“举一隅反三隅”,应用到别处,从而获得分布以外的泛化性。这与创造性的人类写作有很大区别。

西湖大学工学院副院长张岳教授(右)和他的博士生鲍光胜。受访者供图

澎湃新闻:那么,“阿尔法围棋”(AlphaGo)为什么能屡屡下出人类想不到的招数?而且2016年韩国李世石九段在番棋战中仅有的一局中盘胜是人类的“最后一胜”,那以后再也没有赢过AlphaGo?

张岳:围棋的变化近于无穷,但结果只有两种,或胜或负(和局极其偶然),弈棋规则也很明确。在这种情况下,AI程序的“算力”得以充分发挥,AlphaGo在训练中学习了几万份专业棋手的对弈棋谱,‌‌还进行了三千万盘自我对决。而保持高强度比赛状态的世界顶尖棋手,平均每年的职业对局不超过一百盘,即使加上训练对局、打谱,其数量也完全不在同一量级。

AlphaGo没有心理波动,这也是它在人机对弈中的优势之一,但写作中最可贵的可能就是情感、是“心理波动”。另一方面,“写得好”也没有边界,不存在止境,无法枚举。

澎湃新闻:Fast-DetectGPT检测DeepSeek-v3生成文本的准确率达到89%,对DeepSeek-R1的检测准确率则较低。我们看到,类似R1的推理模型正成为大模型发展的新方向,Fast-DetectGPT会有什么优化和改进?

张岳:R1通过较长的推理链进行思考和规划,生成的文本内容与此前通用模型的输出分布有差异。我们猜测,这可能是R1在强化学习,探索新的推理路径时产生了分布变化,使现有检测器的工作难度增加。

目前的Fast-DetectGPT演示版使用的是开源小语言模型GPT-Neo 2.7B,说它“小”,是因为模型的参数只有27亿个。如果使用更强的模型,比如671B的满血版DeepSeek-R1,理论上识别准确率就会更高。

技术总是双刃剑,模仿、鉴别会是持久的“攻防战”。作为Fast-DetectGPT的私有大模型扩展,Glimpse可以检测26种语言的文本,并有更高的识别准确率。总的说,AI模型生成的文本会越来越逼真,但人类使用AI程序对文本进行识别的能力也将越来越强大。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
傅斯年怒斥苏联“集罪恶之大成”:那些敢向苏联开炮的中国硬骨头

傅斯年怒斥苏联“集罪恶之大成”:那些敢向苏联开炮的中国硬骨头

顾史
2026-03-21 19:52:44
房价上涨的最强信号!

房价上涨的最强信号!

米宅
2026-03-24 07:26:02
土耳其单周抛售22吨黄金 创2018年以来新高

土耳其单周抛售22吨黄金 创2018年以来新高

财联社
2026-03-26 20:58:17
她是两百年难遇的美人,靠美貌“征服”无数男人,如今49岁仍未婚

她是两百年难遇的美人,靠美貌“征服”无数男人,如今49岁仍未婚

林雁飞
2026-03-22 14:47:54
华为Pura新机定了,4月全球首发!

华为Pura新机定了,4月全球首发!

3C毒物
2026-03-26 00:07:53
冒充“中国船”闯过伊朗封锁线!日本货轮全速突围,安全抵达澳洲

冒充“中国船”闯过伊朗封锁线!日本货轮全速突围,安全抵达澳洲

澳洲红领巾
2026-03-26 12:22:58
所有退休人员注意了:如果收到这条短信,一定要抓紧时间解决!

所有退休人员注意了:如果收到这条短信,一定要抓紧时间解决!

小鹿姐姐情感说
2026-03-26 16:22:36
中东大战,真正让特朗普害怕的是:中国的已读不回!

中东大战,真正让特朗普害怕的是:中国的已读不回!

似水流年忘我
2026-03-26 02:13:59
国家出手!“京圈富少”被判入狱,和童瑶关系被扒,真实身份曝光

国家出手!“京圈富少”被判入狱,和童瑶关系被扒,真实身份曝光

林轻吟
2026-03-25 07:23:12
全球最大弹药库:澳门大搬空需6年,是否足够美国打次世界大战?

全球最大弹药库:澳门大搬空需6年,是否足够美国打次世界大战?

小蒨喜欢解说
2026-03-23 17:51:09
张雪峰离世后,再看撒贝宁三亚休假,才懂阶层差距最扎心的是什么

张雪峰离世后,再看撒贝宁三亚休假,才懂阶层差距最扎心的是什么

砚底沉香
2026-03-27 00:34:35
中方未收道歉,日本自卫官被转移,沉默24小时后,小泉进次郎发文

中方未收道歉,日本自卫官被转移,沉默24小时后,小泉进次郎发文

策前论
2026-03-26 19:03:46
德转列世预赛附加赛球队身价排行:意大利8.39亿欧居首

德转列世预赛附加赛球队身价排行:意大利8.39亿欧居首

懂球帝
2026-03-26 15:59:41
马英九接受《联合报》专访,谈萧旭岑违规,称: 决不私了!

马英九接受《联合报》专访,谈萧旭岑违规,称: 决不私了!

混沌录
2026-03-25 16:22:07
欧股美股期货 全线下挫 布油涨超4% WTI涨超3%

欧股美股期货 全线下挫 布油涨超4% WTI涨超3%

每日经济新闻
2026-03-26 20:40:39
白人女性与黑人女性的体味差异,网友真实分享引发热议

白人女性与黑人女性的体味差异,网友真实分享引发热议

特约前排观众
2025-12-22 00:20:06
外媒:专家警告,中国海军在回收坠毁飞机方面难以与美国匹敌

外媒:专家警告,中国海军在回收坠毁飞机方面难以与美国匹敌

兴史兴谈
2026-03-25 05:15:46
伊朗正式回应“15点停火协议”

伊朗正式回应“15点停火协议”

澎湃新闻
2026-03-26 23:03:02
连续两个月从中国进口镓锗为零后,日本宣布无人机要做世界第一!

连续两个月从中国进口镓锗为零后,日本宣布无人机要做世界第一!

共工之锚
2026-03-27 00:28:43
现货黄金突破4540美元/盎司

现货黄金突破4540美元/盎司

证券时报
2026-03-26 09:22:05
2026-03-27 01:59:00
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
885278文章数 5089157关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

数码
本地
时尚
教育
公开课

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

400万人爱过的女孩,被黄谣网暴180天后

教育要闻

精准研判,提质增效丨我校召开2026届毕业生就业工作研判会

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版