网易首页 > 网易号 > 正文 申请入驻

如何识别人工智能生成的文本?他们让AI去找到同类

0
分享至

“考试和分数不应该是学生生活的全部。除了分数,我还可以去关心窗前第一排柳芽的萌动;去欣赏天上金黄的满月,让后羿嫦娥、吴刚玉兔的传说在心中流过;去盛装的西湖边骑行,淋一点小雨,吹无数的风……可是,家长的教诲又让人无法反驳:‘你知道吗,中考差一分,就是一个操场的人!’

这,就是我的烦恼。 ”

以上这段文字是AI生成的,还是人写的?

我问了7个人,有5个认为由AI生成,主要理由是“辞藻堆砌”。

AI通用模型的文本生成能力持续进阶,已经到了人无法准确辨别的程度,因此,其不当使用可能带来的虚假新闻、学术不端行为、恶意产品评价等问题引起社会高度关注。

据公安部网络安全局官方公众号,因使用AI捏造“顶流明星在澳门输了10亿”的谣言,一名男子被处以行政拘留8日。据介绍,3月10日,网民徐某强为博流量、谋取非法利益,使用软件“某书”中AI智慧生成功能,输入热点词,制作“顶流明星被曝境外豪赌输光十亿身价引发舆论海啸”的谣言信息并在网上发布,造成谣言迅速扩散,引发大量网民议论,诱发相关谣言、话题等频繁登上热搜热榜,严重扰乱公共秩序。

2023年2月16日,“杭州市政府3月1号取消机动车依尾号限行”的“新闻”疯传。据浙江之声报道,当天杭州某小区业主群讨论ChatGPT,一位业主开玩笑说尝试用它写“杭州取消限行”的“新闻”,在群里直播了用ChatGPT写作的过程,并把文章发在群里,其他业主不明就里,截图转发。

人工智能、人类智能——面对一个文本,该如何鉴别其“真伪”?

3月24日,西湖大学自然语言处理实验室的博士生鲍光胜团队研发的AI应用程序Fast-DetectGPT,将开头那段“我的烦恼”的文字输入,程序很快给出判断结果:由AI生成的概率为19%。

它说对了,这段文字摘自杭州一名七年级学生的作文。

Fast-DetectGPT页面截图

文本究竟是人脑构思的,还是电脑生成的?或许人难以判断,但它能够被判断——鉴别者可以是AI自己。这是研究者的思路。

Fast-DetectGPT在开源模型GPT-Neo 2.7B上运行,无需训练即可识别各种AI大语言通用模型生成的文本内容,对GPT3.5、GPT4生成的文本,识别率分别达到96%、90%。与斯坦福大学2023年提出的DetectGPT相比,检测速度提高340倍,识别错误率降低75%。去年,以鲍光胜为第一作者、西湖大学工学院副院长张岳教授为通讯作者的相关论文在深度学习领域顶级会议——2024国际表征学习大会上发表。

张岳2003年毕业于清华大学计算机科学专业,此后在牛津大学获得该专业硕士、博士学位,在剑桥大学从事博士后研究,现为西湖大学终身教授,主要研究自然语言处理、文本挖掘、机器学习和人工智能。鲍光胜是他的博士生,曾在微软(中国)、阿里巴巴工作多年,三年前进入西湖大学。今年,他们关于Fast-DetectGPT的私有大模型扩展Glimpse的论文已被4月将在新加坡举行的2025国际表征学习大会收录。

澎湃新闻:对于AI生成的文本,目前主流的识别方法有哪些?

张岳:主要有监督分类器法、零样本分类器法、水印法。使用监督分类器法要收集大量已知数据,包括AI生成文本和人类创作文本,做分类学习。对训练时见过的大语言模型生成的文本,它的识别准确率较高;但遇到未见过的模型生成的文本,识别准确率下降。

Fast-DetectGPT、DetectGPT属于零样本分类器法,无需收集数据进行训练,主要通过AI文本的特征来“找同类”。

水印法是在生成AI文本时打上“水印”。国家互联网信息办公室、工信部、公安部、国家广电总局已发布《人工智能生成合成内容标识办法》,将于9月起实施,要求相关服务提供者对生成合成内容添加显式标识,或在生成合成内容的文件元数据中添加隐式标识,就属于此类。这种方法的准确率高,但存在标记被人为弱化甚至移除的风险。

澎湃新闻:Fast-DetectGPT的工作原理是什么?

鲍光胜:简单地说, AI更懂AI,Fast-DetectGPT“认出”了同类。

所谓“生成”文本,就是机器通过上文来选择下文,选择依据是词汇、句式等在其学习的数据集中的使用概率,概率越大,越可能被选中——可以想象一下搜索引擎中跳动的下拉提示框。

Fast-DetectGPT的工作基于一个前提:人类和AI通用模型在文本形成中有不同的选择。人类写文章时的选择比较多样,个体间的差异大;而不同AI通用模型间的差异不明显——因为在语料库上预训练的通用模型反映的是人类作为集体的写作行为,生成文本时也倾向于选择有更高模型概率的词汇、句式。因此,两种文本在词汇使用、句子结构、语法复杂度、语义连贯性等方面有不同,我们提取覆盖这些区别特征的统计量“条件概率曲率”,分析它们在两类文本的分布,当被测文本的统计特征值主要落在AI生成文本的分布中,则大概率为AI生成的。

不妨这样理解:作为AI,Fast-DetectGPT面对被测文本,先在不改变原意的情况下改写,再将自己的文本与被测文本对比,如果被测文本是AI写的,相似性会比较显著。

张岳:人类的思考是因果性的——它来自于行为及其反馈、后果、互动等,而通用模型的思考偏向统计性。写文章,AI的写法是学习现有数据,根据词与词之间“共现性”的概率高低等来选择下文,缺少“泛化性”,也就是将在训练数据集中所习,通过背后的因果逻辑“举一隅反三隅”,应用到别处,从而获得分布以外的泛化性。这与创造性的人类写作有很大区别。

西湖大学工学院副院长张岳教授(右)和他的博士生鲍光胜。受访者供图

澎湃新闻:那么,“阿尔法围棋”(AlphaGo)为什么能屡屡下出人类想不到的招数?而且2016年韩国李世石九段在番棋战中仅有的一局中盘胜是人类的“最后一胜”,那以后再也没有赢过AlphaGo?

张岳:围棋的变化近于无穷,但结果只有两种,或胜或负(和局极其偶然),弈棋规则也很明确。在这种情况下,AI程序的“算力”得以充分发挥,AlphaGo在训练中学习了几万份专业棋手的对弈棋谱,‌‌还进行了三千万盘自我对决。而保持高强度比赛状态的世界顶尖棋手,平均每年的职业对局不超过一百盘,即使加上训练对局、打谱,其数量也完全不在同一量级。

AlphaGo没有心理波动,这也是它在人机对弈中的优势之一,但写作中最可贵的可能就是情感、是“心理波动”。另一方面,“写得好”也没有边界,不存在止境,无法枚举。

澎湃新闻:Fast-DetectGPT检测DeepSeek-v3生成文本的准确率达到89%,对DeepSeek-R1的检测准确率则较低。我们看到,类似R1的推理模型正成为大模型发展的新方向,Fast-DetectGPT会有什么优化和改进?

张岳:R1通过较长的推理链进行思考和规划,生成的文本内容与此前通用模型的输出分布有差异。我们猜测,这可能是R1在强化学习,探索新的推理路径时产生了分布变化,使现有检测器的工作难度增加。

目前的Fast-DetectGPT演示版使用的是开源小语言模型GPT-Neo 2.7B,说它“小”,是因为模型的参数只有27亿个。如果使用更强的模型,比如671B的满血版DeepSeek-R1,理论上识别准确率就会更高。

技术总是双刃剑,模仿、鉴别会是持久的“攻防战”。作为Fast-DetectGPT的私有大模型扩展,Glimpse可以检测26种语言的文本,并有更高的识别准确率。总的说,AI模型生成的文本会越来越逼真,但人类使用AI程序对文本进行识别的能力也将越来越强大。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
正式加盟!你好,掘金!27岁榜眼联手约基奇

正式加盟!你好,掘金!27岁榜眼联手约基奇

篮球实战宝典
2026-07-02 22:29:52
后悔也晚了?日本拉黑110家中企、停供芯片原料,中方反制却更快

后悔也晚了?日本拉黑110家中企、停供芯片原料,中方反制却更快

数字财经智库
2026-07-02 15:55:40
一路走好!1天时间4位名人被曝去世,最大78岁,最小才30岁

一路走好!1天时间4位名人被曝去世,最大78岁,最小才30岁

借你一生
2026-07-02 10:26:03
小心那个世界杯上的胖子,他要认真了

小心那个世界杯上的胖子,他要认真了

中国新闻周刊
2026-07-02 21:05:11
从废铁贩子到1695亿帝国,首富资产第二次清零

从废铁贩子到1695亿帝国,首富资产第二次清零

大猫财经Pro
2026-07-02 14:36:49
狂轰72球追梅西纪录!凯恩本赛季竟比C罗巅峰赛季进球还要更多!

狂轰72球追梅西纪录!凯恩本赛季竟比C罗巅峰赛季进球还要更多!

仰卧撑FTUer
2026-07-02 21:21:07
意大利知名造型师评世界杯将帅穿搭,C罗得0分,“金钱买不到好品味” 梅西得8分

意大利知名造型师评世界杯将帅穿搭,C罗得0分,“金钱买不到好品味” 梅西得8分

红星新闻
2026-07-02 15:17:18
江苏7月气候预测:3次高温5次降水,极端最高气温40℃

江苏7月气候预测:3次高温5次降水,极端最高气温40℃

现代快报
2026-07-02 18:06:46
女子考编第一名岗位却被取消,网友:你不是人家想要的萝卜

女子考编第一名岗位却被取消,网友:你不是人家想要的萝卜

网易新闻出品
2026-06-30 21:59:39
突发!以色列宣布:打死伊斯梅尔·马斯里

突发!以色列宣布:打死伊斯梅尔·马斯里

每日经济新闻
2026-06-30 11:36:05
世界杯残忍一幕:49岁主帅被淘汰后参加发布会,被告知父亲刚去世

世界杯残忍一幕:49岁主帅被淘汰后参加发布会,被告知父亲刚去世

风过乡
2026-07-02 08:25:16
金·卡戴珊只穿内衣对镜自拍,仅用细绳遮点

金·卡戴珊只穿内衣对镜自拍,仅用细绳遮点

赴一场山海啊
2026-07-03 00:59:33
本届世界杯,让我们看到了美国的另一面

本届世界杯,让我们看到了美国的另一面

正解局
2026-07-02 16:28:27
气质出众,巴萨女足传奇普特利亚斯现场观战西班牙队比赛

气质出众,巴萨女足传奇普特利亚斯现场观战西班牙队比赛

懂球帝
2026-07-03 04:14:23
王兴认错也救不了美团,2.2万亿市值灰飞烟灭

王兴认错也救不了美团,2.2万亿市值灰飞烟灭

流苏晚晴
2026-07-02 20:05:05
成都一女子不洗手抱孙子,儿媳怒斥不卫生,儿子一拳打面中,母亲扬言要儿子坐牢,儿子却说:她活该!6年后现状曝光...

成都一女子不洗手抱孙子,儿媳怒斥不卫生,儿子一拳打面中,母亲扬言要儿子坐牢,儿子却说:她活该!6年后现状曝光...

背包旅行
2026-07-02 14:33:11
俄百枚导弹袭乌致100多人伤亡,乌军FP-9弹道导弹雷霆反击

俄百枚导弹袭乌致100多人伤亡,乌军FP-9弹道导弹雷霆反击

史政先锋
2026-07-02 16:15:30
深夜,全球资产拉升!美联储,加息突变!

深夜,全球资产拉升!美联储,加息突变!

证券时报
2026-07-02 23:05:18
墨西哥球迷狂欢震动地球:地震仪捕捉到强烈信号 狂欢导致三人死亡

墨西哥球迷狂欢震动地球:地震仪捕捉到强烈信号 狂欢导致三人死亡

红星新闻
2026-07-02 17:59:23
扎哈罗娃:冯德莱恩是个“出色的骗子”

扎哈罗娃:冯德莱恩是个“出色的骗子”

参考消息
2026-07-02 14:14:08
2026-07-03 06:32:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
912097文章数 5093371关注度
往期回顾 全部

科技要闻

马斯克不承认,但SpaceX就该造AI手机

头条要闻

西班牙3-0奥地利进16强 奥亚萨瓦尔双响波罗头槌

头条要闻

西班牙3-0奥地利进16强 奥亚萨瓦尔双响波罗头槌

体育要闻

韩国人,为什么恨透了洪明甫?

娱乐要闻

众星祝福祖国,曾沛慈原形毕露?

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

汽车要闻

有纯电有增程 还有二代VLA支持 小鹏MONA L03预售价14.38万起

态度原创

教育
亲子
手机
旅游
公开课

教育要闻

大名县东关小学2026年一年级新生招生简章

亲子要闻

费列罗“健达快乐运动”游戏盒子将走进上海150所小学及幼儿园

手机要闻

Android 17缺的原生应用锁功能,谷歌仍在持续打磨

旅游要闻

山间砂岩刻下盟约,曾经驿道地标胜景,如今只剩夯土空台一座!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版