网易首页 > 网易号 > 正文 申请入驻

厉害!南开大学这名本科生,让AI“识破”AI

0
分享至

北京时间8月8日,OpenAI发布新一代人工智能模型GPT-5,再次引发全球关注。随着DeepSeek、ChatGPT、通义千问、豆包等AIGC大模型逐渐从“新奇玩具”变成学习、工作中不可或缺的“生产力工具”,其伴生问题也日益凸显:AI经常会“一本正经地胡说八道”,生成看似合理的虚假信息,造成“AI幻觉”;依赖AI工具代写作业甚至毕业论文,极大冲击着学术诚信和规范;论文AI率检测系统有待完善,论文被误判的问题时有发生……如何精准识别AI生成内容,成为亟待解决的热点问题。

图为南开大学研究团队提出的DetectAnyLLM检测框架以及MIRAGE基准数据集亮点全析

近日,南开大学计算机学院媒体计算实验室取得最新研究成果,不仅从评估的角度揭示了现有AI检测方法的性能不足,并创新性地提出了“直接差异学习”(Direct Discrepancy Learning,DDL)优化策略,教会AI用“火眼金睛”辨别人机不同,实现AI检测性能的巨大突破。相关成果论文已被计算机多媒体领域国际顶级会议ACM MM 2025(ACM International Conference on Multimedia)接收。

目前AI生成内容检测主要有两种路线,一种是“基于训练的检测方法”,使用特定数据训练一个专用的分类模型;另一种是“零样本检测方法”,直接使用一个预训练的语言模型并设计某种分类标准进行分类。

多项研究表明,现有检测方法在应对复杂的现实场景时常显不足。此前也曾有权威媒体报道,《荷塘月色》《流浪地球》等经典作品被某常用论文AI率检测系统检出高AI率。

为何现有的AI检测工具会“误判”?论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释道:“如果把AI文本检测比作一场考试,检测器的训练数据等同于日常练习题,现有检测方法是机械刷题、死记硬背答题的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”

“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但在大模型迭代飞速的今天几乎不可能。”付嘉晨说,让检测器真正学会举一反三,即提升检测器的泛化性能,是提升AI文本检测性能的关键。

为此,研究团队提出了DDL方法另辟蹊径,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识,可以精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性

使用DDL训练得到的检测器如同有了‘火眼金睛’,即便只‘学习’过DeepSeek-R1的文本,也能精准识别像GPT-5这样最新大模型生成的内容。”付嘉晨说。

团队还提出了一个全面的测试基准数据集MIRAGE,使用13种主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4种先进的开源大模型(如Qwen等),从AI生成、润色、重写三个角度构造了接近十万条人类-AI文本对。

图为AI生成内容检测示意图

MIRAGE是目前唯一聚焦于对商用大语言模型检测的基准数据集。直观地说,之前的基准数据集是由少而且能力简单的大模型命题出卷,而MIRAGE是17个能力强大的大模型联合命题,形成一套高难度、又有代表性的检测试卷。”论文通讯作者、南开大学计算机学院副教授郭春乐说。

在MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用DDL训练的检测器仍保持85%以上的准确率。与斯坦福大学提出的DetectGPT相比,性能相对提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的Binoculars方法相比,性能相对提升68.03%

“AIGC发展日新月异,我们将持续迭代升级评估基准和技术,致力于实现更快、更准、更低成本的AI生成文本检测,以AI之力,让每一篇成果更出彩。”研究团队负责人、南开大学计算机学院教授李重仪说。

值得一提的是,该论文的第一作者付嘉晨是南开大学一名大二学生。毕业于福州第一中学的他,入学后经过“二次选拔”考入南开大学计算机科学卓越班,并进入媒体计算实验室在李重仪和郭春乐两位导师的指导下开始科研实习。这也是南开大学拔尖创新人才培养改革——系列“特色班”的一个缩影。

谈到未来学习计划,付嘉晨还将继续在生成式人工智能领域探索,“能在大一进入实验室参与科研是我的幸运,老师同学们为解决实际问题攻坚克难,这也教会了我不仅要发论文,更要发有用的论文”。

来源:南开大学融媒体中心

记者:高雨桐

编辑: 饶雨诗 梁煊

审核:吴军辉 周冰玉

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
倒计时7天!北京全城严查!5月1日正式生效,几十万骑手收入大变

倒计时7天!北京全城严查!5月1日正式生效,几十万骑手收入大变

李博世财经
2026-04-25 16:54:31
Sakee洛杉矶演出官宣取消!签证没办下来!

Sakee洛杉矶演出官宣取消!签证没办下来!

SwagFuck
2026-04-27 00:08:28
55岁以后,假如你银行存到这个数的存款,基本上可以“躺平”了

55岁以后,假如你银行存到这个数的存款,基本上可以“躺平”了

猫叔东山再起
2026-03-09 09:20:08
宇航员登月回归后精神失常,死前坦言:人类不应踏足远方

宇航员登月回归后精神失常,死前坦言:人类不应踏足远方

清茶浅谈
2024-12-20 22:30:46
巴拿马运河通行拍卖费400万美元,拍卖时段等同于插队特权?

巴拿马运河通行拍卖费400万美元,拍卖时段等同于插队特权?

信德海事
2026-04-26 17:36:08
北京有位狗主人,最近因为自家的狗子,体验了一把“探监”的滋味

北京有位狗主人,最近因为自家的狗子,体验了一把“探监”的滋味

超人强动物俱乐部
2026-04-24 12:12:31
《八千里路云和月》厨子英雄终沉冤,守得云开见团圆

《八千里路云和月》厨子英雄终沉冤,守得云开见团圆

怂熊剧场
2026-04-27 00:32:58
二战最能忽悠的德军,7名德军士兵骗俘20万人希特勒下令立即退伍

二战最能忽悠的德军,7名德军士兵骗俘20万人希特勒下令立即退伍

闫冰杰
2026-04-17 21:55:57
51岁徐静蕾美国超市被拍,胖到不敢认!旁边黄立行头发花白

51岁徐静蕾美国超市被拍,胖到不敢认!旁边黄立行头发花白

东方不败然多多
2026-04-23 19:08:07
婚礼上,新娘索要9万改口费,不给就不叫妈,婆婆:还是叫阿姨吧

婚礼上,新娘索要9万改口费,不给就不叫妈,婆婆:还是叫阿姨吧

清水家庭故事
2026-04-25 11:18:11
直屏刚火 苹果带头重返四曲屏时代 网友:潮流果真是一个轮回

直屏刚火 苹果带头重返四曲屏时代 网友:潮流果真是一个轮回

快科技
2026-04-25 19:54:03
iPhone 18标准版,再次加量不加价

iPhone 18标准版,再次加量不加价

刘奔跑
2026-04-25 23:35:48
马筱梅说到做到,不再过问大宝二宝,玥儿生日冷清,张兰在外潇洒

马筱梅说到做到,不再过问大宝二宝,玥儿生日冷清,张兰在外潇洒

李虰手工制作
2026-04-25 23:32:49
北京车展今年不是百花齐放,是比亚迪一个人把场子给“收了”。

北京车展今年不是百花齐放,是比亚迪一个人把场子给“收了”。

娱乐圈的笔娱君
2026-04-26 15:09:41
降维打击,比亚迪全固态电池通过“车规级验证”,油车拿什么打?

降维打击,比亚迪全固态电池通过“车规级验证”,油车拿什么打?

西莫的艺术宫殿
2026-04-27 00:55:31
欧倩怡谈及前夫郭晋安带儿子出游住总统套房!甜蜜分享现任男友是最佳玩乐搭档

欧倩怡谈及前夫郭晋安带儿子出游住总统套房!甜蜜分享现任男友是最佳玩乐搭档

TVB资讯台
2026-04-26 21:31:58
史上首次!特朗普请求伊朗:放过这8位女性,美4位前总统表态

史上首次!特朗普请求伊朗:放过这8位女性,美4位前总统表态

墨印斋
2026-04-23 16:24:19
一场惨败没人无辜!国安评分:张玉宁最高 4人不及格 1人灾难级

一场惨败没人无辜!国安评分:张玉宁最高 4人不及格 1人灾难级

刀锋体育
2026-04-26 09:38:21
谁能想到,苏林上任首访中国,竟是自家人都摆不平的大麻烦

谁能想到,苏林上任首访中国,竟是自家人都摆不平的大麻烦

动物奇奇怪怪
2026-04-15 13:19:42
吃他汀不能碰燕麦?医生苦劝:不只是燕麦,这4物能不吃就不吃!

吃他汀不能碰燕麦?医生苦劝:不只是燕麦,这4物能不吃就不吃!

新时代的两性情感
2026-04-27 00:19:12
2026-04-27 04:51:00
微言校园
微言校园
报道教育新热点传播校园正能量
4829文章数 23关注度
往期回顾 全部

科技要闻

涨价浪潮下,DeepSeek推动AI“价格战”

头条要闻

特朗普内阁又一女部长落马:强迫男下属为其提供性服务

头条要闻

特朗普内阁又一女部长落马:强迫男下属为其提供性服务

体育要闻

森林狼3比1掘金:逆境中杀出了多孙穆?!

娱乐要闻

仅次《指环王》的美剧,有第二季

财经要闻

事关新就业群体,中办、国办发文

汽车要闻

预售19.38万元起 哈弗猛龙PLUS七座版亮相

态度原创

手机
健康
时尚
旅游
家居

手机要闻

vivo Y600 Pro配备 6.83 英寸 1.5K 护眼屏,新机明天见!

干细胞如何让烧烫伤皮肤"再生"?

比阔腿裤还时髦?今年夏天一定要有“这条裤子”,减龄又松弛

旅游要闻

2000余场特色活动邀市民欢度五一

家居要闻

自然肌理 温润美学

无障碍浏览 进入关怀版