网易首页 > 网易号 > 正文 申请入驻

AI一本正经地胡说八道 有种办法可以识破它

0
分享至

近年来,生成式人工智能(AI)在文本、图像、音乐等多个领域展现出了惊人的创造力和应用潜力。然而,随着AI技术的不断进步,其生成的内容越来越难以与人类创作区分开来,这引发了人们对于信息真实性和可靠性的担忧。特别是在文本领域,AI生成的文本不仅行文严谨、语气措辞得当,甚至能模拟官方通报的格式,使得虚假信息的传播风险显著增加。为了应对这一挑战,Google DeepMind研究团队在《自然》(Nature)杂志上发表了一项重要研究,提出了一种名为SynthID-Text的文本水印方案,旨在提高AI生成文本的检测精度。

AI生成的内容在文本、图像和音乐中各有其特点,但文本生成技术因其高度发达和难以直接添加水印而尤为棘手。与图像和音乐不同,文本中的每一个字符都是完全可见的,且可用于训练AI的文本数据远多于图像和音乐。这使得AI在模拟人类表达方式和语言习惯方面取得了显著进步,生成的文本在整体上效果极佳,但具体到细节时可能暴露出非自然的特征。然而,这些非自然特征往往难以被肉眼察觉,因此需要通过技术手段进行检测。

现有的主流检测方法主要分为事前检测和事后检测两大类。事前检测可以进一步分为基于水印的检测和基于检索的检测。基于水印的检测通过在AI生成的文本中隐藏某些信息以便后续检测,但由于文本的离散性,添加水印比图像和音乐中更加困难。常用的方法包括让AI生成的文本使用特定的语言风格或偏向性地使用某些词汇,但这可能会降低文本的质量。基于检索的方法则是将AI生成的文本保存在数据库中,通过匹配目标文本与数据库中的文本来检测其是否为AI生成。然而,这种方法需要保存用户数据,可能引发隐私泄露的问题。

事后检测则不需要在文本生成时添加任何信息,而是根据AI生成文本的特点进行检测。基于零样本学习的检测利用AI生成文本倾向于使用常见词汇、句子长度和结构更加统一等特点来区分AI生成文本和人类创作文本。然而,随着AI技术的不断进步,这种方法的准确性正在逐渐降低。基于训练的检测则是使用人类创作的文本和AI生成的文本构建一个数据集,训练一个分类器来识别AI生成的文本。但这种方法需要收集大量数据用于训练,且随着AI能力的提升,分类器的准确性也会受到影响。

为了克服这些挑战,Google DeepMind研究团队提出了SynthID-Text水印技术。该技术基于之前的水印生成组件,但使用了一种新的“锦标赛采样”方法。通过这种方法,可以在不扭曲文本质量或仅轻微扭曲文本质量的情况下添加水印。在锦标赛采样中,模型根据随机数种子生成多个水印函数,并从词汇分布中采样出多个词汇进行竞赛。每一轮竞赛中,由水印函数决定胜出者,最终胜出者作为模型的输出结果。由于词汇是根据水印函数的偏好采样得出的,因此添加水印的文本会在水印函数上有更高的评分。在检测时,只需评估每个词汇在对应水印函数下的评分,并将评分加和即可得到文本包含水印的可能性。

SynthID-Text水印技术的优点在于它可以在不显著降低文本质量的情况下提高水印的检出率。通过改变采样方法实现水印的添加,虽然会改变模型输出下一个词汇的分布,但由于使用了随机数种子进行平均处理,可以得到与原始分布相同的结果。因此,在适当的配置下,SynthID-Text可以避免影响词汇分布从而保证文本质量。同时,该技术不会产生太多的时间和计算开销,可以被大规模地应用于生产实践之中。

尽管如此,SynthID-Text水印技术仍然为检测AI生成文本提供了一种可能的解决方案。随着生成式人工智能的普及和应用的深入发展,如何检测AI生成的内容将变得越来越重要。水印技术作为一种事前检测方法,具有潜在的大规模应用前景。然而,要彻底解决AI生成内容的检测问题,还需要各方共同努力。一方面,需要不断研究和改进水印技术,提高其有效性和可靠性;另一方面,需要建立相关的行业标准和法律法规,规范AI技术的使用和发展。只有这样,才能确保AI技术走在为人类服务的正轨之上,为社会的繁荣和发展做出更大的贡献。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“太残忍了!”她不让女儿上学,外公外婆急了!找到“前女婿”将女儿告上法庭……

“太残忍了!”她不让女儿上学,外公外婆急了!找到“前女婿”将女儿告上法庭……

环球网资讯
2026-06-01 21:26:26
上海男篮主帅比杨鸣帅,41岁婚姻状况引猜测

上海男篮主帅比杨鸣帅,41岁婚姻状况引猜测

君笙的拂兮
2026-06-01 22:23:56
正式官宣!19岁温瑞博为何顶替林诗栋?教练组这盘大棋酝酿了4年

正式官宣!19岁温瑞博为何顶替林诗栋?教练组这盘大棋酝酿了4年

陌识
2026-06-01 23:18:53
TVB前男星走出丧妻阴霾一年!与外籍丰满女摸背狂欢!曾称一年只让自己伤心3天

TVB前男星走出丧妻阴霾一年!与外籍丰满女摸背狂欢!曾称一年只让自己伤心3天

我爱追港剧
2026-06-01 22:23:52
辅导超千天陷入停滞 桂林银行遭遇多重经营困局

辅导超千天陷入停滞 桂林银行遭遇多重经营困局

经理人杂志
2026-06-01 16:08:49
奚梦瑶婚礼珠宝封神!100克拉的钻石将近5000万,这才是真老钱风

奚梦瑶婚礼珠宝封神!100克拉的钻石将近5000万,这才是真老钱风

观鱼听雨
2026-06-01 23:05:05
TA:球员私下质疑索博客串后卫的决定;红军换帅没问球员意见

TA:球员私下质疑索博客串后卫的决定;红军换帅没问球员意见

懂球帝
2026-06-01 23:02:44
iPhone17销量再破纪录!国产手机疯狂内卷,为何用户仍选苹果?

iPhone17销量再破纪录!国产手机疯狂内卷,为何用户仍选苹果?

小柱解说游戏
2026-06-02 00:24:51
前线3天损失4400人,如果威胁有用,俄罗斯应该早赢了

前线3天损失4400人,如果威胁有用,俄罗斯应该早赢了

山河路口
2026-06-01 21:16:32
中国开了个头,印尼马上跟进:我们也想听听日本的解释!

中国开了个头,印尼马上跟进:我们也想听听日本的解释!

阿龙聊军事
2026-06-01 17:11:48
从狂赚到大亏15亿卢布!吉利长安在俄罗斯一年从天堂摔地狱

从狂赚到大亏15亿卢布!吉利长安在俄罗斯一年从天堂摔地狱

老马拉车莫少装
2026-05-11 14:18:27
高盛找到了“下一个存储”:MLCC

高盛找到了“下一个存储”:MLCC

财联社
2026-06-01 14:46:12
别不信!退休金拿到这个数,你就赢了

别不信!退休金拿到这个数,你就赢了

音乐时光的娱乐
2026-06-01 05:44:50
日本62岁皇后复出,中日关系迎历史转折

日本62岁皇后复出,中日关系迎历史转折

空谷幽幽蓝
2026-06-01 11:10:37
特朗普发文:伊朗“确实想要”达成协议

特朗普发文:伊朗“确实想要”达成协议

中国网
2026-06-01 15:03:03
晚宴结束,美防长离开香会,临走前立下2条规矩,崔天凯反将一军

晚宴结束,美防长离开香会,临走前立下2条规矩,崔天凯反将一军

流史岁月
2026-06-01 19:30:03
大暴雨,新一轮强降雨2日夜来袭,蔷薇路径调整,7号台风要生成?

大暴雨,新一轮强降雨2日夜来袭,蔷薇路径调整,7号台风要生成?

环球科学猫
2026-06-01 13:24:35
身家数十亿,离婚却只给妻子10万,妻子反击:一招断送他前程

身家数十亿,离婚却只给妻子10万,妻子反击:一招断送他前程

皓皓情感说
2026-05-24 12:53:46
俄军5月猛攻7000次只推进14平方公里,乌军反推让俄方净亏土地

俄军5月猛攻7000次只推进14平方公里,乌军反推让俄方净亏土地

桂系007
2026-06-01 23:52:55
加一箱油半箱税!电车白嫖路网时代落幕,汽车行业大洗牌已然开启

加一箱油半箱税!电车白嫖路网时代落幕,汽车行业大洗牌已然开启

陌上桃花开的
2026-05-31 18:09:56
2026-06-02 02:15:00
月舞知音 incentive-icons
月舞知音
每天都会更新精彩文章和视频
6475文章数 2187关注度
往期回顾 全部

科技要闻

黄仁勋演讲实录|40年来PC首次重设计!

头条要闻

特朗普:是时候查金库了

头条要闻

特朗普:是时候查金库了

体育要闻

杰威:如果我没受伤,我们能击败马刺

娱乐要闻

奚梦瑶婚礼现场图!一双儿女当花童

财经要闻

宇树过会,杭州赢麻了

汽车要闻

奇瑞集团5月销量24.8万辆 同比增长20.5% 出口18.2万辆再创新高

态度原创

家居
艺术
亲子
房产
军事航空

家居要闻

自信舒展 高背座椅

艺术要闻

吴镇写竹,清清爽爽

亲子要闻

向太坦言给孙女买衣服从不超100块:真的豪门从不靠名牌养娃

房产要闻

100亿!1371亩!海口城市更新,再爆超级项目!

军事要闻

韩国最大军工企业爆炸 已造成5人死亡

无障碍浏览 进入关怀版