网易首页 > 网易号 > 正文 申请入驻

互联网的AI腔,该清算了!

0
分享至


新智元报道

编辑:倾倾

【新智元导读】互联网上,越来越多的句子有一股「AI味」。风景永远惊艳,事件永远关键,语言被磨成光滑的模板。于是,Wikipedia在成千上万次巡查里最先察觉,并悄悄发起一场清理行动。

现在互联网上的句子,好像都是一个师傅教的。

风景总是breathtaking,建筑永远modern,随便一个事件都「标志着一个关键时刻」。

这些话听着完美,却轻得像飘在空中。读多了,人会感到恍惚。

Wikipedia的编辑们也受够了这种「广告腔」,开始了一场清理行动。

他们校对大量新增内容后发现,最爱说场面话的,竟然不是人,而是AI。

于是,一本奇怪又实用的《识别AI文风手册》,就在无数次删删改改里被写出来。

同一个模板写出来的互联网

互联网的语言越来越整齐划一,Wikipedia最早察觉到「味道不对」。

每天都有成千上万的新内容被塞进条目里,编辑们一边巡查一边发现:不少新增段落看起来顺滑,但读起来像是套话。

编辑们越看越觉得奇怪。等他们把这些可疑段落攒在一起,真相也浮出水面:

来源模糊、论据空洞、表达统一得异常。这一切都指向同一个可能——越来越多的内容,是AI生成的。


为了避免百科被这种空心句子掏空,一群志愿者在2023年发起了WikiProject AI Cleanup。


传送门:https://en.wikipedia.org/wiki/Wikipedia:WikiProject_AI_Cleanup

他们系统地记录这些异常写法,想弄清楚AI到底在什么地方露出痕迹,哪些句子看似正常,但经不起查证。

维基编辑最先发现「不对劲」

清理行动一开始,编辑们就发现:检测器根本不靠谱。

正管用的,是他们在多年巡查中练出来的「语感」

AI写出来的段落,表面都挺正常,但细看会有三种特别明显的痕迹。

第一种,反复强调「重要性」,却不给现实中的例子。

AI 生成的段落常常会把主题写得很宏大,比如「a pivotal moment」「a broader movement」。

但落到细节时,没有年份、不提来源,也没有可查证的材料。这种写法在百科语境里非常异常。

第二种,句尾挂着体面的现在分词

这种emphasizing… reflecting… highlighting… 的尾句,是目前最明显「AI痕迹」。

TechCrunch的作者也在报道中指出:

这类present participle是区分AI文风的关键线索之一

第三种,是频繁使用互联网式的「营销形容词」。 breathtaking、modern、renowned、scenic这些词在广告里正常,但在百科里使用很不恰当。

维基编辑碰到这种描述时,会立即查来源,结果常常找不到对应证据。

后来,这些规律都被整理进了《Signs of AI writing》。


https://en.wikipedia.org/wiki/Wikipedia%3ASigns_of_AI_writing?utm_source

比起技术指南,它更像一份经验册。记录着编辑们踩过的坑、看到的怪句式,方便更多人一起清理。

AI为什么总写成这样?真相在语料里

当编辑们把可疑句式整理出来后,一个问题也变得清晰了:AI之所以写成这样,根本原因是人类语料。

也就是说,它从哪里学来的语言,就会说出什么样的语言。

因为大型模型训练时吃的是整个互联网的语料。新闻稿、SEO软文、宣传册、社交平台的内容都会混在一起。

而这些地方最常见的表达,就是宏大但空泛、形容词夸张但没事实、评价多于证据的写法。


Wikipedia在把这类现象称为:Vague praise和Marketing language。

换句话说,AI不是故意用「公关腔」,而是这类语料最容易在互联网上抓取。

这也解释了为什么「重要性夸大」「-ing 尾巴」「广告式形容词」会频繁出现——这些是模型在大语料里看到得最多、最容易复制、也最缺乏上下文约束的句式。


Wikipedia的解决方式非常务实。他们知道无法杜绝AI生成内容,于是把重点放在「证据链」上。

他们要求注明来源、核查链接、追溯出处。

这一点在《WikiProject AI Cleanup》的流程说明里写得很清楚:

凡是出现评价性语言、缺乏具体事实,或看上去「像模型写的」,编辑可以先贴上「需要引用」的模板。

如果作者无法补充来源,这段内容就会被移动到讨论页,必要时进入快速删除程序。

这一整套流程相当于「免疫系统」:去掉评价形容词,让句子必须基于事实。

凡是经不起查证的部分,就会被自动拦截。这对于一个完全依赖可验证性运作的百科来说,百利无一害。

真实的句子有骨头,AI的句子一戳就空

维基编辑在清理中发现,最能一眼看出「AI味」的地方,是句子到底有没有「事实」。

AI喜欢用形容词和评价支撑文章结构,而百科写作靠的是年份、数量、地点、报道来源这种能查到的事实。

为了让更多编辑能看懂这种差别,《Signs of AI writing》里特地列出了多类典型句式。

看下面这一组改写,就能感受到两种语言的「骨骼」完全不同:

AI腔写法:

The conference was a pivotal moment, highlighting the continued relevance of the field.

这类句子在指南里被称作“Importance inflation + present participle tail”。

「关键」「持续重要」这些判断没有来源,尾巴的 highlighting… 属于典型AI的空转分词。

维基会写成:

The 2023 conference in X City drew about 1,200 attendees. Coverage in Y Newspaper and the Z Journal discussed A and B policy proposals.

年份、人数、媒体报道,全是可以查证的事实。评价不需要说,材料会自己说明事情的重要性。

再看另一个例子,也是编辑们最常遇到的那类广告腔:

The park offers breathtaking views and modern facilities, emphasizing its status as a renowned attraction.

指南把这种叫做「Vague praise / marketing tone」:breathtaking、modern、renowned这些词在广告里再合适不过,但在百科里毫无信息含量。

维基会写成:

The park has two viewing platforms and a 5-km walkway. It recorded about 450,000 visits in 2019 and completed accessible restroom and visitor-center upgrades in 2021.

不夸人、不定性,也不判断价值。只列设施、列年份、列客流量——所有内容都有来源可查。

在维基的世界里,没有来源的评价就是不存在的评价。

当越来越多内容由模型生成,我们读到的语言难免会被模板化的腔调包围。

Wikipedia的做法提醒我们,判断一段文字是否可靠,并不靠某种神奇的检测器,而是靠这句话能否查证、这个判断能否追溯、这条信息是否站得住。

AI也许会写出更流畅的句子,但百科在意的不是好看,而是可信。

当空心句被删掉、广告腔被滤掉、无出处的判断被请出页面,百科页面留下的,就只剩下事实本身。

互联网的未来,大概也会沿着这条路走下去——越是模型生成的时代,越需要人类替语言把关。

参考资料:

https://techcrunch.com/2025/11/20/the-best-guide-to-spotting-ai-writing-comes-from-wikipedia/

https://www.theverge.com/report/756810/wikipedia-ai-slop-policies-community-speedy-deletion?utm_source

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
欧洲天然气价格下跌7%

欧洲天然气价格下跌7%

每日经济新闻
2026-03-04 18:26:06
台湾人又破防了!中东撤侨现场:没台胞证,只能眼巴巴看着别人

台湾人又破防了!中东撤侨现场:没台胞证,只能眼巴巴看着别人

离离言几许
2026-03-04 14:43:59
金融美女高管沉迷小鲜肉,威逼利诱让他献身,丈夫抓奸场面太炸裂

金融美女高管沉迷小鲜肉,威逼利诱让他献身,丈夫抓奸场面太炸裂

离离言几许
2026-03-03 15:53:07
迪丽热巴发文报平安:现在我和团队都已安全,很抱歉让大家担心;其IP地址显示为马来西亚,此前被曝滞留迪拜

迪丽热巴发文报平安:现在我和团队都已安全,很抱歉让大家担心;其IP地址显示为马来西亚,此前被曝滞留迪拜

扬子晚报
2026-03-04 20:59:33
伊朗使用集束弹药轰炸特拉维夫!以色列淡水厂被炸!美国被惹怒了

伊朗使用集束弹药轰炸特拉维夫!以色列淡水厂被炸!美国被惹怒了

说历史的老牢
2026-03-04 10:23:48
2026年,第一个“撑不住”的车企出现了,巨亏1780亿!

2026年,第一个“撑不住”的车企出现了,巨亏1780亿!

i王石头
2026-03-04 15:21:36
伊朗抗住了,最强援军已到!特朗普咬牙说了两句话,赖清德慌乱了

伊朗抗住了,最强援军已到!特朗普咬牙说了两句话,赖清德慌乱了

用冷眼洞悉世界
2026-03-05 07:18:18
长在悬崖超900年!浙江父子徒手挖了两天,挖到3.5米长巨型夜交藤

长在悬崖超900年!浙江父子徒手挖了两天,挖到3.5米长巨型夜交藤

雪灵谷
2026-03-03 18:18:48
神回复:“为啥女生的白袜子能一直保持那么白?”哈哈哈原来如此

神回复:“为啥女生的白袜子能一直保持那么白?”哈哈哈原来如此

夜深爱杂谈
2026-03-03 22:35:54
员工过年值班8天索要3倍工资 法院:每天打完卡玩手机 不支持 律师:其不符合“加班”的法定特征

员工过年值班8天索要3倍工资 法院:每天打完卡玩手机 不支持 律师:其不符合“加班”的法定特征

闪电新闻
2026-03-03 17:36:04
担心的事还是发生了!众星被困中东不到24小时,牛鬼神蛇现原形

担心的事还是发生了!众星被困中东不到24小时,牛鬼神蛇现原形

荷兰豆爱健康
2026-03-04 17:11:27
以色列防长:伊朗任何新的最高领袖都将成“清除目标”

以色列防长:伊朗任何新的最高领袖都将成“清除目标”

界面新闻
2026-03-04 15:26:41
不查不知道一查吓一跳,掌管少林寺38年的释永信,私下到底多享受

不查不知道一查吓一跳,掌管少林寺38年的释永信,私下到底多享受

芳芳历史烩
2026-03-04 22:59:51
特朗普大怒欲断西贸易,话音刚落,西班牙反手一击:立即退出北约

特朗普大怒欲断西贸易,话音刚落,西班牙反手一击:立即退出北约

明天见灌装冰块
2026-03-04 17:30:51
72岁大爷斑块消失,他把血管变干净的三个方法,连医生也赞叹

72岁大爷斑块消失,他把血管变干净的三个方法,连医生也赞叹

荆医生科普
2026-03-03 16:40:19
太惨了!燃油车再迎大降价,最大降幅50%,电车为何不敢接招?

太惨了!燃油车再迎大降价,最大降幅50%,电车为何不敢接招?

小李子体育
2026-03-05 04:32:28
三桶油补跌 大盘见底

三桶油补跌 大盘见底

趋势巡航
2026-03-04 14:55:10
斯科尔斯:卡里克肯定有某些特别之处,因为曼联最近烂透了

斯科尔斯:卡里克肯定有某些特别之处,因为曼联最近烂透了

懂球帝
2026-03-05 07:23:12
沪上消失21年的"顶流鼻祖"回归,排队排到马路对面!上海人一说到这个,可以吵起来↗

沪上消失21年的"顶流鼻祖"回归,排队排到马路对面!上海人一说到这个,可以吵起来↗

上海黄浦
2026-03-04 07:38:27
80后被称为“最惨一代”,负债率高达190%,创下人类历史罕见水平

80后被称为“最惨一代”,负债率高达190%,创下人类历史罕见水平

流苏晚晴
2026-03-03 19:18:27
2026-03-05 07:51:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14638文章数 66648关注度
往期回顾 全部

科技要闻

4599元起!MacBook Neo发布:搭载A18 Pro

头条要闻

外媒称伊朗封锁霍尔木兹海峡只让中俄船通行 中方回应

头条要闻

外媒称伊朗封锁霍尔木兹海峡只让中俄船通行 中方回应

体育要闻

2026年中超,为什么值得你多看一眼?

娱乐要闻

谢谢谢娜 贡献出26年内娱的第一个笑话

财经要闻

人大代表建议:将农民养老金提到500元

汽车要闻

鸿蒙智行首款猎装车 尚界Z7/Z7T首发

态度原创

本地
亲子
旅游
公开课
军事航空

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

亲子要闻

孩子补了钙还不长?问题出在脾胃上

旅游要闻

3月必看!宜昌三斗坪,大坝+花海美到窒息

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗为遭到美以空袭小学遇难者举行葬礼

无障碍浏览 进入关怀版