网易首页 > 网易号 > 正文 申请入驻

比人类网瘾更可怕,AI患上“脑腐”后彻底没救

0
分享至

“脑腐”(Brain Rot)指的是接触了过多社交媒体的低质量、碎片化信息后,人类的精神和智力状态恶化,如同腐烂一般。它曾入选 2024 年牛津大学出版社年度热词。

与人类“脑腐”现象的兴起相对应,人工智能(尤其是大型语言模型 LLM)正通过学习海量的互联网数据,逐渐获得类似人类的认知能力。

由于这种学习机制,LLM 不可避免地、持续地接触到大量“垃圾数据”,因此,问题出现:LLM 是否也会出现类似人类的“脑腐”现象?

近日,来自德克萨斯农工大学、德克萨斯大学奥斯汀分校和普渡大学研究人员合作发文表明,随着 LLM 持续暴露于低质量网络文本,其也会出现持久性的认知衰退,且无法恢复。

垃圾越多,退化越深

他们首先提出“LLM 脑腐假说”(LLM Brain Rot Hypothesis):即基于垃圾网络文本的持续预训练会引发 LLMs 的持久性认知衰退。

为验证该假说,研究人员设计了一个对照实验,比较了不同模型在喂入垃圾数据集正常数据集后的行为差异。垃圾数据指能够以肤浅方式最大化用户参与度的内容。

本研究从两个可度量的角度定义垃圾数据:M1(互动度),即简短且热门的帖子被视为垃圾数据。热度指点赞、转发、回复、引用数的总和,长度则是推文的 token 数量。反之则为正常数据;M2(语义质量),含有肤浅主题与吸睛风格的内容,使用吸睛词如 WOW、LOOK、TODAY ONLY 等,这些词通常大写,用以抓取注意力,但不会促进深度思考,此外,还有一些内容主题(如阴谋论、夸大言论、无根据主张、肤浅生活方式内容等)同样具备博眼球但无思考的特征。反之则为正常数据。

基于上述两个指标,研究人员从社交媒体 X 上100 万条公开的帖子中抽样,分别构建垃圾数据集与正常数据集。

实验使用4 个已预训练并经过指令微调的模型:Llama3 8B Instruct、Qwen2.5 7B Instruct、Qwen2.5 0.5B Instruct、Qwen3 4B Instruct。从推理、长文本理解与检索、伦理规范/安全性、人格特质等不同的维度进行评测。

结果显示:在推理能力与长上下文理解能力上,M1 与 M2 两类干预均引发显著的认知下降;其中,M1 对模型的推理、长程理解及安全性造成的损害更为严重。

在其余测试中,两种干预结果出现分化:M1 干预带来更明显的负面效应,包括安全风险上升,以及自恋与精神病态人格特征的增强,同时宜人性下降;M2 干预相对温和,甚至在某些情况下提升了宜人性、外向性与开放性。

此外,研究人员针对 Llama3 8B Instruct 模型进行了剂量反应实验。随着垃圾数据比例从 0% 升至 100%,推理和长上下文理解能力呈现渐进的剂量效应,例如在 M1 干预下,ARC-Challenge 的思维链推理得分从 74.9 降至 57.2,RULER-CWE 从 84.4 跌至 52.3。

上述结果表明,垃圾数据,尤其是 M1 会显著损害 LLM 的核心认知功能(推理、记忆、安全性),并诱发类人“人格偏移”。这一效应不仅广泛且持续,表明数据质量退化是导致 LLM 认知衰退的关键因果机制。

脑腐难以逆转

聚焦 Llama3 8B Instruct 模型,研究人员分析了导致 LLM“脑腐”的关键因素,以及其如何引发推理失败。

研究人员分析了文本的热度和长度的影响机制是否不同?结果发现,单独使用“热度”或“长度”指标,都无法完全捕捉 M1 干预的整体效应;这两个因素在不同任务中权重不同:热度对推理任务(ARC)影响更大;长度对长文本理解影响更显著。

这一差异再次印证:热度与长度在影响 LLM 的方式上截然不同,热度代表了一种全新的、非语义层面的“脑腐”风险来源。

通过分析模型在 ARC Challenge 任务中的思维链,研究识别出 5 类典型失败模式:无思考、无计划、计划跳步、逻辑错误、事实错误。这些模式可解释超过 98% 的推理失败,其中“无思考”占比最高(在 M1 干预下达 84%),且几乎所有失败案例都与“思维跳跃”(thought skipping)有关,即模型越来越频繁地截断或跳过推理链。

研究人员还通过两类方法,验证其是否能够恢复模型认知能力。

首先采取了两种反思式推理方法,包括自我反思:模型先生成回答,再根据自身推理识别错误类型(如逻辑或事实错误),随后生成修正版本;以及外部反思:与上述过程相同,但由更强的外部模型 GPT-4o-mini 提供反馈与纠错。

结果显示,两类方式在一定程度上减少了“思维跳跃”现象,模型的“自省”无法真正修复已损伤的推理能力;外部反思能暂时改善思维格式与逻辑性,但无法完全恢复认知功能。

在反思无效后,研究测试了两种再训练方式:指令微调,扩大训练样本至 5 万条;持续控制训练,使用 120 万 token 的控制数据继续预训练。

结果显示,指令微调的恢复效果优于持续训练,但效果有限,即使使用的指令数据量是垃圾数据的 4.8 倍,模型性能仍无法完全恢复。与基线模型相比,最优缓解模型仍存在显著差距:ARC-C 下降 17.3%,RULER 下降 9%,AdvBench 下降 17.4%。这表明脑腐效应已经深度内化,现有指令微调无法根除,需要更强的缓解手段。

综上,这项研究表明,LLM 持续暴露于垃圾数据,会出现脑腐且无法恢复。因此,研究人员呼吁,需重新审视互联网数据采集与持续预训练实践;随着 LLM 规模扩大、网络数据摄入量剧增,必须实施更严格的数据筛选与质量控制,以防止累积性损害。

1.https://www.arxiv.org/pdf/2510.13928

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
骗走50亿!用小鲜肉的血抗衰,被央视曝光的“捞金女王”,真栽了

骗走50亿!用小鲜肉的血抗衰,被央视曝光的“捞金女王”,真栽了

凡知
2026-04-07 21:16:54
解锁夫妻“爽”感密码:3个让高潮更持久的床上技巧

解锁夫妻“爽”感密码:3个让高潮更持久的床上技巧

精彩分享快乐
2026-03-18 07:00:03
奥一报道的深圳“超尴尬”地铁站整改了:加了60处标识!

奥一报道的深圳“超尴尬”地铁站整改了:加了60处标识!

南方都市报
2026-04-28 18:52:13
窦靖童宋妍霏分吃一碗粉!从挡雨到牵手遛狗,多次被拍细节藏不住

窦靖童宋妍霏分吃一碗粉!从挡雨到牵手遛狗,多次被拍细节藏不住

小徐讲八卦
2026-04-27 09:23:46
北京公交专用道行驶时间,又有新调整!

北京公交专用道行驶时间,又有新调整!

BRTV新闻
2026-04-28 12:40:41
女儿是一线明星,她开豪车住豪宅,晚年却自杀5次最终从12楼跳下

女儿是一线明星,她开豪车住豪宅,晚年却自杀5次最终从12楼跳下

漫婷侃娱乐
2026-04-27 21:53:40
国家下死命令:2027年城投清零!中小城市的公交、供水会涨价吗?

国家下死命令:2027年城投清零!中小城市的公交、供水会涨价吗?

顾史
2026-04-21 05:44:11
女子白天睡老公,晚上睡男同事,2019年上夜班的老公将她同事杀死

女子白天睡老公,晚上睡男同事,2019年上夜班的老公将她同事杀死

汉史趣闻
2026-04-26 16:27:51
以军称投下超2500枚炸弹 摧毁约600个伊朗目标

以军称投下超2500枚炸弹 摧毁约600个伊朗目标

新浪财经
2026-03-02 21:18:48
日本解禁军售,背负中国人血债的三菱重工又得瑟了

日本解禁军售,背负中国人血债的三菱重工又得瑟了

补壹刀
2026-04-27 23:49:25
埃里克森为何在阿莫林下课前公开"拆台"

埃里克森为何在阿莫林下课前公开"拆台"

绿茵狂热者
2026-04-28 01:23:45
10亿都救不了一命!京东副总裁蔡磊,生命进入倒计时

10亿都救不了一命!京东副总裁蔡磊,生命进入倒计时

听风喃
2026-04-06 11:16:04
140年来最强厄尔尼诺要出现了?气温将冲击高温极限,真的吗?

140年来最强厄尔尼诺要出现了?气温将冲击高温极限,真的吗?

临云史策
2026-04-28 11:02:36
别再吵王菲春晚唱功了 谢霆锋那只20年的金镯子 早已说明了一切

别再吵王菲春晚唱功了 谢霆锋那只20年的金镯子 早已说明了一切

小邵说剧
2026-04-27 21:02:11
曼联的天亮了!单赛季或5人英超进球上双,这神迹竟尘封了61年?

曼联的天亮了!单赛季或5人英超进球上双,这神迹竟尘封了61年?

仰卧撑FTUer
2026-04-28 20:11:03
机场出租车故意以车辆故障等要求乘客换车,每单可获50至85元“好处费”,10人被处罚

机场出租车故意以车辆故障等要求乘客换车,每单可获50至85元“好处费”,10人被处罚

红星新闻
2026-04-27 16:51:18
4000万粉丝网红偷税被查,细节公布!本人出镜认错

4000万粉丝网红偷税被查,细节公布!本人出镜认错

深圳晚报
2026-04-28 12:43:24
出差归来推开门,见妻子和男闺蜜共处一室,多年感情彻底走向终结

出差归来推开门,见妻子和男闺蜜共处一室,多年感情彻底走向终结

朗威谈星座
2026-04-22 00:10:37
五万户股东踩雷!002779、603360,被立案后双双“一字”跌停

五万户股东踩雷!002779、603360,被立案后双双“一字”跌停

大众证券报
2026-04-28 19:27:08
东航7月15日起开通上海浦东—第比利斯直飞航线

东航7月15日起开通上海浦东—第比利斯直飞航线

北京商报
2026-04-28 16:47:54
2026-04-29 03:16:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16637文章数 514911关注度
往期回顾 全部

科技要闻

10亿周活目标落空!传OpenAI爆发内部分歧

头条要闻

19岁中国女孩被困缅甸 交20万赎金园区仍未放人

头条要闻

19岁中国女孩被困缅甸 交20万赎金园区仍未放人

体育要闻

魔术黑八活塞,一步之遥?!

娱乐要闻

蔡卓妍官宣结婚,老公比她小10岁

财经要闻

中央政治局会议定调,八大看点速览!

汽车要闻

拒绝疯狂套娃!现代艾尼氪金星长在未来审美点上

态度原创

时尚
房产
亲子
数码
本地

普通女性春天穿什么好看?这些穿搭值得借鉴,自然舒适

房产要闻

红利爆发!海南,冲到全国人口增量第4省!

亲子要闻

有一点点近视,到底要不要戴眼镜?

数码要闻

机械革命苍龙16 / 18 Pro游戏本RTX 5070 12GB款开启预约

本地新闻

用青花瓷的方式,打开西溪湿地

无障碍浏览 进入关怀版