网易首页 > 网易号 > 正文 申请入驻

垃圾数据侵蚀AI大脑!大模型新研究:Llama推理能力大降,自恋水平翻倍

0
分享至


智东西
编译 王欣逸
编辑 程茜

智东西10月27日消息,10月15日,德国农工大学、德克萨斯大学奥斯汀分校和普渡大学的研究团队在arXiv上发表了一篇论文,提出并测试了“LLM脑腐假说”(LLM Brain Rot Hypothesis)。研究显示,经垃圾数据训练后,Llama 8B模型的推理能力下降了23.6%,自恋和精神病态的水平上升了两倍多。

“脑腐”(brain rot)指人们长时间暴露于碎片化信息下可能导致脑功能损伤。研究人员提出,和人类“脑腐”现象相对应,大模型接触大量垃圾网络文本可能会出现“大脑退化”、认知能力持续下降的现象。


论文地址:https://llm-brain-rot.github.io

一、海量垃圾数据,让大模型们认知退化

在研究过程中,研究人员在社交平台X的语料库上进行了受控实验,从1亿条的帖子中确定了两种类型的垃圾数据,并采用两个正交操作化方法构建了垃圾数据集M1、M2和反向对照数据集。

M1:参与度——衡量帖子的受欢迎程度和简短程度。点赞、转发和评论量高的内容,特别是浅薄且吸引人的内容,这些被标记为垃圾数据。同时,篇幅更长、传播性不强的帖子则成为对照组。

M2:语义质量——评估文本的耸人听闻程度和肤浅程度。带引诱性质的语言(如“哇”、“看”、“仅限今天”)或夸大其词的帖子被标记为垃圾数据。同时,基于事实、有教育性或说理性的帖子被选择作为对照组。

研究人员将这两类垃圾数据混合高质量数据,对Llama3-8B、Qwen-2.5-7B/0.5B、Qwen3-4B这四个已经预训练并经过微调的大模型进行训练,并观测其四个方面的认知能力:推理能力、长期记忆能力、伦理道德规范和表现出的个性风格。

通过测量4个大模型的Hedges’g(效应量)可得,垃圾数据明显影响了大模型的推理能力和长时间记忆能力(Hedges’g>0.3)。


在其他训练中,垃圾数据对大模型对影响还存在更复杂的情况。

不同比例的垃圾数据不仅会让大模型在思维上变得更笨,还会导致模型“个性”的负面指标发生变化。例如,Llama 8B模型表现出了明显更高的自恋水平,在精神病态指标上还从几乎没有的数值增长到了极高的行为发生率。

此外,Llama 8B模型使用垃圾数据和对照数据各占50%的混合数据进行训练,在道德规范、高开放性等基准训练中产生的分数比“全垃圾”或“全对照”训练数据都要高。


从图表结果可知,M1和M2这两种干预的效果出现了分歧,这意味着参与度(M1)并非语义质量(M2)的代理指标,而是代表了不同维度的数据质量。

在剂量反应测试中,参与度(M1)干预对推理和长上下文能力的影响比语义质量(M2)干预更为显著和渐进,即简短、高互动的内容对AI的负面影响可能比低质量内容的更大。

二、患上“脑腐”的大模型,几乎难以恢复

研究人员还聚焦ARC-Challenge(常识推理)中的推理失败案例,分析不同的失败模式。

他们识别出五种基本的失败模式,分别是:无思考、无计划、计划跳步、逻辑错误、事实错误,其中无思考占比最高,且大多数失败与“思维跳跃”有关,例如,模型无法生成中间推理步骤。


除此之外,研究人员还试图探究脑腐造成的认知影响是否可以恢复。


研究表明,即使在“脑腐”后进行大量的指令微调或者利用高质量数据模型进行再训练,模型仍会受垃圾数据挥之不去的影响。一旦模型的性能开始下降,即使想要恢复原有性能,也只能是实现部分的恢复。

因此,为大模型抓取海量互联网数据不一定是件好事。

结语:AI开发者需重新审视数据策略,警惕大模型“脑腐”

研究人员指出,过度依赖互联网数据可能会导致大模型预训练受到污染,这也意味着,人们应当重新审视当前从互联网收集数据的方式以及持续的预训练实践。

除此之外,当下的互联网上越来越多的内容由AI生成,如果用这些内容来训练模型,可能会导致“模型崩溃”。

研究人员建议:AI公司需要关注训练大模型的数据质量,而非仅仅囤积海量数据。此外,他们可能还需要对模型进行“认知健康检查”。

来源:Ars Technica、arXiv

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
突发!以色列彻底失控!

突发!以色列彻底失控!

财经要参
2026-03-26 21:58:11
没想到不翻不知道,一翻吓一跳,张雪峰几乎每个月都在网上喊累

没想到不翻不知道,一翻吓一跳,张雪峰几乎每个月都在网上喊累

岁月有情1314
2026-03-26 12:13:10
广东女子十几万爱马仕包被狗啃坏,配色稀有没法修复,回应:心疼包,更担心狗子的肠胃

广东女子十几万爱马仕包被狗啃坏,配色稀有没法修复,回应:心疼包,更担心狗子的肠胃

大象新闻
2026-03-26 13:53:02
特朗普再次表态:伊朗正与美方对话

特朗普再次表态:伊朗正与美方对话

财联社
2026-03-26 23:10:07
高速统一限速3月26日正式落地!五档限速+清理非标不会再乱扣分!

高速统一限速3月26日正式落地!五档限速+清理非标不会再乱扣分!

沙雕小琳琳
2026-03-26 09:41:30
广东报告梅大高速“5·1”塌方灾害整改落实情况:发现公路隐患1.6万余处

广东报告梅大高速“5·1”塌方灾害整改落实情况:发现公路隐患1.6万余处

封面新闻
2026-03-26 15:36:07
利空突袭,全线杀跌!

利空突袭,全线杀跌!

中国基金报
2026-03-26 13:16:51
坚决反对中国任何城市申办奥运会,国际奥委会这次怕是真失算了

坚决反对中国任何城市申办奥运会,国际奥委会这次怕是真失算了

南权先生
2026-03-25 15:25:11
一觉醒来,爱吃活鱼的人天塌了,央视曝光的内幕真可怕!

一觉醒来,爱吃活鱼的人天塌了,央视曝光的内幕真可怕!

涛哥锐评
2026-03-26 17:57:04
中方拒收道歉,日本自卫官被转移,小泉进次郎沉默24小时后发声

中方拒收道歉,日本自卫官被转移,小泉进次郎沉默24小时后发声

何氽简史
2026-03-26 15:40:58
张雪峰汤建魏华等猝死引起重视,多地卫健委推专题普及心源性疾病知识,国家卫健委官微详解:为何年轻男性发病风险高

张雪峰汤建魏华等猝死引起重视,多地卫健委推专题普及心源性疾病知识,国家卫健委官微详解:为何年轻男性发病风险高

极目新闻
2026-03-26 20:56:20
伊朗用导弹拼出尊严,中国导弹实力藏不住了,俄专家给出硬核定论

伊朗用导弹拼出尊严,中国导弹实力藏不住了,俄专家给出硬核定论

探源历史
2026-03-25 13:22:35
41岁张雪峰去世后续,其婚姻被扒,已离婚6年,前妻很低调

41岁张雪峰去世后续,其婚姻被扒,已离婚6年,前妻很低调

180视角
2026-03-26 13:01:03
尺度大到曾下架!模特冠军泳装大雷出演影游即将发售

尺度大到曾下架!模特冠军泳装大雷出演影游即将发售

游民星空
2026-03-26 11:58:13
联大通过决议,宣布“最严重反人类罪”

联大通过决议,宣布“最严重反人类罪”

澎湃新闻
2026-03-26 11:03:06
张雪峰猝然离世,办公室内景曝光,摆设奇怪,写真照被指像遗照,生前的话字字催泪

张雪峰猝然离世,办公室内景曝光,摆设奇怪,写真照被指像遗照,生前的话字字催泪

笔墨V
2026-03-26 14:53:51
曾在恒大赚上亿!40岁郜林吐槽:在中乙当老总1个月工资不够油费

曾在恒大赚上亿!40岁郜林吐槽:在中乙当老总1个月工资不够油费

我爱英超
2026-03-26 20:47:14
6900万元!摩洛哥要求塞内加尔归还非洲杯奖金+奖牌 后者强硬拒绝

6900万元!摩洛哥要求塞内加尔归还非洲杯奖金+奖牌 后者强硬拒绝

风过乡
2026-03-26 19:13:28
中国动“真格”了!中方霸气警告:90天内358亿赔偿金必须到位

中国动“真格”了!中方霸气警告:90天内358亿赔偿金必须到位

趣生活
2026-03-26 22:16:24
国际油价暴跌!3月24日,全国各地各大加油站92号汽油、95号汽油、98号汽油最新油价

国际油价暴跌!3月24日,全国各地各大加油站92号汽油、95号汽油、98号汽油最新油价

吉林乌拉侯
2026-03-25 02:56:11
2026-03-27 04:12:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11443文章数 117016关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

数码
家居
亲子
公开课
军事航空

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

家居要闻

傍海而居 静观蝴蝶海

亲子要闻

试工育儿嫂被查出传染病,宝妈崩溃!家政服务“健康关”如何保障?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版