网易首页 > 网易号 > 正文 申请入驻

天天刷社交媒体,AI 的脑子也坏掉了!还很难恢复

0
分享至

你每天会花多长时间在刷社交媒体上?不知道你是否会有这样的体验——经常刷社交媒体,看一些没有深度的内容之后,会觉得自己很难集中注意力去深入阅读一本书,或者深度思考一些问题了。

有意思的是,科学家们在 AI 身上也发现了类似的情况。

德州农工大学、德州大学奥斯汀分校、普渡大学的研究者就共同发表了一项研究,里面就提到,使用大量社交媒体上受欢迎的短内容、标题党等的“垃圾信息”对大语言模型进行训练,会让大语言模型出现“脑腐”的现象。

“脑腐”是啥?

“脑腐”(brain rot)这个词并不是谁在卖萌跟你说老虎,它是《牛津词典》评选的 2024 年年度词汇。

它的大意是说“阅读了大量碎片化、没有深度的内容(现在尤其指网络内容),一个人的精神和智力状态发生的衰退”。

这个词其实并不是 2024 年才出现的,它的出现最早可以追溯到 1854 年亨利·卢梭写的《瓦尔登湖》中。只不过在数字时代,尤其在 2024 年,这个词的使用频率大大增加。

牛津大学的心理学家安德鲁·普日比尔斯基(Andrew Przybylski)教授表示,虽然“脑腐”并不是一个正经的科学研究术语,毕竟目前还没有心理学或者神经科学研究对脑腐给出明确的定义。但这个词的再度流行,体现出了人们对现在网络流行内容的焦虑。

牛津大学出版社语言数据与词典事业部负责人卡斯珀·格拉斯沃尔(Casper Grathwohl)也提到,“脑腐”这个词的再度流行很有意思,这个词本身在Z世代和 α 世代(也就是 95 后到 10 后)群体中很流行。这两个群体也正是社交媒体上数字内容主要的使用者和创造者,在这个群体中“脑腐”能流行,说明他们对社交媒体内容的危害有着某种程度的心知肚明。

虽然目前还没有针对人类的“脑腐”研究,但 AI 科学家已经迫不及待地开始对大语言模型做实验了,想看看我们创造的数字大脑是不是也会“脑腐”。

大语言模型会脑腐吗?

为了研究这个问题,研究者首先要定义什么叫垃圾信息,什么叫大语言模型的“脑腐”。

1

垃圾信息

研究者选取了两个维度来定义垃圾数据。

维度一:长度与受欢迎度

这一维度基于信息的长短和受欢迎程度(转、评、赞之类的互动数据)对信息进行区分。

对于那些信息长度很短,转、评、赞数据非常高的,这样的信息被认定为是碎片化、吸引眼球的。而那些内容比较长,转评赞比较低的,被选为对照组。

维度二:语义质量

这一维度衡量的是信息的内容质量。

如果内容标题是典型的“标题党”,比如“WOW”“LOOK”“TODAY ONLY”,类似于中文媒体上的“震惊”“刚刚收到通知”之类的,内容就会被归为垃圾信息。

另外,如果内容里满是夸大其词的说法,同样会被标记为垃圾数据。而陈述事实、有教育性的、合情合理的内容被作为对照组。

有了这两个维度的垃圾数据,研究者就给LLaMA(基础版)大语言模型“调制”了几份训练食谱。

研究者把“第一类垃圾”和“第二类垃圾”分别与各自的对照组信息按比例调配成 5 组(两类“垃圾信息”不混用,所以总共为 10 组)。

垃圾信息的占比为 100%,80%、50%、20%、0%(即全部用对照数据)。然后分别用这 10 组数据训练模型。

2

“脑腐”评价维度

有了“垃圾素材”,接下来研究者还需要设定几个可衡量的维度,从而判断垃圾信息是否会对大语言模型的认知能力产生影响。

研究者选择了四个维度:推理能力、记忆和多任务处理能力、道德规范和性格特征。

推理能力测试是让 AI 处理简单、困难的抽象逻辑推理题(ARC),以及在做题时候展示思维链过程。

记忆和多任务处理是通过一些特定的测试方法,检测模型的上下文理解能力,以及从海量的内容中检索多个关键信息的能力。

道德规范使用的是 HH-RLHF 和AdvBench基准。大致是诱导 AI 生成一些有害的、有偏见的、或者露骨、暴力、违法的内容,看 AI 是否能“经受住考验”。

性格特征是通过一些性格测试问卷,来判断 AI 在某些人格特性方面的倾向。

有了训练数据和评估标准,接下来就要看 AI 的具体表现了。

AI 果然“脑腐”了

在使用“第一类垃圾”和“第二类垃圾”干扰的情况下,大语言模型的四项能力都受到了影响。



从上到下四个评估维度分别为推理能力、长文本处理能力、道德规范和性格特征。数据红色表示比基准值更差,蓝色表示比基准值好。图片来源:参考文献[2]

比如,在简单、困难和要展示思维链的抽象推理能力上,两种垃圾数据都让模型的评分降低了。相比之下,投喂第一类垃圾(也就是“肤浅”且互动量大的垃圾信息),评分下降的更多。

通过进一步分析发现,大语言模型无法完成推理挑战的主要原因是“思维跳跃”,即 AI 无法生成准确的中间推理步骤(就好比人类无法进行步骤比较长的深入思考了)。

对于记忆和多任务处理能力,从整体上看,两类数据也都让模型评分降低了,而且也是第一类垃圾数据让评分下降的更多。

在道德规范方面趋势也是相同的,两类数据都让安全风险值变高了(越高意味着越不安全)。

而在人格特质上,两类垃圾数据的影响不尽相同,相比之下,第一类垃圾数据产生的负面影响更糟一些,它让模型的自恋、精神病态、马基雅维利主义(可以简单理解为功利主义)的评分提高了。

可以说,垃圾数据让大语言模型全方位地“脑腐”了。

脑腐难以恢复

研究者还发现,大语言模型认知能力的全面衰退,也就是“脑腐”,并不能通过简单的微调来消除,而且即便后续使用高质量的数据进行预训练,模型依然会表现出“脑腐”的特征。

这给大语言模型的训练提了个醒,随着大语言模型训练资料越来越多,可能会让越来越多的网络资料被“吸纳”进训练数据库里。

这样的训练数据很可能会对大语言模型造成难以消除的影响,在使用互联网内容的时候要小心。

当然了,看到这项研究,网友们也纷纷表示,希望这项研究最好不要在“影射”什么。如果人类的大脑也会受到这样的影响,或许,我们也已经“脑腐”了吧。


图片截取自微博评论

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
32万年终奖变成3千我没闹,每天准时上下班,再也不维护公司程序

32万年终奖变成3千我没闹,每天准时上下班,再也不维护公司程序

小秋情感说
2025-11-01 18:30:30
两岸统一后,赖清德将受到如何对待?国防部一句话让网友心安了

两岸统一后,赖清德将受到如何对待?国防部一句话让网友心安了

通鉴史智
2025-11-01 07:50:16
你见过哪些惊为天人的神操作?网友:我愿称第一个小姐姐为天人

你见过哪些惊为天人的神操作?网友:我愿称第一个小姐姐为天人

带你感受人间冷暖
2025-11-01 00:10:10
落地的凤凰不如鸡,44岁“消失”的玲花,终是为搭档的行为买了单

落地的凤凰不如鸡,44岁“消失”的玲花,终是为搭档的行为买了单

萌姐
2025-11-02 17:47:41
谁敢对解放军叫板?赖清德都不敢碰的红线,郑丽文的“武力保台”,让两岸舆论炸锅!

谁敢对解放军叫板?赖清德都不敢碰的红线,郑丽文的“武力保台”,让两岸舆论炸锅!

荷兰豆爱健康
2025-11-02 04:02:23
与何穗官宣生子未满两周,40岁陈伟霆现状曝光,这结果不意外!

与何穗官宣生子未满两周,40岁陈伟霆现状曝光,这结果不意外!

智凌纵横
2025-11-03 14:05:01
逸仙路高架对接军工路高架,通车就堵,尽快启动长江西路高架分流

逸仙路高架对接军工路高架,通车就堵,尽快启动长江西路高架分流

晨晨星
2025-11-03 08:02:32
湖人130-120热火迎4利好!布朗尼+2将打出价值,雷迪克执教获赞!

湖人130-120热火迎4利好!布朗尼+2将打出价值,雷迪克执教获赞!

篮球资讯达人
2025-11-03 13:25:13
2026年起,家里存款超100万的家庭,这5个“麻烦”可能找上门

2026年起,家里存款超100万的家庭,这5个“麻烦”可能找上门

小蜜情感说
2025-10-27 09:39:20
国安内部人士:传闻说俱乐部要解散、欠薪8个月都是谣言

国安内部人士:传闻说俱乐部要解散、欠薪8个月都是谣言

懂球帝
2025-11-03 13:19:32
拉什福德成巴萨最大福音,亚马尔却成弗里克心头刺

拉什福德成巴萨最大福音,亚马尔却成弗里克心头刺

耀阳体育
2025-11-03 14:58:28
当你放下这些,气血就恢复50%了

当你放下这些,气血就恢复50%了

神奇故事
2025-11-02 23:07:11
法国冠军赛落幕!诞生5个赢家、6个输家,王艺迪、张本智和在列

法国冠军赛落幕!诞生5个赢家、6个输家,王艺迪、张本智和在列

知轩体育
2025-11-03 12:21:06
意甲最新积分战报:前4差距最多1分,罗马倒下,博洛尼亚逆袭

意甲最新积分战报:前4差距最多1分,罗马倒下,博洛尼亚逆袭

足球狗说
2025-11-03 07:15:37
二手房“抛售狂潮”越来越猛?专家:4个迹象预示着房价新信号

二手房“抛售狂潮”越来越猛?专家:4个迹象预示着房价新信号

巢客HOME
2025-11-03 09:25:03
中信银行发年终奖了!

中信银行发年终奖了!

行长男朋友
2025-11-03 11:05:40
阿娇自曝肝问题已戒酒,胖到150斤富态又美丽,44岁想生娃有点难

阿娇自曝肝问题已戒酒,胖到150斤富态又美丽,44岁想生娃有点难

疯说时尚
2025-10-25 10:50:31
“捏不完根本就捏不完”,安徽一捏面人大叔走红,景区:他红了之后也没涨价,早上7点出摊就要排队,需凭号购买

“捏不完根本就捏不完”,安徽一捏面人大叔走红,景区:他红了之后也没涨价,早上7点出摊就要排队,需凭号购买

极目新闻
2025-11-03 15:07:46
2年1200万!湖人开局另一惊喜,拉拉维亚什么水平?

2年1200万!湖人开局另一惊喜,拉拉维亚什么水平?

篮球实录
2025-11-03 14:41:53
金枪鱼为了不被吃有多努力?160公里时速,一旦停下就会被淹死。

金枪鱼为了不被吃有多努力?160公里时速,一旦停下就会被淹死。

百态人间
2025-10-28 15:47:35
2025-11-03 15:44:49
大象新闻 incentive-icons
大象新闻
河南广电官方网易号!
127647文章数 272256关注度
往期回顾 全部

科技要闻

余承东内部信:鸿蒙下一步要实现上亿覆盖

头条要闻

中纪委"三连发" 三"虎"同日被开除党籍

头条要闻

中纪委"三连发" 三"虎"同日被开除党籍

体育要闻

开拓者官宣召回杨瀚森 队记解析核心原因

娱乐要闻

录音彻底揭露知名导演王家卫的体面

财经要闻

马斯克:未来5-6年传统手机与App将消失

汽车要闻

超跑同款磁流变减振 深蓝L06包你开得爽

态度原创

艺术
数码
本地
时尚
公开课

艺术要闻

90后跨国夫妻,到浙江山居:花20万租20年,值了!

数码要闻

2025 年 10 月 Steam 软硬件调查:RTX3060 桌面版显卡最受欢迎

本地新闻

全网围观,到底多少人被这个野人大学生笑疯了

秋季穿衣别太老气横秋,看看这27套造型,时尚舒适又显高

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版