据悉,最近一项研究发现,AI在长期接触垃圾数据后,其推理能力和长文本理解力会出现断崖式下跌,甚至在安全和伦理方面的表现也会下降。研究人员通过模拟人类无休止地刷低质量、碎片化内容的互联网生活,将从社交媒体平台上筛选出的垃圾数据以不同比例混合,持续喂食给模型。结果显示,当垃圾数据比例从0%提升到100%时,模型的推理准确率急剧下降。研究还发现,模型在被垃圾数据腐蚀后,会跳过中间推理过程,直接给出粗糙答案。更令人担忧的是,这种退化过程是不可逆的,即使重新投喂高品质数据并进行指令微调,模型的认知能力也无法完全恢复到初始水平。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.