网易首页 > 网易号 > 正文 申请入驻

金鱼损失随机剔除token,让AI不再死记硬背

0
分享至

henry 发自 凹非寺
量子位 | 公众号 QbitAI

训练大模型时,有时让它“记性差一点”,反而更聪明!

大语言模型如果不加约束,很容易把训练数据原封不动地复刻出来。为解决这个问题,来自马里兰大学、图宾根大学和马普所的研究团队提出了一个新方法——金鱼损失(Goldfish Loss)



顾名思义,金鱼损失就是让模型像金鱼一样,不去死记每一个细节,而是在损失函数计算时随机剔除一小部分token。

由此,模型不再逐字记住训练集内容,但仍能学会语言规律。

实验显示,LLaMA-2在使用金鱼损失后:

  • 记忆化内容显著减少:模型不再复现训练数据
  • 下游任务性能几乎不受影响:仍然能流畅生成文本

用网友的精辟评论概括就是:dropout,但损失函数!



在梯度计算中随机屏蔽部分token

金鱼损失的核心理念非常简单,就是在模型训练过程中随机剔除一部分训练文本中的tokens,使其不参与损失计算。

这样一来,当模型在推理阶段遇到这些位置时,就只能“猜测”,而不是逐字逐句复现训练数据的完整序列。

此外,为了保证被剔除token的一致性,研究人员设计了一种基于哈希(hashing)的掩码策略。



那么,这和同样是防止模型背会的正则化方法有什么不同呢?

Dropout这样的正则化方法为例,它通过在训练时“加噪声”来防止模型过度依赖某些参数,从而提高模型举一反三的能力。

但这样做的问题在于:如果只是随机丢token,那么,每次看到同一段落时,丢掉的地方不一样,模型累计几次就能拼凑出完整段落。

所以,说到底,模型还是靠死记硬背,记住了答案。

相比之下,金鱼损失则用哈希掩码确保每次遇到同一段落,掩盖位置都一样,这就从根本上阻止了模型复现完整训练文本。

接下来,我们来看金鱼损失具体是怎么做的。

在传统的next-token prediction中,模型以序列中的下一个真实token作为目标,输出预测分布,并基于该分布计算交叉熵损失。



在金鱼损失下,模型虽然也在前向传播中预测序列里下一个 token。但在计算损失时,会以一定的概率将某些位置的token从损失计算里“抹掉”。

也就是说,有些真实的下一个token不会作为目标来训练。



在这里,研究人员采用了简单的静态掩码(static mask),剔除每序列中的第4个token。

更进一步,为了确保模型不会从其他地方学到被掩码的数据(例如不同的文档会在不同的网页中反复出现),研究团队还提出了一种局部化哈希掩码(localized hashed mask),使得当相同的前h个token出现时,掩盖模式是相同的(可重复)。

实验测试与结果

为了验证金鱼损失确实能防止记忆化,研究团队设计了两种实验场景:

一种是极端场景,通过对少量样本进行多个训练周期(即重复)来强烈促使记忆化;

另一种是标准场景,模拟现实模型训练中使用的批次处理方式 。

同时,为了评估模型的记忆化程度,研究采用了以下指标:

  • RougeL得分:该指标衡量最长公共(非连续)子序列的长度 。得分为1.0表示完美记忆 。
  • 精确匹配率(Exact Match):该指标衡量正确预测的序列占真实序列的百分比.

实验表明,在极端场景下,标准训练导致模型逐字记忆了100篇文章中的84篇,而金鱼损失没有记忆任何文章



(注:实验让LLaMA-2-7B在《哈利·波特》第一章或100篇维基百科文档上进一步训练了100个epoch)

此外,在标准训练场景下,金鱼损失也明显减少了模型逐字复现训练语料库中目标序列的情况。



但这里可能有个直觉式的反应——如果让模型“随机漏学”一些token,它的能力会不会也随之降低呢?

对此,研究人员进行了测试:研究表明,金鱼损失模型、标准损失模型和对照模型之间的总体性能没有系统性差异。



需要注意的是,金鱼损失的核心在于忽略部分token的梯度计算。因此,为了学到足够的语言模式,模型必须通过更多数据来补偿这些空缺,这可能导致计算效率的下降。

[1]https://arxiv.org/pdf/2406.10209

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
8个月内遭U22国足双杀,韩媒破防:震惊!韩国足球前所未有的耻辱

8个月内遭U22国足双杀,韩媒破防:震惊!韩国足球前所未有的耻辱

我爱英超
2025-11-15 22:09:56
小伙自驾西藏,遇徒步女学生搭车,同行2天后,才知自己躲过一劫

小伙自驾西藏,遇徒步女学生搭车,同行2天后,才知自己躲过一劫

五元讲堂
2025-10-16 14:41:16
19年秦汉为父亲孙元良站台,共青团下场批驳:民族败类,何足纪念

19年秦汉为父亲孙元良站台,共青团下场批驳:民族败类,何足纪念

浩渺青史
2025-11-14 20:13:30
2胜10负,主帅下课!鹈鹕没那么多耐心,这跟快船形成鲜明反差

2胜10负,主帅下课!鹈鹕没那么多耐心,这跟快船形成鲜明反差

移动挡拆
2025-11-16 00:00:32
83年,下岗职工花700块买下上海废旧水塔住,22年后拆迁时愣了

83年,下岗职工花700块买下上海废旧水塔住,22年后拆迁时愣了

温情邮局
2025-11-11 10:58:54
吴亦凡疑狱中绝食去世!家人也失联,目前未有正式回应

吴亦凡疑狱中绝食去世!家人也失联,目前未有正式回应

逍遥浪腾云
2025-11-13 10:36:38
2026届新秀有多强?NBA高管:弗拉格若明年参选可能跌至第6位

2026届新秀有多强?NBA高管:弗拉格若明年参选可能跌至第6位

罗说NBA
2025-11-15 07:20:01
当陈松伶和小李琳同框,才发现女人到中年,幸不幸福都写在脸上

当陈松伶和小李琳同框,才发现女人到中年,幸不幸福都写在脸上

喵喵娱乐团
2025-11-14 16:05:23
万亿巨头深夜公告!股东拟转让市值184亿元股票,押宝储能?

万亿巨头深夜公告!股东拟转让市值184亿元股票,押宝储能?

证券时报e公司
2025-11-15 09:34:55
遭到大量网暴后郭女士忍不住痛哭,砸玻璃的监控遭媒体曝光

遭到大量网暴后郭女士忍不住痛哭,砸玻璃的监控遭媒体曝光

映射生活的身影
2025-11-15 17:50:36
活塞能以10胜2负稳坐东部第一,主教练比克斯塔夫居功至伟

活塞能以10胜2负稳坐东部第一,主教练比克斯塔夫居功至伟

大眼瞄世界
2025-11-15 07:33:01
赵露思原经纪公司银河酷娱发布最新声明

赵露思原经纪公司银河酷娱发布最新声明

鲁中晨报
2025-11-14 22:15:02
具俊晔成瓮中之鳖!遗产背后虽有高人指点,但还是棋差一招

具俊晔成瓮中之鳖!遗产背后虽有高人指点,但还是棋差一招

TVB的四小花
2025-11-16 00:08:32
荒诞!杨兰兰拒绝认罪,场外竟有“超级粉丝”高喊支持杨小姐

荒诞!杨兰兰拒绝认罪,场外竟有“超级粉丝”高喊支持杨小姐

吃瓜局
2025-11-15 15:56:23
世界前十!广州足协副主席:7.3万人专业足球场明年就能用!

世界前十!广州足协副主席:7.3万人专业足球场明年就能用!

邱泽云
2025-11-15 17:31:16
81岁林豆豆现状:已退休23年,独居在北京老房子,用阅读打发时间

81岁林豆豆现状:已退休23年,独居在北京老房子,用阅读打发时间

揽星河的笔记
2025-11-12 12:36:17
00后沪漂女孩发文:将永远维护上海人!

00后沪漂女孩发文:将永远维护上海人!

看看新闻Knews
2025-11-15 19:44:16
库里挑衅马刺主场2万球迷!霸气微笑让他们大声点,随后绝杀比赛

库里挑衅马刺主场2万球迷!霸气微笑让他们大声点,随后绝杀比赛

嘴炮体坛
2025-11-15 23:59:38
做好准备!即将反击!A股下周要爆了!

做好准备!即将反击!A股下周要爆了!

龙行天下虎
2025-11-15 20:39:07
拿500万!全场6中1,只得2分,坑惨四川,球迷:她是混高薪的混子

拿500万!全场6中1,只得2分,坑惨四川,球迷:她是混高薪的混子

南海浪花
2025-11-15 21:51:19
2025-11-16 01:07:00
量子位 incentive-icons
量子位
追踪人工智能动态
11682文章数 176330关注度
往期回顾 全部

科技要闻

撕掉流量外衣,小米还剩什么?

头条要闻

中方愤怒升级24小时内2次"奉示约见" 高市又有新动作

头条要闻

中方愤怒升级24小时内2次"奉示约见" 高市又有新动作

体育要闻

樊振东和他的尖子班 勇闯地表最强乒乓球赛

娱乐要闻

钟嘉欣婚变风波升级!被骗婚?

财经要闻

小米之“惑”

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

艺术
数码
亲子
家居
军事航空

艺术要闻

她的笔下女子如此动人,晚年却名声扫地!

数码要闻

华为Mate 80全系支持3D人脸识别,同期还有高端“二合一平板电脑”

亲子要闻

同个世界同款娃爸:孩子爱“鸳鸯袜”,“甩手掌柜”宝爸爱找茬!

家居要闻

现代简逸 寻找生活的光

军事要闻

解密福建舰电磁弹射背后的硬核支撑

无障碍浏览 进入关怀版