网易首页 > 网易号 > 正文 申请入驻

S3FT选择性自监督微调:通过智能选择训练样本提升大模型整体表现

0
分享至

选择性自我监督微调(Selective Self-to-Supervised Fine-Tuning,S3FT)是一种创新的大语言模型微调方法,该方法通过部署专门的语义等价性判断器来识别训练集中模型自身生成的正确响应。在微调过程中,S3FT策略性地结合这些正确响应与剩余样本的标准答案(或其释义版本)来优化模型。与传统监督微调(SFT)相比,S3FT不仅在特定任务上表现出更优的性能,还显著提升了模型的跨域泛化能力。通过充分利用模型自身生成的高质量响应,S3FT有效减缓了微调阶段中常见的模型过度专门化问题。

S3FT技术原理与实现机制

选择性自我监督微调(S3FT)旨在解决大型语言模型(LLM)特定任务微调过程中的一个核心挑战:如何在提升模型在目标任务上的表现的同时,最大程度地保留其通用能力。这一问题在标准监督微调(SFT)中尤为突出。S3FT的设计基于两项关键发现:

自然语言处理任务通常存在多种有效响应现象,即对同一输入可能存在多个语义等价但表述不同的正确答案。此外,利用模型自身生成的语言形式进行训练有助于保持模型原始分布特性,从而减轻灾难性遗忘现象(即模型丢失先前获取的知识)。

初始预测阶段:

S3FT首先针对训练样本(输入xi与标准答案yi)让基础模型Mθ0(已经过预训练和指令调整)生成预测结果ˆyi = Mθ0(xi)。

等价性评估阶段:

系统随后评估生成的预测ˆyi与标准答案yi之间的语义等价性。这一评估可通过两种方式实现:一是采用启发式方法,如关键信息比对或整体一致性验证;二是调用更强大的语言模型作为判断器,对ˆyi和yi之间的语义等价性进行评估。

训练数据选择策略:

当ˆyi与yi语义等价时,系统将采用(xi, ˆyi)对作为训练样本,这种方式强化了模型现有知识结构,并有助于维持其原始分布特性。当ˆyi与yi不等价时,基础模型Mθ0会对标准答案yi进行自主释义,生成˜yi = Mθ0([xi; yi]),这一步骤旨在缩小标准答案与模型自身语言风格之间的差距。

二次等价性验证:

对于需要释义的情况,系统会再次验证˜yi是否与yi语义等价。

最终训练数据确定:

如果˜yi与yi语义等价,则使用(xi, ˜yi)对进行训练,这种方法在传授模型所需输出的同时,保持了其自身的"语言风格",最大限度减少与原始分布的偏离。如果˜yi与yi不等价,则回退到标准SFT方式,使用原始(xi, yi)对进行训练,这是当模型无法生成合适释义时的兜底策略。

实验中采用Mistral-instruct-v2 (7B)同时作为基础模型和判断模型。所有微调实验均采用低秩适应(Low-Rank Adaptation,LoRA)技术,其中秩设为8,缩放因子为16,dropout率为0.1。

性能评估与实验结果

上图展示了不同微调技术在准确率(%)指标下的性能对比。

领域内性能提升:实验结果表明,S3FT在领域内数据集(如GSM8K、MBPP和NQ)上的表现显著优于基础模型和传统SFT方法。特别是在阅读理解任务(NQ数据集)上,S3FT达到了与SDFT相当的性能水平。

上图展示了各方法在其他基准测试上的泛化能力。

灾难性遗忘缓解效果:与传统SFT相比,S3FT展现出更强的泛化能力,在微调后的领域外基准测试中性能下降幅度明显减小。相比之下,SFT在这些基准上出现了显著的性能降低,表明存在严重的灾难性遗忘问题。

上图为Mistral-7B-Instruct-v0.2对标准响应、标准响应释义和模型自身预测分配的对数概率直方图。

标准响应释义的影响分析:研究发现,将模型自身的正确响应作为训练目标(如S3FT中采用的策略)能带来更优的性能和泛化能力。这一现象可归因于模型生成的响应通常比标准响应甚至释义后的标准响应更接近模型自身的分布特性。直接训练标准响应会导致模型分布发生改变,从而对泛化能力产生负面影响。

总结

S3FT(选择性自监督微调)代表了一种解决大语言模型微调中固有问题的创新方法。通过智能地选择和整合模型自身生成的高质量响应,S3FT成功地在两个看似矛盾的目标之间取得了平衡:提升特定任务的性能,同时保留模型的泛化能力。实验结果清晰地表明,与传统监督微调相比,S3FT不仅在目标领域内取得了更好的性能,还显著减轻了灾难性遗忘现象,维持了模型在领域外任务上的表现。

这种方法的核心优势在于尊重模型原有的语言分布特性,使微调过程更加和谐,避免了强制模型适应可能与其内部表征不一致的外部标准答案。此外,S3FT的实现相对简单,不需要复杂的架构修改或额外的训练阶段,这使其成为一种实用且有效的微调策略。

未来工作可以探索更高效的等价性判断机制,以及S3FT在更广泛任务类型和更大规模模型上的应用效果。此外,将S3FT与其他微调技术(如参数高效微调方法)结合的潜力也值得研究。总体而言,S3FT为大语言模型的微调提供了一种平衡特定任务性能和通用能力的新范式,为AI系统的实际应用提供了重要价值。

论文地址:

https://avoid.overfit.cn/post/da816d0257eb4600a132a6da935b3cd9

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“预制菜”,新华社也错了!

“预制菜”,新华社也错了!

钧言堂
2025-09-16 22:35:22
三只羊旗下三名主播复播:时长不足1小时,创始人大小杨哥未现身

三只羊旗下三名主播复播:时长不足1小时,创始人大小杨哥未现身

澎湃新闻
2025-09-16 19:46:27
歼-20战机首次进行静态展示

歼-20战机首次进行静态展示

新京报
2025-09-16 13:36:08
太唏嘘!于朦胧母亲证实儿子意外坠亡,疑似表哥发声直言不能接受

太唏嘘!于朦胧母亲证实儿子意外坠亡,疑似表哥发声直言不能接受

萌神木木
2025-09-16 23:33:22
39岁老总包养19岁女大学生,结果被剁成265块,凶案现场被曝光…

39岁老总包养19岁女大学生,结果被剁成265块,凶案现场被曝光…

极品小牛肉
2024-02-05 17:24:40
金正恩:让朝鲜人民每天都能吃到肉!

金正恩:让朝鲜人民每天都能吃到肉!

微微热评
2025-09-16 11:34:57
什么样的主教练,才能带领曼联走出泥潭?数据已经说明了一切

什么样的主教练,才能带领曼联走出泥潭?数据已经说明了一切

金风说
2025-09-17 00:15:21
今晚爆赚4.6万!再创历史新高!A股还会涨多久?

今晚爆赚4.6万!再创历史新高!A股还会涨多久?

龙行天下虎
2025-09-17 00:03:47
百年一遇!新疆棉花地捡回 "怪鸟",竟是全球仅存 1 个标本的夜精

百年一遇!新疆棉花地捡回 "怪鸟",竟是全球仅存 1 个标本的夜精

伴史缘
2025-09-16 18:55:38
散步8000步错了?医生建议:过了60岁,散步要尽量做到这6点

散步8000步错了?医生建议:过了60岁,散步要尽量做到这6点

荷兰豆爱健康
2025-09-16 10:32:36
吃饭也要讲政治

吃饭也要讲政治

特例的猫
2025-09-16 16:59:35
62岁穆帅重回巨龙球场,不停挥手+眼含泪光,球迷:还是那么帅

62岁穆帅重回巨龙球场,不停挥手+眼含泪光,球迷:还是那么帅

侧身凌空斩
2025-09-16 10:37:05
白、黑、黄种人为何没有生殖隔离?

白、黑、黄种人为何没有生殖隔离?

宇宙时空
2025-09-16 07:07:07
波兰叫停90%中欧班列,欧洲发出紧急警告,中国上门磋商

波兰叫停90%中欧班列,欧洲发出紧急警告,中国上门磋商

头条爆料007
2025-09-16 18:01:24
0-1到2-1!神锋点球双响 对轰43脚 14亿豪门10打11欧冠惊险开门红

0-1到2-1!神锋点球双响 对轰43脚 14亿豪门10打11欧冠惊险开门红

狍子歪解体坛
2025-09-17 05:10:44
江苏男篮黄金一代再聚首,28支球队集结亮相!篮球苏超正式开幕

江苏男篮黄金一代再聚首,28支球队集结亮相!篮球苏超正式开幕

现代快报
2025-09-16 21:58:02
“公然‘戏耍’央视,出门带30保镖,下场如何?”

“公然‘戏耍’央视,出门带30保镖,下场如何?”

丁羂解说
2025-09-09 00:20:44
三大影帝,年度最佳!小李子新片口碑出炉,斯皮尔伯格大赞疯狂

三大影帝,年度最佳!小李子新片口碑出炉,斯皮尔伯格大赞疯狂

头号电影院
2025-09-14 22:37:17
调研报告显示:超八成用户通过以旧换新购iPhone 17时首选京东

调研报告显示:超八成用户通过以旧换新购iPhone 17时首选京东

手机中国
2025-09-16 18:06:21
全世界都被俄罗斯耍了,侵入波兰只是一个幌子,真正目标曝光

全世界都被俄罗斯耍了,侵入波兰只是一个幌子,真正目标曝光

南宫一二
2025-09-16 08:40:16
2025-09-17 07:12:49
deephub incentive-icons
deephub
CV NLP和数据挖掘知识
1770文章数 1427关注度
往期回顾 全部

科技要闻

2025款Apple Watch全系怎么选?

头条要闻

女子误踩"化骨水"去世:9点误踩15点心脏衰竭 当天死亡

头条要闻

女子误踩"化骨水"去世:9点误踩15点心脏衰竭 当天死亡

体育要闻

2022:勇士归来,库里的第四个冠军

娱乐要闻

李小璐母亲:女儿嫁给贾乃亮我好后悔

财经要闻

扩大服务消费 9部门提出5方面19条举措

汽车要闻

智能体豪华旅行车 享界S9T30.98万元起售

态度原创

本地
艺术
旅游
公开课
军事航空

本地新闻

云游忻州 | 慢时光!老街逛吃,烟火气超上头~

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

歼-20战机首次进行静态展示

无障碍浏览 进入关怀版