网易首页 > 网易号 > 正文 申请入驻

LeCun力荐!进化算法淘汰77%低质数据:RIP方法让模型性能狂飙60%

0
分享至

新智元报道

编辑:peter东 乔杨

【新智元导读】近日,Meta等机构发表的论文介绍了一种通过进化算法构造高质量数据集的方法:拒绝指令偏好(RIP),得到了Yann LeCun的转赞。相比未经过滤的数据,使用RIP构建的数据集让模型在多个基准测试中都实现了显著提升。

在LLM的开发中,推动模型进步的主要驱动力是精心挑选高质量的训练示例。 虽然Scaling Law的确能实现「力大砖飞」,但仅仅增加数据量并不能保证模型性能的提升,数据的质量才是关键。 低质量的数据可能会引入噪声,影响模型的训练效果。

那么,有什么方法能自动筛选出,甚至是自动创建出高质量又兼具多样性的数据集?

最近,Meta、UC伯克利、NYU等机构的学者提出了一种最新方法,简称RIP,让低质量数据「一路走好」的同时,也是在暗示——只有成功存活下来的数据才是高质量的数据。

论文地址:https://arxiv.org/abs/2501.18578

受到进化算法的启发,RIP在Alpacaeval2、Arena-Hard、Wildbench等多个有影响力的基准上实现了大幅提升,获得了LeCun的转赞。

RIP方法概述

拒绝指令偏好(RIP)的基础是两个核心假设。

第一个假设是,低质量prompt很可能产生低质量响应。具体来说,那些意义不明确、模糊或包含冲突信息的提示词,很可能导致嘈杂或不准确的模型响应。这些提示词不应该作为之后用于指令微调(SFT)的训练数据。

第二个假设是,低质量prompt很可能产生具有更大差异的响应。

低质量prompt会引入不确定性和模糊性,可能存在多种解释,因此LLM可能会猜测或填补提示词中的空白,这导致多次响应之间的差异性更高。虽然其中一些响应可能与prompt的原始意图一致,但其他响应可能显著偏离。

从这一点上进行逆向思考,我们就可以将模型多次响应的方差视为评估提示词质量的指标。方差越小,表明提示词的质量更高。

基于上述两个假设,RIP方法就可以测量被拒绝的响应质量(下图m_1),以及被选择和被拒绝的响应之间的奖励差距(reward gap,下图m_3),从而评估数据的完整性。

上图中定义的3个关键指标分别有如下含义:

m_1:被拒绝响应的的质量。

m_2:被拒绝响应的长度,较长的被拒绝响应可能意味着提示更复杂或更模糊。

m_3:被选择与被拒绝响应之间的奖励差距,较小的差距可能表明提示更清晰、更具体。

基于这种方法,RIP可以用于筛选、构建高质量数据集。给定一组提示词X={x} ,RIP旨在找到一个子集S⊆X ,S可用于微调大模型

RIP如同设定一个优胜劣汰的提示词斗兽场,提示词对应的响应要么获胜(被选择),要么失败(被拒绝)。响应对及其奖励可以来自人类偏好数据,也可以由模型本身生成,然后使用其它大模型进行评分。

除了过滤现有训练集,RIP也可以用于构建高质量合成数据集。

用于生成合成数据时,首先筛选出一组高质量的提示作为种子池,然后使用这些种子提示词作为少量样本,引导模型生成新的提示词。

这些新生成的提示词可以进一步通过RIP进行筛选,以确保合成数据的质量,这种方法被称为Self-RIP。

实验结果与分析

RIP在多个实验中都取得了显著的性能提升,尤其是在人类编写的提示上,表现出了显著的优势。

例如,在包含超过25万条人工编写提示词的WildChat数据集上,通过Llama 3.1-405B-Instruct评估响应的质量,为每个回答需进行 10 次独立评估,每次给出0到10分的评分,并使用平均分作为最终奖励。

如下表所示,RIP只需要不到一半的训练样本,就能在多个指标上实现显著提升。

使用RIP过滤出高质量的提示词后,RIP显著提高了Llama3.1-8B-Instruct DPO基线的性能。

在更大参数的模型上,RIP同样有效。过滤显著提升了Llama 3.3-70B-Instruct模型的性能,AlpacaEval2 LC胜率从38.9提升至67.7,Arena Hard从67.5提升至82.9,WildBench从52.8提升至58.8。

这些结果表明,RIP能够有效地筛选出高质量的提示,从而提升模型的性能。

应Self-RIP方法 ,基于少样本生成而不进行后过滤得到20k大小的数据集,可以让模型在AlpacaEval2上的LC胜率从 48.4%提高到53.6%,Arena-Hard胜率从37.9%提高到43.7%,以及在WildBench上的WB-Score从41.5提高到44.8。这进一步说明了在高质量指令上训练的重要性。

当应用完整的Self-RIP方法并使用后过滤(post-filtering)时,训练效果进一步改善,实现了最佳的AlpacaEval2 LC胜率60.2%。

RIP在与其他筛选方法的比较中也表现出色。与基于提示的筛选方法(如InsTag Diversity/Difficulty Filtering)相比,RIP在所有基准测试中都取得了更高的分数。

此外,与基于提示和选择响应的筛选方法(如PPL和IFD)相比,RIP也表现出更好的性能。这些结果表明,RIP在筛选提示时考虑了更多的因素,从而能够更准确地评估提示的质量。

图1:不同训练数据大小下,使用RIP及self-RIP之后的模型训练效果提升。

总体来看,RIP借鉴进化算法,为LLM的训练提供了一种简单却新颖的思路。相比人类编写的和模型生成的提示词,使用RIP过滤后的提示词集合,在进行指令微调后,模型性能有显著提升。

未来的研究可以在此基础上进行进一步的探索和改进。例如,可以研究如何优化评估模型,以提高其对响应质量的评估准确性;可以探索如何降低RIP方法的计算成本,使其更适合大规模数据的处理;还可以研究进行安全性评估——探索使用RIP进行安全性过滤,在现有系统中构建专门用于安全性的奖励模型。

参考资料:

https://arxiv.org/abs/2501.18578

https://x.com/jaseweston/status/1885160135053459934

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
农村的光棍已经泛滥成灾了。

农村的光棍已经泛滥成灾了。

经济学教授V
2025-11-18 18:51:48
场均42分!18岁猛将该进国家队!广东夺冠疯狂庆祝,杜锋拥抱他

场均42分!18岁猛将该进国家队!广东夺冠疯狂庆祝,杜锋拥抱他

老吴说体育
2025-11-19 00:50:11
官媒证实邓超移民,46岁再创新高,传闻五个月前已澄清

官媒证实邓超移民,46岁再创新高,传闻五个月前已澄清

君笙的拂兮
2025-11-18 06:06:04
80 岁英王室特工临终吐秘:菲利普亲王为保威廉,下令终结戴安娜

80 岁英王室特工临终吐秘:菲利普亲王为保威廉,下令终结戴安娜

猫眼观史
2025-11-18 14:37:25
台积电美国厂暴跌100倍,遭重创!现实打脸!

台积电美国厂暴跌100倍,遭重创!现实打脸!

EETOP半导体社区
2025-11-18 08:37:24
朱珠称霍建华是她见到第一个拍戏不用房车的主演,网友:不愧是林心如自留款

朱珠称霍建华是她见到第一个拍戏不用房车的主演,网友:不愧是林心如自留款

红星新闻
2025-11-18 13:35:12
日本绝密档案被公开,侵略中国并非表现简单,真实目的让人恐惧

日本绝密档案被公开,侵略中国并非表现简单,真实目的让人恐惧

宅家伍菇凉
2025-07-19 09:30:03
胡春华发表署名文章

胡春华发表署名文章

社评
2025-10-31 10:11:37
山东一个小村才2400人,却建了589座别墅,人均收入8万!

山东一个小村才2400人,却建了589座别墅,人均收入8万!

青眼财经
2025-11-17 22:21:42
全球军力排名出炉,俄罗斯位列五强

全球军力排名出炉,俄罗斯位列五强

俄罗斯卫星通讯社
2025-11-15 16:08:03
官宣,男篮名宿上任,37岁,担任总经理,曾被前妻卷走资产

官宣,男篮名宿上任,37岁,担任总经理,曾被前妻卷走资产

乐聊球
2025-11-18 11:00:43
河南一火车站将恢复客运!

河南一火车站将恢复客运!

鲁中晨报
2025-11-18 16:24:04
向佑彻底没救了!现身南昌酒吧,新交的女友又胖又颓,烟酒不离手

向佑彻底没救了!现身南昌酒吧,新交的女友又胖又颓,烟酒不离手

喜欢历史的阿繁
2025-11-12 01:28:08
罕见!13岁中国前锋在西班牙爆发:8场4球成队内头号射手!

罕见!13岁中国前锋在西班牙爆发:8场4球成队内头号射手!

邱泽云
2025-11-18 15:01:55
孙俪发长文为儿子等等庆生,邓超回复:不要再伤害我的视力了

孙俪发长文为儿子等等庆生,邓超回复:不要再伤害我的视力了

蕾爸退休日记
2025-11-15 19:22:56
浙江:女子远嫁11年,如今离婚了,从始至终老公都看不上她娘家人

浙江:女子远嫁11年,如今离婚了,从始至终老公都看不上她娘家人

小霍霍
2025-11-18 13:48:34
赢麻了!现在全网最想哭的人估计是冷美人,30多天拿到30000多元

赢麻了!现在全网最想哭的人估计是冷美人,30多天拿到30000多元

火山诗话
2025-11-18 18:36:08
石破茂卸任后直言:中日若开战,日本百分之百会亡国

石破茂卸任后直言:中日若开战,日本百分之百会亡国

丹徒生
2025-11-12 05:53:54
40岁师父和20岁女徒弟偷情:全过程披露,肮脏聊天曝光,原配发声

40岁师父和20岁女徒弟偷情:全过程披露,肮脏聊天曝光,原配发声

博士观察
2025-11-06 20:42:23
立冬后,打死也不能吃3种“反季菜”,难吃还特贵,菜贩子都不吃

立冬后,打死也不能吃3种“反季菜”,难吃还特贵,菜贩子都不吃

小茉莉美食记
2025-11-16 12:01:29
2025-11-19 10:19:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13901文章数 66271关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

南部空军发布"别太狂":我和战机凌空一击 将它"干掉"

头条要闻

南部空军发布"别太狂":我和战机凌空一击 将它"干掉"

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

宋佳夺影后动了谁的奶酪

财经要闻

大规模宕机!美国多个网站崩了

汽车要闻

脱胎换骨的优秀底盘Get 新款享界S9动态驾驶体验

态度原创

游戏
房产
旅游
艺术
公开课

《湮灭之潮》新内容预热 将在Xbox发布会亮相

房产要闻

29.4亿!海南“地王”片区,要卖超级宅地!

旅游要闻

三江口畔岁月长 花木葱茏布依村(寻找最美乡村·中寨村)

艺术要闻

墙上9字书法太难,12人识不全,学书法还有用吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版