网易首页 > 网易号 > 正文 申请入驻

大模型免微调解锁对话能力,RLHF没必要了!一作上交大校友

0
分享至

  • 梦晨 发自 凹非寺
    量子位 | 公众号 QbitAI

要搞大模型AI助手,像ChatGPT一样对齐微调已经是行业标准做法,通常分为SFT+RLHF两步走。

来自艾伦研究所的新研究却发现,这两步都不是必要的???

新论文指出,预训练完成刚出炉的基础模型已经掌握了遵循指令的能力只需要提示工程就能引导出来,引起开发社区强烈关注。

因为RLHF的成本非常高训练还不稳定,这样可就省了大钱了。

研究据此提出一种新的免微调对齐法URIAL

论文中把新方法形容为“解锁基础模型潜力的咒语”,能够节省大量算力资源和时间。

更值得关注的是,不掌握稳定RLHF(人类强化学习)能力的小型团队,也能低成本开发出可以聊天对话、遵循指令的对齐模型了。

目前URIAL代码和新评估基准Just-Eval-Instruct已开源,刚刚上传不久。

研究来自艾伦研究所和华盛顿大学Yejin Choi团队,过去曾提出Top_p采样,在如今大模型API调用中是常用参数。

一作研究员林禹辰是上交大校友。

打破SFT+RLHF神话

最早让人们开始质疑对齐微调的,是一项Meta等在5月份一项研究LIMA

LIMA指出只需要1000个样本做SFT(监督微调),就可以匹配ChatGPT的性能。

论文中LIMA团队还探讨了“表面对齐假设”(Superficial Alignment Hypothesis):

模型的知识和能力几乎都是在预训练阶段学到的,对齐则是教会模型在与用户互动时应使用哪些特定格式的子集。

换句话说,对齐阶段只是调整模型的语言风格,没有增强模型的能力。

从表面对齐假设出发,URIAL团队做了充分的实验,对比基础模型和对齐模型之间的token分布偏移(TDS,token distribution shifts)。

实验选用3组基础模型与对齐模型做对比,结果表明:

  • 对齐仅影响一小部分token。基础模型和对齐模型在大多数位置的解码中表现相同,共享排名靠前的一组token。
  • 对齐主要涉及文风相关的token,如话语标志(discourse markers,“首先、其次、总之、然而……”这些)、过渡词和安全免责声明,只占5-8%。
  • 对齐对较早出现的token更重要(生成内容的开头),在后续位置对齐模型排名最高的token,基本位于基本模型排top-5的token之内。
  • 基础模型已经获得了足够的知识来遵循指令,给定合适的上下文作为前缀时,它们的行为与对齐模型非常相似。

接下来的问题就是,不用SFT和RLHF的情况下,如何把一个基础模型变成能多轮对话、遵循指令的AI助手?

免微调对齐法URIAL

团队的免微调对齐法URIAL(Untuned LLMs with Restyled In-context ALignment),纯粹利用基础模型的上下文学习能力实现有效对齐,只需三个风格示例和一个系统提示。

在实验中,团队使用URIAL方法对齐7B、70B的Llama2以及Mistral-7B大模型。

结果表明当基础模型很强时,URIAL的表现甚至优于SFT和RLHF

团队认为URIAL方法的主要贡献有:

  • 实施起来非常简单,并且可完美重现,从而有助于未来新的免微调和微调对齐方法的开发和评估。
  • 可轻松对齐大尺寸模型(如Llama2-70b甚至Falcon-180b),节省大量算力和时间。
  • 可用于在预训练过程中频繁评估基础模型,监控基础模型的质量。
  • 可用于公平比较不同基础模型之间的对齐潜力。过去不同模型的微调过程可能差异很大(例如数据、训练方法、超参数等),不能直接反映基础模型的质量。
  • 还可用于探索大模型对齐的科学,例如分析基础模型在预训练期间已经获得的知识和技能,识别缺失的内容,而不是盲目地利用大量数据进行微调,从而产生不必要的计算成本。

实验也探索了URIAL中示例的不同数量,如果提高到8个,一些指标中有明显提升,但一些指标中也有下降,最终作者推荐用3个比较平衡

对于改用不同的示例也比较稳健

如果把之前对话作为示例的一部分,URIAL也可以让基础模型获得多轮对话的能力

One More Thing

论文中实验的Llama-2和Mistral,其实总体来说都属于羊驼家族。

URIAL免微调对齐法是否用于羊驼架构之外的大模型?

由于不是羊驼的开源大模型不好找,我们试了试刚刚发布的Transformer挑战者,Mamba架构基础模型。

Mamba是一种状态空间模型,别说不是羊驼了,连Transformer都不是。

使用论文附录提供的一份URIAL标准提示词,简单测试发现同样适用。

使用URIAL询问“你能用6岁小朋友也能听懂的方式解释什么是状态空间模型吗?”

Mamba将数学定义的状态比喻成了车在路上的位置,比较简单易懂,甚至给出markdown格式的图片链接,试图图文并茂回答问题。

如果不使用URIAL直接输入这个问题,Mamba的表现就是基础模型那样补全下文而不是回答问题了,解释的内容也是车轱辘话来回说。

论文:
https://allenai.github.io/re-align/

参考链接:
[1]https://twitter.com/IntuitMachine/status/1732089266883141856
[2]https://arxiv.org/abs/2305.11206

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
比预期的要快!

比预期的要快!

成方街哨兵
2026-04-14 17:44:27
国民党内讧,前高层冲闯党部斥责郑丽文:你不配当主席,是个卒子

国民党内讧,前高层冲闯党部斥责郑丽文:你不配当主席,是个卒子

面包夹知识
2025-12-31 23:04:14
斯诺克送出第3份百万大奖?20岁小将听牌,复刻火箭常冰玉成就?

斯诺克送出第3份百万大奖?20岁小将听牌,复刻火箭常冰玉成就?

刘姚尧的文字城堡
2026-04-14 14:45:16
2.5亿化成灰!俄最强战舰未战先沉,390架廉价无人机捅穿防空神话

2.5亿化成灰!俄最强战舰未战先沉,390架廉价无人机捅穿防空神话

杰丝聊古今
2026-03-28 01:03:36
山东省纪委监委网站发布:1人被查,1人被双开

山东省纪委监委网站发布:1人被查,1人被双开

齐鲁壹点
2026-04-14 15:58:13
穷人就算赚个三五百万,本质上还是穷人。

穷人就算赚个三五百万,本质上还是穷人。

流苏晚晴
2026-04-06 17:04:22
特朗普真是什么都敢发啊

特朗普真是什么都敢发啊

牛弹琴
2026-04-14 07:56:49
赖清德宣布窜访,对冲郑丽文访陆,不到24小时,就被现实狠狠打脸

赖清德宣布窜访,对冲郑丽文访陆,不到24小时,就被现实狠狠打脸

叮当当科技
2026-04-14 10:56:57
现役巨星一阵次数:威少2,库里4,约基奇5,杜兰特也才6次

现役巨星一阵次数:威少2,库里4,约基奇5,杜兰特也才6次

大西体育
2026-04-11 19:17:53
乌干达总司令向土耳其通牒:10亿美金加美女,不给就开战

乌干达总司令向土耳其通牒:10亿美金加美女,不给就开战

南风不及你温柔
2026-04-14 09:16:06
靠“汉芯一号”骗取11亿研究经费,后逃到美国的陈进,结局如何?

靠“汉芯一号”骗取11亿研究经费,后逃到美国的陈进,结局如何?

阿凫爱吐槽
2026-04-14 02:01:01
骑士躺赢了,季后赛对手核心大将受伤,他们晋级半决赛板上钉钉

骑士躺赢了,季后赛对手核心大将受伤,他们晋级半决赛板上钉钉

野渡舟山人
2026-04-14 13:59:59
1-2!英超排名一夜大变!红魔主场45年首败,利兹联排第15名

1-2!英超排名一夜大变!红魔主场45年首败,利兹联排第15名

薇说体育
2026-04-14 17:01:04
谁在幕后,要警惕

谁在幕后,要警惕

求实处
2026-04-12 18:59:39
3客场+德比 辽宁铁人迎大考 放申花全力战大连?李金羽别乱换人

3客场+德比 辽宁铁人迎大考 放申花全力战大连?李金羽别乱换人

替补席看球
2026-04-14 11:44:34
欧尔班时代结束,匈牙利新总理浮现,对华态度已曝光

欧尔班时代结束,匈牙利新总理浮现,对华态度已曝光

清衣渡a
2026-04-14 17:47:09
老人在北京军博摸文物被制止,他却语出惊人:我背它走完的长征

老人在北京军博摸文物被制止,他却语出惊人:我背它走完的长征

史之铭
2026-04-13 15:05:49
值了!5万欧“中超梅西”已独造7球:曾表示要在中国踢到退役

值了!5万欧“中超梅西”已独造7球:曾表示要在中国踢到退役

邱泽云
2026-04-13 22:41:15
一滴水放大400万倍后,我们会看到什么?

一滴水放大400万倍后,我们会看到什么?

心中的麦田
2026-04-12 19:08:36
一生必读刘禹锡,十首千古名作!

一生必读刘禹锡,十首千古名作!

每日一首古诗词
2026-04-13 21:21:17
2026-04-14 18:36:49
量子位 incentive-icons
量子位
追踪人工智能动态
12469文章数 176448关注度
往期回顾 全部

科技要闻

离职同事"炼化"成AI?这届公司不需要活人了

头条要闻

美伊谈到80%突然崩了:会场传争论声 内塔尼亚胡打电话

头条要闻

美伊谈到80%突然崩了:会场传争论声 内塔尼亚胡打电话

体育要闻

带出中超最大黑马!他让球迷们“排队道歉”

娱乐要闻

宋祖儿刘宇宁恋情大反转 正主火速辟谣

财经要闻

许家印受审当庭表示认罪悔罪

汽车要闻

售12.99万起/续航2000km 风云T9L上市

态度原创

房产
数码
家居
公开课
军事航空

房产要闻

改善标杆,1.5w+起横扫国兴!海口楼市,打出最猛一张牌!

数码要闻

鹏钛存储:新一代PCIe Gen6CXL Gen3 SSD主控正在研发

家居要闻

现代融合 自然灵动

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗要求五个中东国家赔偿战争损失

无障碍浏览 进入关怀版