网易首页 > 网易号 > 正文 申请入驻

COLING 2022 | MetaPrompting:基于元学习的soft prompt初始化方法

0
分享至

论文名称: MetaPrompting: Learning to Learn Better Prompts 论文链接: https://aclanthology.org/2022.coling-1.287/

一、 简介

Prompt通过将输入文本填入预设prompt模板的方式,将下游NLP任务形式与语言模型预训练任务统一起来,来更好地利用预训练阶段学习到的知识,使模型更容易适应于下游任务,在一系列NLP任务上取得了很好的效果[1]。Soft prompt方法使用可学习的参数来替代prompt模板中固定的token,尽管在少标注文本分类任务上性能优异[2],但是其表现随模型初始化参数不同会出现很大的波动[1, 3]。人工选择soft prompt模型参数需要对语言模型内部工作机理的深入理解和大量试错,并且在遇到不同少标注任务时难以复用。

图1 MetaPrompting帮助模型找到一个更优参数初始化点,以更快、更好地适应于新的少标注任务

为了解决上述问题,本文将目光从任务专用的soft prompt模型设计转移到任务通用的模型参数初始化点搜索,以帮助模型快速适应到不同的少标注任务上。本文采用近年提出的基于优化的元学习方法,例如MAML[4]、Reptile[5]等,来搜索更优的soft prompt模型参数初始化点,以解决模型对初始化点过于敏感的问题。

本文在四个常用的少标注文本分类数据集上进行了充分的实验,结果表明MetaPrompting相比其他基于元学习和prompt方法的强基线模型取得了更好的效果,达到了新的SOTA。

二、方法

2.1 Soft prompt方法

Prompt方法通过将下游任务转化成语言模型预训练目标的形式,帮助模型更好地在下游任务上发挥性能。如图2所示,对于一个新闻文本分类任务,可以通过将输入文本填入prompt模板的方式,将该文本分类任务转化为MLM任务形式。之后将模型在[MASK]位置填入各个词语的概率映射到不同标签上,即可完成文本分类任务的处理。

Soft prompt模型中,部分prompt tokens以可训练embedding的形式给出,并可以和预训练模型的参数一起进行优化,在保留离散token中语义信息的同时,给予模型更多的灵活性。

图2 Soft prompt方法2.2 将基于优化的元学习方法应用于soft prompt模型少标注任务构建

本文使用元阶段(episode)风格的少标注学习范式。具体而言,每一个少标注任,包含支持集和查询集两个部分,支持集中每个类别所对应标注样本数量极少,本文通过将模型在支持集上进行适配,在查询集上进行测试的方法,衡量模型的少标注学习性能。本文将不同标签对应的样本分别划分成用于训练、验证和测试的少标注任务,以衡量模型从源领域学习通用元知识来处理目标领域少标注任务的能力。

基于元学习的soft prompt模型优化过程

MetaPrompting的整体优化过程如图3所示。元训练阶段,模型在少标注任务的支持集上进行试探性参数更新,并在查询集上进行梯度回传。元测试阶段,模型在未见过的少标注任务上进行适配和预测。令θ 和 ϕ 分别表示预训练模型和soft prompt的参数,在元训练阶段,模型在一个少标注任务支持集上进行适配的过程如下式所示:

其中是适配过程的学习率,表示模型进行适配学习的步数。令模型在少标注任务上 适配学习之后的参数为 和 ,可将模型在该少标注任务上的优化目标描述为:

该优化目标模拟了模型在少标注场景下进行试探性参数更新,并根据试探性更新之后的情况优化模型参数的策略。这种策略更多关注了模型在一步或多步更新之后的情况,因而可以帮助模型找到一个能快速适应于新的少标注任务的参数初始化点。

图3 MetaPrompting模型参数更新过程

实验中,本文还使用了MAML++[6]中的多步梯度回传技巧,来使得优化过程更加稳定,达到更好的效果。


三、实验

本文分别采用5way 1shot5way 5shot的少标注学习设定来测试模型性能。实验选择了HuffPost、Amazon、Reuters和20newsgroup四个广泛使用的文本分类数据集,结果以分类准确率%给出。

实验结果如表1所示,表中20newsgroup数据集性能由于数据构造问题与原文略有出入,现为勘误后结果,勘误不影响实验结论。由实验结果可见,MetaPrompting性能优于当前的SOTA模型ContrastNet[7]和其他基于元学习和提示学习的方法,取得了明显的性能提升。相比于不使用元学习优化目标的Ours (Pretrain Init),引入元学习搜索模型参数初始化点的Ours (Meta Init)也得到了更好的性能,说明了元学习方法在soft prompt模型参数优化中的有效性。

表1 MetaPrompting主实验结果

主实验中,为了与其他基线模型进行公平的对比,将soft prompt参数和预训练模型参数一起进行了优化。为了更好地说明MetaPrompting针对soft prompt参数初始化的作用,本文还参数进行了固定预训练模型的实验。实验结果如表2所示,相比于参数随机初始化的soft prompt模型,MetaPrompting取得了明显的性能提升。

表2 MetaPrompting在固定预训练模型参数时的性能

现实应用场景中,往往难以得到内容、形式十分相近的源领域数据。因此本文还对MetaPrompting在分布外数据上的性能进行了测试。实验结果如表3所示,即使源领域的数据内容、形式上有较大的差异,MetaPrompting仍然可以学习到任务通用的元知识,来辅助在目标领域少标注任务上的学习。

表3 MetaPrompting在不同内容、形式的源领域数据上进行元学习的性能

本文还对MetaPrompting对于不同prompt模板的鲁棒性进行了测试。如表4所示,相比于随机初始化的soft prompt模型,MetaPrompting寻找到的参数初始化点在不同prompt模板下性能方差更小,鲁棒性更强。

表4 MetaPrompting在不同prompt模板下性能的方差
四、结论

本文提出了MetaPrompting,将基于优化的元学习方法推广到soft prompt模型中,来处理少标注文本任务。MetaPrompting利用源领域数据进行元学习,搜索能够更快、更好地适应于新的少标注人物的模型参数初始化点。在4个少标注文本分类数据集上的实验结果表明,MetaPrompting相比于朴素的soft prompt模型以及其他基于元学习的基线模型取得了更好的效果,达到了新的SOTA性能。

参考文献

1. Pengfei Liu, Weizhe Yuan, Jinlan Fu, Zhengbao Jiang, Hiroaki Hayashi, and Graham Neubig. Pre-train, prompt, and predict: A systematic survey of prompting methods in natural language processing. arXiv preprint arXiv:2107.13586.

2. Xiao Liu, Yanan Zheng, Zhengxiao Du, Ming Ding, Yujie Qian, Zhilin Yang, and Jie Tang. 2021c. Gpt understands, too. arXiv preprint arXiv:2103.10385.

3. Xiang Lisa Li and Percy Liang. 2021. Prefix-tuning: Optimizing continuous prompts for generation. In Proc. of ACL-IJCNLP, pages 4582–4597.

4. Model-agnostic meta-learning for fast adaptation of deep networks. In Proc. of ICML, pages 1126–1135.

5. Alex Nichol, Joshua Achiam, and John Schulman. 2018. On first-order meta-learning algorithms. arXiv preprint arXiv:1803.02999.

6. Antreas Antoniou, Harri Edwards, and Amos Storkey. 2019. How to train your maml. In Proc. of ICLR.

7. Junfan Chen, Richong Zhang, Yongyi Mao, and Jie Xue. 2022. Contrastnet: A contrastive learning framework for few-shot text classification. In Proc. of AAAI.


作者:哈工大SCIR 来源: 公众 号【赛尔实验室】

Illustration by Manypixels Gallery from IconScout

-TheEnd-

扫码观看!

本周上新!

多家技术企业招聘来啦!

多家技术企业招聘来啦!有求必应的小将收集到来自TechBeat技术社群内技术企业的招人需求,包含来自科技大厂微软亚研、腾讯、小红书等企业,科技明星公司始途科技、梅卡曼德等企业的算法工程师等正式及实习岗位,欢迎有需求的大家向这些公司投递简历哦!

扫描了解详情~

关于我“

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务将门技术社群以及将门创投基金

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

⤵一键送你进入TechBeat快乐星球

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
飙涨近4%!港股硬科技再创上市新高

飙涨近4%!港股硬科技再创上市新高

每日经济新闻
2026-05-25 10:36:39
1983年,红卫兵头子被判刑,晚年沦落到捡菜叶子充饥,活到2019年

1983年,红卫兵头子被判刑,晚年沦落到捡菜叶子充饥,活到2019年

米果说识
2024-09-12 04:20:03
普京回国后,拉夫罗夫给了一句忠告:美国对华“包围圈”即将合拢

普京回国后,拉夫罗夫给了一句忠告:美国对华“包围圈”即将合拢

阿讯说天下
2026-05-25 13:17:23
金溥聪记者会晒出马英九委托书,称萧王频繁赴陆引马英九不满!

金溥聪记者会晒出马英九委托书,称萧王频繁赴陆引马英九不满!

琴音缭绕回
2026-05-25 14:23:02
网红殷世航爆料好兄弟童锦程一个月三四百万,三年狂赚一个亿,网友:说好的吃泡面呢?

网红殷世航爆料好兄弟童锦程一个月三四百万,三年狂赚一个亿,网友:说好的吃泡面呢?

科学发掘
2026-05-25 15:09:22
A股:今日放量上涨,科技股再度爆发!不用猜了,新一轮上涨来了

A股:今日放量上涨,科技股再度爆发!不用猜了,新一轮上涨来了

云鹏叙事
2026-05-25 11:45:38
为什么比亚迪越来越像“工业怪兽”,而吉利越来越像“中国大众”

为什么比亚迪越来越像“工业怪兽”,而吉利越来越像“中国大众”

别让往昔的悲伤和对未来的恐惧
2026-05-13 16:03:22
日经225指数突破64000点,再创历史新高

日经225指数突破64000点,再创历史新高

澎湃新闻
2026-05-25 08:24:15
迈阿密主帅:梅西确实很疲劳,我们还在等医疗报告

迈阿密主帅:梅西确实很疲劳,我们还在等医疗报告

懂球帝
2026-05-25 10:55:08
匪夷所思!山西煤矿爆炸揭开行业真实一面:煤矿连手套都没发过

匪夷所思!山西煤矿爆炸揭开行业真实一面:煤矿连手套都没发过

Mr王的饭后茶
2026-05-25 10:29:49
震惊!杨梅“药泡”跨省蔓延至安徽,网友:不刮骨疗毒,没有未来

震惊!杨梅“药泡”跨省蔓延至安徽,网友:不刮骨疗毒,没有未来

火山詩话
2026-05-25 10:04:10
马办确认移送检调,金溥聪连忙改口,萧旭岑不再让了,宣布提告!

马办确认移送检调,金溥聪连忙改口,萧旭岑不再让了,宣布提告!

暮雪无痕
2026-05-25 11:04:56
第一次感受到“荔枝核的威力”,泡水里20天,长成“粉盆栽”

第一次感受到“荔枝核的威力”,泡水里20天,长成“粉盆栽”

美家指南
2026-05-15 15:27:43
马德兴:中国U19踢土伦杯是以小打大,集训时间短人员也不齐

马德兴:中国U19踢土伦杯是以小打大,集训时间短人员也不齐

懂球帝
2026-05-25 10:13:16
2300亿大牛股,封板涨停!华为宣布重大突破

2300亿大牛股,封板涨停!华为宣布重大突破

21世纪经济报道
2026-05-25 14:15:29
5月22日养老金上调通知发布了?真相和网传不一样!

5月22日养老金上调通知发布了?真相和网传不一样!

李博世财经
2026-05-24 14:13:03
入夏后,遇到这4种养心菜抓紧吃!公认的“长寿菜”,补血又消暑

入夏后,遇到这4种养心菜抓紧吃!公认的“长寿菜”,补血又消暑

花小厨
2026-05-25 15:34:31
俄罗斯突然发出警告,一大批西方武器装备,正在中国周边急速扩张

俄罗斯突然发出警告,一大批西方武器装备,正在中国周边急速扩张

无情有思可
2026-05-25 15:46:44
胜率暴跌至25%!杨楷文深陷申真谞布局陷阱,绝处逢生能否逆转?

胜率暴跌至25%!杨楷文深陷申真谞布局陷阱,绝处逢生能否逆转?

L76号
2026-05-25 12:05:34
切尔西去年1.4亿欧签下“三叉戟”,结果三人在英超共打进2球

切尔西去年1.4亿欧签下“三叉戟”,结果三人在英超共打进2球

懂球帝
2026-05-25 02:51:18
2026-05-25 16:23:03
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2387文章数 596关注度
往期回顾 全部

科技要闻

华为:没有先进光刻机也能造出高端芯片

头条要闻

学生被要求每天体育活动2小时 有学生跑300米后离世

头条要闻

学生被要求每天体育活动2小时 有学生跑300米后离世

体育要闻

如果不好好守门,他可能早就继承家业了

娱乐要闻

李晨郑恺跑男停宣:12年元老被边缘化

财经要闻

退市!33年“A股不死鸟”落幕

汽车要闻

国民家轿再上新 帝豪向上系列限时5.59万起

态度原创

健康
教育
亲子
时尚
数码

外泌体 ≠ 生长因子!它们之间究竟有何区别?

教育要闻

第07课-跟人碰面怎么打招呼更亲切?

亲子要闻

儿童牙膏标着“不能食用”,电商却暗示“可吞咽”?儿童牙膏乱象调查——

伊姐周日热推:电视剧《盛唐奇案》;电视剧《我的王室死对头》......

数码要闻

AMD或将把此前仅在中国市场售卖的Radeon RX 9070 GRE推向全球

无障碍浏览 进入关怀版