网易首页 > 网易号 > 正文 申请入驻

Karpathy点赞上下文工程被他提出伪标注方案,充分利用未标注数据

0
分享至

近日,美国弗吉尼亚大学教授沈聪和团队提出一种多示例自适应伪标注方法——MAPLE(Many-Shot Adaptive Pseudo-LabEling)。它是一种专门用于提升大语言模型在多示例学习中表现的新机制,特别适用于只有少量标注数据、但有很多未标注数据的情况。

在传统的大语言模型应用中,往往需要大量人工标注的数据,这既昂贵又耗时。研究团队的工作想解决的是:如何充分利用这些“还没标注”的数据,帮助模型更好地完成任务?为此研究团队设计了两个关键技术:

1. 伪标签样本的挑选方法:他们通过构建一个图,把已标注和未标注的数据联系起来,挑选出对任务最“有影响力”的未标注样本,并使用大语言模型给它们打上“伪标签”。这样一来,模型就能从这些有代表性的样本中学到更多。

2. 自适应示例选择策略:对于每个测试问题,他们会根据它的特点,从标注样本和伪标签样本中智能地挑选出最相关的几个示例,而不是用一套固定模板。这样能更有效地提高模型的准确性和泛化能力。

研究团队做了大量实验,证明这种方法不仅能减少对昂贵标注数据的依赖,还能在多个真实任务中表现优异。对于相关论文,审稿人认为本次研究为大语言模型在低标注场景中的应用提供了一条可行路径。

这一成果可被用于需要智能处理文本、但缺少大量人工标注数据的场景中,能够为多示例学习生成大量伪标注的数据。

举例来说:

首先,可用于客服和问答系统:很多公司有着大量的历史对话数据,但是没有标注问题类型。本次方法可以利用这些未标注数据,帮助大语言模型更好地理解和回答用户的问题,而不需要人工标注大量示例。

其次,可用于医疗、金融等专业领域的智能助手:这些领域的标注成本很高,本次方法可以使用少量专家标注数据,再加上大量的未标注案例就能构建更精准的问答系统或摘要系统。

再次,可用于教育类场景:比如自动生成讲解或习题反馈。很多题目或学生回答是未标注的,而本次方法可以帮助模型学会更好地给出解释,进而达到辅助教学的作用。

最后,可用于低资源语言或小语种的AI 应用场景:对于缺乏标注数据的语言,可以通过伪标签机制挖掘未标注资源,加速这些语言的 AI 系统落地。

总的来说,这项成果可以帮助大语言模型在数据不足的实际环境中“用少量带动多数”,更高效地发挥作用,让AI 走进更多行业、更多场景。

据了解,上下文学习(ICL,In-context Learning)是让模型通过提示中的几个例子学会如何完成任务,而不需要重新训练它。随着大语言模型的更新换代,新的模型可以接受更长的文本输入,这为上下文学习提供了新的机遇。Google 的研究人员在 2024 年的论文中提到通过增加提示中例子的数量可以提升上下文学习的性能,并将其称之为多示例上下文学习(Many-shot ICL)。

本次研究团队注意到,为了充分发挥多示例上下文学习在给定任务上的潜力,往往需要一个包含大量属于该任务带标注样本的数据集,而标注大量数据所需的成本有限制了获取这样的数据集的难度,特别是在一些新领域或者较难的任务下。基于以上原因,研究团队进行了这次研究。他们希望充分利用大语言模型的能力来获得伪标注数据,从而用于多示例上下文学习。特别地,研究团队考虑了这样一个问题:在拥有少量标注数据的情况下,如何选择未标注的数据进行伪标注,从而让伪标注数据和少量真实标注的数据可以为一起多示例上下文学习提供高质量的例子。

与此同时,在本次研究之中,研究团队还解决了以下两个问题:

第一个是关于模型稳定性的问题。最初研究团队的设想非常理想化:希望只用一些未标注的数据(只提供问题),再加上一小部分标注数据,直接作为多示例输入给大语言模型进行学习。这样的方法从资源角度看是最节省的,他们也觉得这才是“最纯粹”的方式。但是,实验做下来却发现效果非常不稳定,有时候能提升,有时候反而拖后腿。为此,沈聪和学生们试了很策略但都无法根本解决这个问题。后来,他们做了一个艰难的决定——“退而求其次”转向使用伪标注的方式来辅助选样。虽然不如原先设想得那么“优雅”,但是确实让模型的性能提升变得更加可控、更加稳定。“这也让我的学生们第一次意识到,为了解决实际的问题,理想化的思路和实际限制之间经常要做权衡和取舍。”沈聪表示。

第二个是研究团队找到最终选样方法的灵感来源。其实他们一直在寻找一个既高效又有效的方法来从未标注数据中选出“关键样本”。有一次在组内讨论时,突然有学生聊到他之前曾推导过一些图结构中影响力相关的理论,但因为当时项目方向不同,这一部分一直没用上。研究团队研究了他的推导记录,发现这些思想其实可以完美应用在这一问题中——只要做一些针对性的调整。于是学生们修改推导、搭建实验,没想到真的跑出来了不错的结果。

这两个经历一个是现实妥协下的选择,一个是偶然中的“灵光一闪”,但它们都让沈聪的学生们对于科研有了更多敬畏和更多热爱。

最终,相关论文以《MAPLE:多轮自适应伪标记上下文学习》(MAPLE:Many-Shot Adaptive Pseudo-Labeling In-Context Learning)为题发在第 42 届国际机器学习大会(ICML,International Conference on Machine Learning)上 [1]。

后续:

第一,研究团队希望进一步提升伪标签的质量和鲁棒性。虽然现在的方法已经能选出对于模型推理有帮助的未标注样本并进行伪标注,但仍然存在一些误标或不稳定的情况。特别是他们观察到在一些任务上使用更多伪标注的数据会导致性能的下降,其认为这可能是伪标注的标签引入的噪声所导致的。接下来他们会探索是否可以引入不确定性估计、集成模型,或者借助大语言模型自身的反馈机制,来判断哪些伪标签更可信,从而提升整体效果。

第二,研究团队想把这套机制拓展到跨任务或跨领域的场景中。现实中很多任务来自不同的数据分布,比如金融、医疗、教育等,如能使用一个任务中少量的标注,配合另一个任务的未标注数据,仍然能够实现有效的多示例学习,就会极大提升大语言模型的实际适应能力,而这也涉及到如何在任务之间迁移影响力建图策略和示例选择策略。

参考资料:

1.https://arxiv.org/abs/2505.16225

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
华为Mate 90首发!鸿蒙7已在路上:打破垄断 和安卓iOS三分天下

华为Mate 90首发!鸿蒙7已在路上:打破垄断 和安卓iOS三分天下

快科技
2026-03-25 16:07:00
中东大战,真正让特朗普害怕的是:中国的已读不回!

中东大战,真正让特朗普害怕的是:中国的已读不回!

似水流年忘我
2026-03-26 02:13:59
四川井研一公交车身标语引争议 官方:系个人自费5000元投放的广告,已整改清除

四川井研一公交车身标语引争议 官方:系个人自费5000元投放的广告,已整改清除

红星新闻
2026-03-25 20:09:43
成都“牵手门”事件女主现今状况曝光,太惨了......

成都“牵手门”事件女主现今状况曝光,太惨了......

许三岁
2026-03-17 07:34:05
自作自受!欧尔班硬刚欧盟阻援乌,160亿欧元信贷被直接冻结

自作自受!欧尔班硬刚欧盟阻援乌,160亿欧元信贷被直接冻结

老马拉车莫少装
2026-03-26 10:24:28
森林狼逆火箭:申京努力了,然而杜兰特啊

森林狼逆火箭:申京努力了,然而杜兰特啊

张佳玮写字的地方
2026-03-26 13:03:18
14.99万!“史上最便宜”特斯拉来了

14.99万!“史上最便宜”特斯拉来了

首席品牌观察
2026-03-24 16:18:39
国防部:菲方侵权挑衅只会遭到更加坚决应对

国防部:菲方侵权挑衅只会遭到更加坚决应对

界面新闻
2026-03-26 16:00:27
发生了什么?午后,沪指再度失守3900点

发生了什么?午后,沪指再度失守3900点

每经牛眼
2026-03-26 15:25:31
FIFA系列赛新规:比赛需决出胜负 打平将互射点球

FIFA系列赛新规:比赛需决出胜负 打平将互射点球

体坛周报
2026-03-26 15:53:18
这4种鱼,可能含有甲醛和重金属,建议:还是少吃比较好!

这4种鱼,可能含有甲醛和重金属,建议:还是少吃比较好!

阿龙美食记
2026-03-24 21:52:23
美以军事打击已致伊朗243名师生丧生

美以军事打击已致伊朗243名师生丧生

新京报
2026-03-25 15:05:13
美军首批阵亡遗体送回,遗体箱拥挤堆放,高层的着装与规定相悖

美军首批阵亡遗体送回,遗体箱拥挤堆放,高层的着装与规定相悖

知识TNT
2026-03-25 12:14:18
老师穿短裙蕾丝袜上课,学生连头都不敢抬!老师穿衣底线到底在哪

老师穿短裙蕾丝袜上课,学生连头都不敢抬!老师穿衣底线到底在哪

小羽叨叨叨
2026-03-26 13:24:34
怀孕传闻真相大白后,翁帆突传“喜讯”,杨振宁终于可以放心了!

怀孕传闻真相大白后,翁帆突传“喜讯”,杨振宁终于可以放心了!

丁丁鲤史纪
2026-03-25 16:35:13
中东突发!刚刚,直线拉升

中东突发!刚刚,直线拉升

中国基金报
2026-03-26 12:35:21
初代丑男何润东的突然爆火,狠狠抽了内娱一巴掌

初代丑男何润东的突然爆火,狠狠抽了内娱一巴掌

娱乐圈笔娱君
2026-03-24 16:08:36
重返广东!李春江有了新工作,亮相篮球场,岗位曝光,杜锋期待

重返广东!李春江有了新工作,亮相篮球场,岗位曝光,杜锋期待

萌兰聊个球
2026-03-26 13:02:53
老板娘的丝袜都破了,我要不要告诉她买一双?

老板娘的丝袜都破了,我要不要告诉她买一双?

太急张三疯
2026-03-26 12:50:15
东契奇43分7助攻湖人战胜步行者,勒布朗23分9板9助里夫斯25分

东契奇43分7助攻湖人战胜步行者,勒布朗23分9板9助里夫斯25分

湖人崛起
2026-03-26 09:32:48
2026-03-26 17:08:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16488文章数 514797关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

国防部:日本侵略过所有周边国家 至今都没有真正反省

头条要闻

国防部:日本侵略过所有周边国家 至今都没有真正反省

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

长护险谁能享受?享受多少?解答来了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

健康
亲子
本地
时尚
艺术

转头就晕的耳石症,能开车上班吗?

亲子要闻

妈妈是时尚小达人爸爸是朴素老模范!我要当爸爸的专属赞助人

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

皮衣+裙,高级到炸

艺术要闻

哪一座桥不是风景?

无障碍浏览 进入关怀版