网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

清华微软开源全新提示词压缩工具，长度骤降80%！GitHub怒砍3.1K星

2024-03-25 14:16:40　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：润好困

【新智元导读】最近，清华和微软的研究人员提出了一种全新的方法，能在保证输出质量不变的前提下，将提示词压缩到原始长度的20%！

在自然语言处理中，有很多信息其实是重复的。

如果能将提示词进行有效地压缩，某种程度上也相当于扩大了模型支持上下文的长度。

现有的信息熵方法是通过删除某些词或短语来减少这种冗余。

然而，作为依据的信息熵仅仅考虑了文本的单向上下文，进而可能会遗漏对于压缩至关重要的信息；此外，信息熵的计算方式与压缩提示词的真正目的并不完全一致。

为了应对这些挑战，来自清华和微软的研究人员提出了一种全新的数据精炼流程——LLMLingua-2，目的是从大型语言模型（LLM）中提取知识，实现在不丢失关键信息的前提下对提示词进行压缩。

项目在GitHub上已经斩获3.1k星

结果显示，LLMLingua-2可以将文本长度大幅缩减至最初的20%，有效减少了处理时间和成本。

此外，与前一版本LLMLingua以及其他类似技术相比，LLMLingua 2的处理速度提高了3到6倍。

论文地址：https://arxiv.org/abs/2403.12968

在这个过程中，原始文本首先被输入模型。

模型会评估每个词的重要性，决定是保留还是删除，同时也会考虑到词语之间的关系。

最终，模型会选择那些评分最高的词汇组成一个更简短的提示词。

团队在包括MeetingBank、LongBench、ZeroScrolls、GSM8K和BBH在内的多个数据集上测试了LLMLingua-2模型。

尽管这个模型体积不大，但它在基准测试中取得了显著的性能提升，并且证明了其在不同的大语言模型（从GPT-3.5到Mistral-7B）和语种（从英语到中文）上具有出色的泛化能力。

系统提示：

作为一名杰出的语言学家，你擅长将较长的文段压缩成简短的表达方式，方法是去除那些不重要的词汇，同时尽可能多地保留信息。

用户提示：

请将给定的文本压缩成简短的表达形式，使得你（GPT-4）能够尽可能准确地还原原文。不同于常规的文本压缩，我需要你遵循以下五个条件： 1. 只移除那些不重要的词汇。 2. 保持原始词汇的顺序不变。 3. 保持原始词汇不变。 4. 不使用任何缩写或表情符号。 5. 不添加任何新的词汇或符号。请尽可能地压缩原文，同时保留尽可能多的信息。如果你明白了，请对以下文本进行压缩：{待压缩文本} 压缩后的文本是：[...]

结果显示，在问答、摘要撰写和逻辑推理等多种语言任务中，LLMLingua-2都显著优于原有的LLMLingua模型和其他选择性上下文策略。

值得一提的是，这种压缩方法对于不同的大语言模型（从GPT-3.5到Mistral-7B）和不同的语言（从英语到中文）同样有效。

而且，只需两行代码，就可以实现LLMLingua-2的部署。

目前，该模型已经被集成到了广泛使用的RAG框架LangChain和LlamaIndex当中。

实现方法

为了克服现有基于信息熵的文本压缩方法所面临的问题，LLMLingua-2采取了一种创新的数据提炼策略。

这一策略通过从GPT-4这样的大语言模型中抽取精华信息，实现了在不损失关键内容和避免添加错误信息的前提下，对文本进行高效压缩。

提示设计

要想充分利用GPT-4的文本压缩潜力，关键在于如何设定精确的压缩指令。

也就是在压缩文本时，指导GPT-4仅移除那些在原始文本中不那么重要的词汇，同时避免在此过程中引入任何新的词汇。

这样做的目的是为了确保压缩后的文本尽可能地保持原文的真实性和完整性。

标注与筛选

研究人员利用了从GPT-4等大语言模型中提炼出的知识，开发了一种新颖的数据标注算法。

这个算法能够对原文中的每一个词汇进行标注，明确指出在压缩过程中哪些词汇是必须保留的。

为了保证所构建数据集的高质量，他们还设计了两种质量监控机制，专门用来识别并排除那些品质不佳的数据样本。

压缩器

最后，研究人员将文本压缩的问题转化为了一个对每个词汇（Token）进行分类的任务，并采用了强大的Transformer作为特征提取器。

这个工具能够理解文本的前后关系，从而精确地抓取对于文本压缩至关重要的信息。

通过在精心构建的数据集上进行训练，研究人员的模型能够根据每个词汇的重要性，计算出一个概率值来决定这个词汇是应该被保留在最终的压缩文本中，还是应该被舍弃。

性能评估

研究人员在一系列任务上测试了LLMLingua-2的性能，这些任务包括上下文学习、文本摘要、对话生成、多文档和单文档问答、代码生成以及合成任务，既包括了域内的数据集也包括了域外的数据集。

测试结果显示，研究人员的方法在保持高性能的同时，减少了最小的性能损失，并且在任务不特定的文本压缩方法中表现突出。

- 域内测试（MeetingBank）

研究人员将LLMLingua-2在MeetingBank测试集上的表现与其他强大的基线方法进行了对比。

尽管他们的模型规模远小于基线中使用的LLaMa-2-7B，但在问答和文本摘要任务上，研究人员的方法不仅大幅提升了性能，而且与原始文本提示的表现相差无几。

- 域外测试（LongBench、GSM8K和BBH）

考虑到研究人员的模型仅在MeetingBank的会议记录数据上进行了训练，研究人员进一步探索了其在长文本、逻辑推理和上下文学习等不同场景下的泛化能力。

值得一提的是，尽管LLMLingua-2只在一个数据集上训练，但在域外的测试中，它的表现不仅与当前最先进的任务不特定压缩方法相媲美，甚至在某些情况下还有过之而无不及。

即使是研究人员的较小模型（BERT-base大小），也能达到与原始提示相当的性能，在某些情况下甚至略高于原始提示。

虽然研究人员的方法取得了可喜的成果，但与其他任务感知压缩方法（如Longbench上的LongLLMlingua）相比，研究人员的方法还存在不足。

研究人员将这种性能差距归因于它们从问题中获取的额外信息。不过，研究人员的模型具有与任务无关的特点，因此在不同场景中部署时，它是一种具有良好通用性的高效选择。

上表4列出了使用Mistral-7Bv0.1 4作为目标LLM的不同方法的结果。

与其他基线方法相比，研究人员的方法在性能上有明显的提升，展示了其在目标LLM上良好的泛化能力。

值得注意的是，LLMLingua-2的性能甚至优于原始提示。

研究人员推测，Mistral-7B在管理长上下文方面的能力可能不如GPT-3.5-Turbo。

研究人员的方法通过提供信息密度更高的短提示，有效提高了 Mistral7B 的最终推理性能。

上表5显示了不同系统在不同压缩比的V100-32G GPU上的延迟。

结果表明，与其他压缩方法相比，LLMLingua2的计算开销要小得多，可以实现1.6倍到2.9倍的端到端速度提升。

此外，研究人员的方法还能将GPU内存成本降低8倍，从而降低对硬件资源的需求。

上下文意识观察研究人员观察到，随着压缩率的增加，LLMLingua-2可以有效地保持与完整上下文相关的信息量最大的单词。

这要归功于双向上下文感知特征提取器的采用，以及明确朝着及时压缩目标进行优化的策略。

研究人员观察到，随着压缩率的增加，LLMLingua-2可以有效地保持与完整上下文相关的信息量最大的单词。

这要归功于双向上下文感知特征提取器的采用，以及明确朝着及时压缩目标进行优化的策略。

最后研究人员让GPT-4 从 LLMLingua-2压缩提示中重构原始提示音。

结果表明，GPT-4可以有效地重建原始提示，这表明在LLMLingua-2压缩过程中并没有丢失基本信息。

参考资料：

https://llmlingua.com/llmlingua2.html

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

微软打破Decoder-Only架构！大幅降低GPU内存需求

量子位 2024-05-13 13:27:00
3 跟贴 3
比LoRA还快50%！一张3090超越全参调优，UIUC联合LMFlow提出LISA

机器之心Pro 2024-04-01 15:29:05
0 跟贴 0

大语言模型权重、激活的全方位低bit可微量化，已集成进商用APP

机器之心Pro 2024-03-07 16:00:01
0 跟贴 0

长文本杀不死RAG:SQL+向量驱动大模型和大数据新范式,MyScale开源

机器之心Pro 2024-04-11 14:33:11
0 跟贴 0
Mac专属大模型框架来了！两行代码部署，能聊本地数据，支持中文

量子位 2024-03-04 16:53:32
0 跟贴 0

用检索增强生成让大模型更强大，这里有个手把手的Python实现

机器之心Pro 2023-11-21 10:35:14
1 跟贴 1

比「让我们一步一步思考」这句咒语还管用，提示工程正在被改进

机器之心Pro 2023-11-28 10:55:51
0 跟贴 0
GPT搜索原型曝光！新模型GPT4-Lite驱动，鸽了发布会但代码已上传

量子位 2024-05-13 12:50:58
1 跟贴 1

TikTok化身“正义判官”

虎嗅APP 2024-05-12 19:54:07
5 跟贴 5
零一万物千亿参数模型Yi-Large发布，新MoE模型对打GPT-5

智东西 2024-05-13 13:44:19
0 跟贴 0
掘金2-2森林狼进天王山约基奇35+7+7华子44分

网易体育 2024-05-13 10:30:03
12748 跟贴 12748
1万亿超长期特别国债本周开始发行期限最长50年

第一财经资讯 2024-05-13 12:15:12
45002 跟贴 45002
Mamba架构第一次做大！混合Transformer，打败Transformer

量子位 2024-03-29 15:47:47
1 跟贴 1
巨头雄霸天下，微软、谷歌、Meta、亚马逊能一直无敌吗？

钛媒体APP 2024-01-13 11:35:24
0 跟贴 0
中汽协回应特斯拉通过数据安全测试

界面新闻 2024-05-13 11:38:04
17822 跟贴 17822
曾经卖7000元的顶配商务本，现在成了闲鱼上最火的洋垃圾

雷科技 2023-12-20 17:03:55
730 跟贴 730
“离谱的AI扩图”火了！张张那叫一个出其不意

量子位 2023-12-05 13:17:05
347 跟贴 347
新一代注意力机制Lightning Attention-2：无限序列长度

机器之心Pro 2024-01-18 14:41:20
0 跟贴 0
抖音官宣，禁止发布这些内容！

果粉俱乐部 2024-05-13 12:08:53
4275 跟贴 4275
可以互相交谈的人工智能来了

钛媒体APP 2024-04-14 16:22:14
0 跟贴 0
Xbox关闭工作室并非微软财务困难:游戏部门进展不顺

游民星空 2024-05-11 17:07:24
6 跟贴 6
创新者因计算而相遇，《麻省理工科技评论》中国正式发布“2023年中国智能计算创新人物”

DeepTech深科技 2024-04-26 15:48:38
0 跟贴 0
涨价既不能推高通胀，也无法增加收入，是一步臭棋

子业一说财经 2024-05-13 09:37:26
4988 跟贴 4988
Xbox移动端商店将与今年夏季上线推动跨平台

3DMGAME官方号 2024-05-11 09:02:39
2 跟贴 2
比亚迪回应漏电脑出血事件：我们只看到了他想让你们看到的一面

映射生活的身影 2024-05-13 19:59:04
2596 跟贴 2596
震惊！原来1999年，燃气公司就发明了偷气的技术，结果东窗事发！

世态言凉 2024-05-10 17:43:24
2195 跟贴 2195
被称神！《最终幻想3》程序员太传奇代码无人能复刻

游民星空 2024-05-11 11:06:30
24 跟贴 24
贵州一景点门票9999元，景区：科考价值高，每年只允许200人入洞

上游新闻 2024-05-11 19:51:53
9812 跟贴 9812
母亲执意生下带病“天生坏种”，14岁少年暴戾行径，让人胆寒

前沿科技学习分享圈 2024-05-11 21:57:46
0 跟贴 0
针头导管断在婴儿血管5年医院借近20万给家长带娃治病

上游新闻 2024-05-13 11:26:46
1185 跟贴 1185
OpenAI抓内鬼出奇招，奥特曼耍所有人：GPT搜索鸽了！改升级GPT-4

量子位 2024-05-11 21:35:06
0 跟贴 0
多地政务大厅拒收现金记者实地调查

央广网 2024-05-13 10:20:11
8745 跟贴 8745
用户称“一觉醒来突然收到滴滴天价订单”，滴滴致歉

界面新闻 2024-05-12 21:04:31
2612 跟贴 2612
张维为坚定认为：中国的4亿中产阶层到美国去，也会是中产阶层，且会更富裕！

可达鸭面面观 2024-05-13 21:18:41
3805 跟贴 3805
全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

机器之心Pro 2024-01-25 15:59:20
0 跟贴 0
人一旦开窍，所有事都有规律

互联网思维 2024-03-21 00:26:50
117 跟贴 117
看完这份通报，才真的让我害怕

顾礼先生 2024-05-13 16:39:42
5524 跟贴 5524
这台新机一发布，全世界垃圾佬都得疯

雷科技 2024-01-25 21:32:36
232 跟贴 232
软件公司老板找了俩大龄程序员，一个46、一个43，直呼捡到宝了！

程序员古耕 2024-05-13 20:36:47
9 跟贴 9
太好笑了！老鹰状元签拿下布朗尼？整个NBA都在开绿灯

篮球实战宝典 2024-05-13 22:03:03
188 跟贴 188

云南碰瓷式执法后续，涉事人员身份曝光，网民：奖他一个“鸡腿”

云南碰瓷式执法后续，涉事人员身份曝光，网民：奖他一个“鸡腿”

陈博世财经

2024-05-12 20:21:39

vivo X100 Ultra已正式发布：对比vivo X90 Pro+，到底有多大区别

vivo X100 Ultra已正式发布：对比vivo X90 Pro+，到底有多大区别

智能手机那点事

2024-05-13 23:15:34

新疆喀什开往成都的快速列车，行程近4000公里

新疆喀什开往成都的快速列车，行程近4000公里

鬼菜生活

2024-05-13 15:48:09

全面停止生产！深圳正威集团被处罚4万，拖欠员工薪资超900万

全面停止生产！深圳正威集团被处罚4万，拖欠员工薪资超900万

叮当当科技

2024-05-13 16:07:47

“泰国租妻”特色服务，5天才3000元，我去体验后，却差点丢了命

“泰国租妻”特色服务，5天才3000元，我去体验后，却差点丢了命

程哥历史观

2023-09-07 20:53:23

嫩妇自述：和老公分居后，我每天去健身房练臀，却被私教给盯上了

嫩妇自述：和老公分居后，我每天去健身房练臀，却被私教给盯上了

想养大熊猫

2024-05-08 10:04:15

离谱了！四川1岁娃太笨，母亲节被父亲拉去做亲子鉴定评论区炸锅

离谱了！四川1岁娃太笨，母亲节被父亲拉去做亲子鉴定评论区炸锅

阿燕姐说育儿

2024-05-13 15:38:02

枢密院十号：面对中国导弹，美军陷入两难处境

枢密院十号：面对中国导弹，美军陷入两难处境

环球网资讯

2024-05-13 05:47:16

印度马上要超过美国，建成全球第二大地铁系统？

印度马上要超过美国，建成全球第二大地铁系统？

蓝鲸财经

2024-05-13 15:10:33

大瓜！律师检方上门警告大S无权阻止汪小菲见孩子，大S疑认怂

大瓜！律师检方上门警告大S无权阻止汪小菲见孩子，大S疑认怂

小徐讲八卦

2024-05-11 10:46:13

好消息！热身赛中国3:1巴西！张常宁表现勇猛砍最高分！巴黎有戏

好消息！热身赛中国3:1巴西！张常宁表现勇猛砍最高分！巴黎有戏

金毛爱女排

2024-05-13 08:37:04

电动汽车价格战逐渐失效，燃油车显著回升，姜还是老的辣！

电动汽车价格战逐渐失效，燃油车显著回升，姜还是老的辣！

柏铭锐谈

2024-05-12 14:27:27

中国最丢脸的十大入侵物种

普陀动物世界

2024-04-12 08:00:03

亿万富豪父子“股权争夺战”：从住窑洞到家产数亿，八旬父亲为拿回股权起诉长子

亿万富豪父子“股权争夺战”：从住窑洞到家产数亿，八旬父亲为拿回股权起诉长子

红星新闻

2024-03-23 16:26:52

卖不掉就丢给中国？这3款车型在国外已停产，却被国人当“豪车”

卖不掉就丢给中国？这3款车型在国外已停产，却被国人当“豪车”

户外小阿隋

2024-05-11 07:50:07

泰国男足提前做出重要决定！看懵国足，让伊万科维奇干着急

泰国男足提前做出重要决定！看懵国足，让伊万科维奇干着急

评球论事

2024-05-13 12:12:05

乌军击退俄军对哈尔科夫的狂攻！开辟第二战场？

乌军击退俄军对哈尔科夫的狂攻！开辟第二战场？

项鹏飞

2024-05-12 21:11:48

楼市正迎来历史转变？王石再次预测2024年房地产走向，大概率对的

楼市正迎来历史转变？王石再次预测2024年房地产走向，大概率对的

山丘楼评

2024-05-10 11:29:37

张成泽被清洗的真相：婚外情，给最高80后戴绿帽，9名情妇殉葬

张成泽被清洗的真相：婚外情，给最高80后戴绿帽，9名情妇殉葬

飞云如水

2024-04-18 14:00:23

湖南一中学不让学生家长送饭？学校：家长可以送，不允许校外小食堂进入

湖南一中学不让学生家长送饭？学校：家长可以送，不允许校外小食堂进入

极目新闻

2024-05-13 16:12:01

AI产业主平台领航智能+时代

11026文章数 65495关注度

往期回顾全部

科技要闻

李开复：大模型创业狂奔一年中美差距缩小

头条要闻

俄军称继续发动攻势乌军哈尔科夫前线指挥官被撤换

头条要闻

俄军称继续发动攻势乌军哈尔科夫前线指挥官被撤换

体育要闻

曼联的越位陷阱里，有只胖虎在溜达

娱乐要闻

湖南卫视回应韩红请战，文案堪称一绝

财经要闻

放开买房租房落户超大特大城市绷不住了

汽车要闻

纯电增程并行长安马自达EZ-6实车曝光

态度原创

游戏

艺术

房产

亲子

数码

毛皇AK Happy队，Lyn队问鼎古树杯！

艺术要闻

新绎美术馆价值体系1+1=3？张子康激活“梦廊坊”社会化艺术生态

房产要闻

最新，海口丁村城市更新又有大动作！

亲子要闻

网友怀孕生了一个小宝宝，带给闺蜜炫耀自己的孩子

数码要闻

华硕 ROG Tessen 御风手机游戏手柄正式发布：可折叠、RGB 灯效

© 1997-2024 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 广告服务 | 不良信息举报 Complaint Center | 廉正举报

无障碍浏览进入关怀版