网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

你的提示词里，90%都是浪费

2026-04-28 06:12:29　来源: 算力游侠

北京举报

0

分享至

所有人都知道长提示词烧钱。几乎没人知道，哪些部分其实可以删掉。

系统消息、风格指南、少样本示例、背景上下文——每个添加时都有道理。但几百次API调用后，开销滚雪球。问"哪段能删"，诚实答案是：不测不知道。

Token Budget Negotiator把这个测试系统化。它把提示词拆成命名、分优先级的区块，运行贪婪消融循环，逐块删除并用本地或远程大模型评委按评分标准打分，直到节省达到目标且质量未跌破阈值。结果是仍保持原行为的最小提示词。

它以命令行工具、Python库、MCP服务器三种形态发布。

提示词区块的价值不等，但没有原则性方法能判断哪些对特定任务重要——除非测试。手动裁剪是猜谜。Token Budget Negotiator用经验方法回答：逐区块、逐任务、对照定义该用例质量的评分标准。

提示词定义为带命名区块的YAML文件。每个区块包含类型（系统、少样本、上下文、指令）、内容块、优先级整数。优先级决定删除顺序：低优先级先评估，高优先级后评估。

删除前，完整提示词先由评委大模型按评分标准打分，建立基线。运行质量目标为：基线分数 × 阈值。

消融循环按优先级升序遍历区块。对每个候选，构建不含该区块的测试提示词并重新打分。若分数仍达目标，永久删除该区块，用更新后的提示词继续循环。若否，保留该区块，评估下一个候选。

两个条件终止循环：

每次接受的删除都验证确实减少了Token数。循环不会产生比初始更大的提示词。

输出为NegotiationResult，包含原始与优化后的Token数、删除的区块列表、每步分数、质量保留百分比、耗时、打分调用次数、评分标准名称、完整消融日志。可写入JSON或YAML。

安装：

cd token-budget-negotiator
pip install -e .

需要Python 3.11+。本地评委路径需要Ollama且已拉取模型，已用gemma4:latest端到端验证。OpenRouter路径需要OPENROUTER_API_KEY。

分析Token分布

协商前，analyze命令打印各区块Token数及占总预算比例：

$ token-budget analyze examples/prompt.yaml

Token Distribution Analysis:
Section Type

正方：自动化裁剪是刚需

Prompt工程有个脏秘密：没人敢删。系统消息"可能重要"，示例"也许有用"，上下文"留着保险"。结果就是提示词肥胖症——平均调用成本里，有效信息密度低得惊人。

Token Budget Negotiator的刚性设计解决了这个心理陷阱。优先级强制排序，消融循环强制验证，评分标准强制定义"好"是什么。人做裁剪是拍脑袋，它做裁剪是走流程。

三种发布形态覆盖不同场景：命令行给运维脚本，Python库给业务代码，MCP服务器给AI Agent生态。这种全覆盖思路说明作者清楚——成本优化不是一次性脚本，是持续基础设施。

本地评委支持是关键设计。用Ollama跑gemma4:latest，意味着敏感数据不出内网，也意味着零额外API成本。对于高频调用场景，本地打分的固定成本摊薄后，边际成本趋近于零。

反方：评分标准才是隐藏Boss

但工具把最难的问题外包了：什么是"质量"？

消融循环的停止条件依赖评分标准，而评分标准需要人工编写。如果标准模糊，工具会"优化"掉人类认为重要的部分；如果标准过严，工具不敢删，优化失效。

更深层的问题：提示词质量是多维的。准确性、风格一致性、安全边界、用户满意度——不同场景权重不同。Token Budget Negotiator把这一切压成一维分数，信息损失不可避免。

还有优先级整数。谁决定系统消息是5还是3？这个前置判断本身就是人工经验，工具只是把它显性化，并未消除主观性。

YAML配置也增加了使用门槛。Prompt工程师现在需要维护：原始提示词、分块YAML、评分标准、优先级映射。复杂度从"写提示词"迁移到"配置优化流水线"，团队是否有这个投入意愿？

判断：它是基础设施，不是银弹

Token Budget Negotiator的价值不在自动化本身，而在把不可讨论的成本变成可讨论的实验。

以前团队争论"这段上下文要不要"，凭的是直觉和职级。现在可以跑一遍消融，看分数掉多少、Token省多少，用数字结束争论。这种"可观测性"比节省的那点Token钱更值钱——它让Prompt工程从手艺变成可迭代的工程。

但它确实把脏活累活推给了使用者：你得写评分标准，你得定优先级，你得解释为什么85分可以接受而84分不行。工具不负责回答这些问题，只负责在你回答后执行得比人更系统、更可复现。

对于日调用量过万、提示词版本混乱、成本压力真实的团队，这是值得接入的基础设施。对于偶尔调用的实验性项目，YAML配置的 overhead 可能不划算。

一个细节暴露设计意图：输出包含"完整消融日志"。这不是给机器看的，是给人类复盘用的——哪些区块被删了、哪步分数跳水、最终保留什么。工具在帮用户建立直觉，而非取代直觉。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

Claude Code 源码泄露了，有人用Python复刻了一个极简版

机器之心Pro 2026-04-02 11:30:10
4 跟贴 4
OpenClaw大更新：正式接入DeepSeek V4

机器之心Pro 2026-04-27 14:34:30
12 跟贴 12

DeepSeek两天两次降价，百万token仅2分钱！调用量一度飙升近4倍，Agent模型价格锚被打穿

每日经济新闻 2026-04-27 09:20:11
546 跟贴 546

DeepSeek V4永久降价！缓存命中再打1折，实测编程成本骤降83%

量子位 2026-04-27 12:35:19
42 跟贴 42
谷歌DeepMind重磅开源多模态TIPSv2：实现Patch-Text对齐最优表现

机器之心Pro 2026-04-27 17:23:04
0 跟贴 0

刚刚，百度把龙虾、剪辑Agent、Office Agent全塞进网盘！

智东西 2026-04-27 18:08:21
18 跟贴 18

千问首发灰测 HappyHorse 1.0，开启免费体验

爱范儿 2026-04-27 19:20:24
0 跟贴 0
当老板开始数你的"token步数"

我是一个粉刷匠2 2026-04-27 11:53:38
0 跟贴 0

上海电气：中标世界超大规模数据中心核心设备供货项目

界面新闻 2026-04-27 11:46:12
0 跟贴 0
服务器堆叠≠超节点！超节点三大特点打破通信墙

量子位 2026-02-05 08:35:00
0 跟贴 0
像梁文峰一样诚实

蓝鲸新闻 2026-04-27 10:24:56
5 跟贴 5
不到一岁的宝宝，居然能听懂指令，动作还比大人标准

领笑之家 2026-04-25 16:49:16
43 跟贴 43
提示词过时了？GPT-5.5已具备直觉，只需指明目标AI就能自动接管

钛媒体APP 2026-04-27 19:41:18
0 跟贴 0
打工人五一自救指南：把活全甩给AI，准备免打扰出门

量子位 2026-04-27 20:04:37
13 跟贴 13
泡泡玛特推出Labubu冰箱，售价5999元，上千人预约

大象新闻 2026-04-26 13:01:02
5064 跟贴 5064
大爷大妈广场舞，美女发出指令让大爷心急，下秒让男人都嫉妒！

大眼猫侃世界 2026-04-25 16:19:04
0 跟贴 0
中日之战已经无法避免，我们已经向联合国，递交了相关文件

胡侃带吃瓜 2026-04-27 09:54:00
1 跟贴 1
一大批高校，将搬迁！

吉刻新闻 2026-04-27 16:08:43
713 跟贴 713
2K游戏14天强制联网：正版玩家的"惩罚"

报错免疫体 2026-04-27 17:55:03
1 跟贴 1
深度解读Deepseek-V4：注意力压缩 /1M 上下文/ MoE架构

卢菁老师 2026-04-27 02:14:19
0 跟贴 0
Squeeze Evolve：无需验证器实现推理新SOTA

机器之心Pro 2026-04-27 12:49:03
0 跟贴 0
巴基斯坦政府遭精准钓鱼：攻击者如何把微软服务变成"隐身衣"

闪存猎手 2026-04-27 21:25:48
0 跟贴 0
MongoDB认证值得考吗？正反观点拆解

报错免疫体 2026-04-27 18:56:30
0 跟贴 0
特工男携带重要文件被跟踪，装扮成盲人成功脱险

飞鸟潜影 2026-04-24 00:00:00
0 跟贴 0
这四句话，比"我爱你"更值钱

晚风也遗憾 2026-04-28 00:55:09
0 跟贴 0
沉默是选择，不是认输

时光慢邮啊 2026-04-28 00:36:37
0 跟贴 0
明星临终前的"整理事务"：一场被误读的告别

影视情报室 2026-04-27 22:44:59
0 跟贴 0
阿里happyhorse正式入场，这匹黑马能成功“掀桌”吗？

钛媒体APP 2026-04-28 08:18:18
1 跟贴 1
半挂模型玩具车买菜，要是超重了怎么办，雷军都不敢这么设计！

宇宙搞笑生活 2026-04-23 14:10:00
4 跟贴 4
女子饭店包间为狗狗过生日，未打扰其他顾客

华声在线 2026-04-27 19:08:23
103 跟贴 103
一医院原院长：我就像一个吸血鬼

南方都市报 2026-04-26 23:49:54
153 跟贴 153
江苏一70多岁老人想打工，办假证把年龄改小8岁，还特意染了黑发，民警：他老伴离世，自己一个人想找个工作充实自己

大象新闻 2026-04-27 11:17:05
1209 跟贴 1209
伊朗导弹进入战备，当地美公民全体收到“撤离”指令

记得那片海辛 2026-04-27 09:30:28
0 跟贴 0
半壁华人！GPT Image 2团队曝光：无锡才俊带队，13人4个月封神

量子位 2026-04-23 16:07:27
8 跟贴 8
这就是猫咪能如同狗狗一样接受指令的原因

三少说体育 2026-04-27 11:16:26
1 跟贴 1
文旅部集中整治景区摆渡车，点名龙虎山、长白山、稻城亚丁等

南方都市报 2026-04-27 16:21:12
1248 跟贴 1248
刚刚，OpenAI向所有云厂商开放了，微软不再独享

智东西 2026-04-28 08:39:35
0 跟贴 0
孩子不是故意不理你：重复指令为何失效

晚风也遗憾 2026-04-28 01:24:21
0 跟贴 0
00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
广州首次！中考“适应性测试”开考

新快报新闻 2026-04-25 08:24:07
7 跟贴 7

广州有40万+根路灯杆，其中两根能充电——成都人笑醒了

广州有40万+根路灯杆，其中两根能充电——成都人笑醒了

黑哥讲现代史

2026-04-28 01:43:36

黄一鸣回应：没结婚一天找8个男的也没关系承认跟40岁大叔交往过

黄一鸣回应：没结婚一天找8个男的也没关系承认跟40岁大叔交往过

法老不说教

2026-04-25 14:34:56

微软公司：将不再向OpenAI支付收入分成

微软公司：将不再向OpenAI支付收入分成

财联社

2026-04-27 21:06:22

不到72小时，俞敏洪再迎两大坏消息，主播集体辞职只是“开胃菜”

不到72小时，俞敏洪再迎两大坏消息，主播集体辞职只是“开胃菜”

乐天闲聊

2026-04-28 04:04:36

刺杀老蒋失败，杀手投奔延安，毛主席：你绝对不能留在这里

刺杀老蒋失败，杀手投奔延安，毛主席：你绝对不能留在这里

抽象派大师

2026-04-24 12:06:13

1910年，孙中山原配和三个孩子合影，容貌憔悴，命运坎坷！

1910年，孙中山原配和三个孩子合影，容貌憔悴，命运坎坷！

史之铭

2026-04-19 17:44:23

张天爱这衣服拉太开了吧

小椰的奶奶

2026-04-28 08:47:57

回顾辽宁一厂长邀15名歌厅舞女做客，喝完酒后，将15人冲进下水道

回顾辽宁一厂长邀15名歌厅舞女做客，喝完酒后，将15人冲进下水道

谈史论天地

2026-04-27 15:00:03

8+11+8！NBA首轮最让人失望球星诞生，2.89亿美金顶薪要打折了

8+11+8！NBA首轮最让人失望球星诞生，2.89亿美金顶薪要打折了

世界体育圈

2026-04-27 21:36:54

大跌眼镜！恒大爆雷最大受害者曝光，竟是南通建筑，原因太过荒唐

大跌眼镜！恒大爆雷最大受害者曝光，竟是南通建筑，原因太过荒唐

谭谈社会

2026-04-27 19:35:02

达芬奇：一位被严重低估的预言家！500年前就看到了人类的结局！

达芬奇：一位被严重低估的预言家！500年前就看到了人类的结局！

谈史论天地

2026-04-27 08:55:55

U15国足2-0意大利建队后正赛首胜留洋红星开场9分钟双响+一条龙

U15国足2-0意大利建队后正赛首胜留洋红星开场9分钟双响+一条龙

我爱英超

2026-04-28 05:43:38

斯诺克爆大冷！特鲁姆普12-13被绝杀 NO.32晋级8强利好吴宜泽

斯诺克爆大冷！特鲁姆普12-13被绝杀 NO.32晋级8强利好吴宜泽

小徐讲八卦

2026-04-28 05:43:05

四年亏光74亿！华谊走到今天，全是当年坑周星驰作的！

四年亏光74亿！华谊走到今天，全是当年坑周星驰作的！

喜欢历史的阿繁

2026-04-26 14:01:13

35岁女子去做私处紧缩，缝针断在肉里，医生徒手掏了半小时没找着

35岁女子去做私处紧缩，缝针断在肉里，医生徒手掏了半小时没找着

离离言几许

2026-04-21 19:53:18

孩子“打不得骂不得”？是教育方式该更新了

孩子“打不得骂不得”？是教育方式该更新了

中国妇女报

2026-04-27 11:09:14

在美华人感慨：凡是移民美国的华人精英，不出两代，就变成普通人

在美华人感慨：凡是移民美国的华人精英，不出两代，就变成普通人

傲傲讲历史

2026-04-28 02:51:19

马斯克治好了几亿人看火箭流眼泪的毛病

马斯克治好了几亿人看火箭流眼泪的毛病

浪子说

2026-04-28 07:04:58

毛主席曾预言：这两个国家将来对中国最大威胁，如今果然应验

毛主席曾预言：这两个国家将来对中国最大威胁，如今果然应验

体识

2026-04-28 06:39:13

上海地铁冲突事件后续!两女互殴被行拘身份被扒，原因曝光太意外

上海地铁冲突事件后续!两女互殴被行拘身份被扒，原因曝光太意外

小鋭有话说

2026-04-26 23:39:45

游走在API与报错之间，用魔法（AI）打败魔法的非硬核玩家。

1840文章数 21关注度

往期回顾全部

科技要闻

英伟达再新高，市值突破5.2万亿美元

头条要闻

考生因迟到2分钟被取消事业单位体检资格人社局败诉

头条要闻

考生因迟到2分钟被取消事业单位体检资格人社局败诉

体育要闻

人类马拉松"破二"新纪元，一场跑鞋军备竞赛

娱乐要闻

黄杨钿甜为“耳环风波”出镜道歉：谣言已澄清

财经要闻

俞敏洪再遭重击

汽车要闻

不那么小众也可以 smart的路会越走越宽

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

艺术

数码

游戏

家居

军事航空

艺术要闻

幸福就是住着小院子，过着小日子

数码要闻

英特尔新驱动允许Arc集成显卡调用最高93%系统内存

曝《GTA6》通缉系统重设计！更真实的追捕体验

家居要闻

江景风格流动的秩序

军事要闻

伊朗外长折返伊斯兰堡内情披露

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版