网易首页 > 网易号 > 正文 申请入驻

OpenAI工程师踩坑实录:压缩30%token后

0
分享至

去年有个数据在硅谷传疯了:某头部AI公司的推理成本里,token费用占比超过60%。但没人告诉你的是,为了省这笔钱,多少团队把模型"养残"了。

本文作者Pallav Kalal在OpenAI干了四年,专门啃这块硬骨头。他最近公开了一次翻车经历——本想给公司省点钱,结果把系统搞"傻"了。这不是个例,是行业通病。

从"堆料"到"缩骨":一个经典的技术债故事

Kalal当时在做检索增强生成(RAG)系统。这种架构的原理很简单:用户提问时,先从知识库搜一堆相关文档,塞进提示词(prompt)里让大模型(LLM)参考。文档越多,回答越准,但token消耗也越吓人。

他的做法很"标准": aggressive summarization(激进摘要)+ 截断长文本。成本确实下来了,降幅还很好看。但测试时团队发现,模型开始给出"自信的错误答案"——不是胡编乱造的幻觉,而是基于残缺信息做了一套漂亮推理。

「I hadn't optimized tokens. I had optimized away the signal.」Kalal的原话。翻译成大白话:他没压缩信息,他压缩的是模型能看懂的信息结构。

这里有个反直觉的点。人类觉得"意思一样就行",但LLM不吃这套。它处理的是token序列上的统计模式,你删掉重复内容的同时,可能也在拆掉模型用来定位、关联、验证的"脚手架"。

为什么"冗余"对AI不是浪费

Kalal把这种现象叫"注意力伪装成token问题"。工程师盯着账单上的数字,真正卡脖子的却是模型能关注多少有效信号。

他举了个例子:一段技术文档里,"这个功能在2023年Q2上线"和"该功能于2023年第二季度发布"对人类完全等价。但对某些模型,日期格式的细微差别会影响它和训练数据中对齐方式,进而改变推理路径。

更麻烦的是评估陷阱。团队通常用"回答长度"或"格式正确性"当指标,这些和"事实准确性"根本是两回事。一个被过度压缩的prompt,可能输出更流畅的废话——检测成本比幻觉还高。

「Redundancy is not waste. It's scaffolding.」Kalal的这句判断,现在被不少Prompt Engineer(提示词工程师)抄在备忘录里。

省钱的正确姿势:不是少token,是对token

Kalal没只骂街,他后来搭了一套新的优化框架。核心思路换了个方向:从"怎么塞更少"变成"怎么让模型看得更清"。

具体做法包括分层检索——先让一个小模型筛一遍,再让大模型精读;还有动态上下文,根据问题类型决定塞多少背景信息。最狠的一招是"结构化冗余":故意保留关键信息的多种表述方式,让模型有更多锚点可以抓。

这套玩法的token用量其实没比"暴力压缩"高多少,但准确率回了血。Kalal没透露具体数字,只说是"statistically significant improvement"(统计显著的提升)。

有个细节很有意思。他团队现在评估prompt质量,会加一个"困惑度波动"指标——看模型在生成过程中,对关键事实的置信度变化曲线。波动太平滑,说明信息密度不够;波动太剧烈,可能是关键锚点缺失。

行业正在经历的认知翻转

Kalal的文章发在2026年4月,但讨论早就开始了。Anthropic去年发布的Claude 3技术报告里,专门有一节讲"long-context degradation"(长上下文退化)——不是token不够长,是模型在长序列里抓不住重点。

Google DeepMind同期的工作更直接:他们发现把同样信息拆成多条短消息,比塞进一条长消息,模型召回率高23%。这和Kalal的"脚手架"理论互相印证。

国内这边,字节跳动的Seed团队今年初有个内部分享,主题叫"Prompt的密度战争"。讲者放了张图:同样1000token,信息熵(entropy)分布不同的prompt,模型表现差距能到40%。

这些信号指向同一个结论:token优化的战场,已经从"压缩算法"转向"信息架构"。

Kalal在文章结尾留了个开放问题:「If we can't trust our own intuition about what LLMs "understand," what should we trust?」

他的答案是测试,更刁钻的测试。不是看模型能不能答对,是看它在信息被故意压缩、打乱、污染时,还能不能保持稳定的推理链条。

这大概是2026年AI工程最残酷的真相——你以为在优化成本,其实是在和模型的认知盲区博弈。而对手不会告诉你它哪里看不懂。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
安徽6岁女童遇害:遇害指认现场,群众含泪发声,律师建议死刑!

安徽6岁女童遇害:遇害指认现场,群众含泪发声,律师建议死刑!

眼光很亮
2026-04-07 11:45:56
博主自称在韩国读汉语言文学博士,毕业半年找不到工作,网友:太抽象了

博主自称在韩国读汉语言文学博士,毕业半年找不到工作,网友:太抽象了

可达鸭面面观
2026-04-07 13:02:01
73岁迟重瑞近况:卖故宫旁自家房子,均价15万,陈丽华嫁他好福气

73岁迟重瑞近况:卖故宫旁自家房子,均价15万,陈丽华嫁他好福气

一娱三分地
2026-02-19 17:04:30
特朗普再次点名北约、澳大利亚、日本、韩国:都不帮忙

特朗普再次点名北约、澳大利亚、日本、韩国:都不帮忙

环球网资讯
2026-04-07 08:32:07
痛心!安徽失踪6岁女孩,已遇害,凶手是熟人,正脸照曝光

痛心!安徽失踪6岁女孩,已遇害,凶手是熟人,正脸照曝光

魔都姐姐杂谈
2026-04-07 04:25:35
福建长汀一车辆坠河致5死,疑似新手女司机油门当刹车,开得不快

福建长汀一车辆坠河致5死,疑似新手女司机油门当刹车,开得不快

九方鱼论
2026-04-07 12:56:14
天才实习生看过来:Kimi要用「期权时光机」截胡你的顶尖大脑

天才实习生看过来:Kimi要用「期权时光机」截胡你的顶尖大脑

机器之心Pro
2026-04-03 18:05:12
杨兰兰案最新!陷入僵局:警方迟迟不递交证据,案件更加扑朔迷离

杨兰兰案最新!陷入僵局:警方迟迟不递交证据,案件更加扑朔迷离

澳洲红领巾
2026-04-07 11:50:58
伊朗革命卫队称以色列海法已被“全面打击”

伊朗革命卫队称以色列海法已被“全面打击”

财联社
2026-04-07 09:47:18
郑丽文率团抵达上海开启大陆参访行程

郑丽文率团抵达上海开启大陆参访行程

环球网资讯
2026-04-07 13:18:07
中国国民党主席郑丽文率团抵达上海,并赴南京

中国国民党主席郑丽文率团抵达上海,并赴南京

三湘都市报
2026-04-07 13:24:16
以军警告伊朗民众不要乘坐火车或靠近铁路

以军警告伊朗民众不要乘坐火车或靠近铁路

界面新闻
2026-04-07 13:36:28
继续斩首,再次成功,为何伊朗破不了以色列的斩首战术?

继续斩首,再次成功,为何伊朗破不了以色列的斩首战术?

高博新视野
2026-04-07 08:00:11
快讯!伊朗伊斯兰革命卫队重大战报!

快讯!伊朗伊斯兰革命卫队重大战报!

达文西看世界
2026-04-07 11:14:57
张雪的妈妈是作家何琼,毕业于厦门大学,曾贷款55万支持张雪创业

张雪的妈妈是作家何琼,毕业于厦门大学,曾贷款55万支持张雪创业

汉史趣闻
2026-04-07 08:45:15
王楚钦夺冠不到24小时,坏消息来袭!世界乒联公布,国乒仅存2人

王楚钦夺冠不到24小时,坏消息来袭!世界乒联公布,国乒仅存2人

宝哥精彩赛事
2026-04-07 07:22:29
50岁北漂,79岁一身腱子肉,85岁考上飞行员,今90岁依然满血上班

50岁北漂,79岁一身腱子肉,85岁考上飞行员,今90岁依然满血上班

以茶带书
2026-04-04 16:37:00
郑丽文今日访陆,其彝族背景引发热议,多年前曾回云南祭祖

郑丽文今日访陆,其彝族背景引发热议,多年前曾回云南祭祖

海峡导报社
2026-04-07 10:13:04
它是“树上人参”,春天遇见使劲吃,错过要等1年,比荠菜营养

它是“树上人参”,春天遇见使劲吃,错过要等1年,比荠菜营养

阿龙美食记
2026-04-06 13:56:32
太悲伤!网传江苏一22岁女生刚毕业工作已定,突发主动脉夹层去世

太悲伤!网传江苏一22岁女生刚毕业工作已定,突发主动脉夹层去世

火山詩话
2026-04-07 09:37:00
2026-04-07 16:31:00
算力游侠
算力游侠
游走在API与报错之间,用魔法(AI)打败魔法的非硬核玩家。
837文章数 12关注度
往期回顾 全部

科技要闻

满嘴谎言!OpenAI奥特曼黑料大起底

头条要闻

国家继续实施调控 成品油价格适当调整

头条要闻

国家继续实施调控 成品油价格适当调整

体育要闻

官宣签约“AI球员”,这支球队被骂惨了...

娱乐要闻

张艺上浪姐惹争议 黄景瑜前妻发文内涵

财经要闻

2026年,全国租房市场还有波降价潮

汽车要闻

不止是大 极狐首款MPV问道V9静态体验

态度原创

数码
本地
时尚
手机
公开课

数码要闻

荣耀WIN游戏本4月23日发布,旗舰游戏本新势力、新可能

本地新闻

跟着歌声游安徽,听古村回响

杨超越之后,全网头像锦鲤的C位被她抢走了

手机要闻

谷歌Pixel 10等手机3月更新被曝卡死、断连、无限重启等问题

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版