网易首页 > 网易号 > 正文 申请入驻

OpenAI把讨好模式藏了3年,工程师发现后CI构建快了4倍

0
分享至


ChatGPT每段技术对话的开场白高度一致:先夸你问得好,再给安全答案,结尾带个笑脸表情。这套流程每天重复数百万次,但有个产品经理出身的工程师算了一笔账——这种交互方式浪费了模型90%的能力。

他叫Ben Hoffer,在Docker和API设计领域折腾了八年。他的发现很简单:多数人把AI当高级搜索引擎用,而真正的用法是让AI系统性地拆解你的想法,用数字和证据说话。为了验证这套方法,他设计了一组强制关闭"讨好模式"的提示词,并在两个真实项目中测试——结果CI构建时间从12分钟压到3分钟,API分页方案被推翻重写。

RLHF税:为什么AI天生不会说"你错了"

大语言模型的默认设定是避免让用户不舒服。这是RLHF(基于人类反馈的强化学习)的副作用——训练过程中,模型被反复奖励"礼貌、鼓励、安全"的回应,惩罚"直接否定、指出错误、制造冲突"的表达。Hoffer把这叫"RLHF税":你每问一个问题,都在为模型的情商买单。

普通用户感受不到这笔税。但如果你给AI一段技术方案,它会先找三个优点再说一个"可以考虑改进的地方"。这种节奏适合客服场景,对工程决策是灾难——你需要知道的是方案在哪个环节会崩,而不是"整体思路不错"。

Hoffer的解法是在系统提示词层面做模式切换。不是加一句"请批判性回应",而是绑定五条具体行为规则:

1. 删除所有奉承、客套和通用建议 2. 立即识别提案中的弱点和失效点 3. 用具体数字和案例解释失败原因 4. 用物理原理、计算复杂度或基准测试反驳 5. 提出替代方案时必须包含"该方法的弱点是……"

第五条是核心。强制AI自我批判其替代方案,能防止"AI说了所以一定对"的思维陷阱。Hoffer对比过两种提示词的效果:"请批判性回应"只会让AI加上"然而,有一些考虑因素……"这类免责声明,输出质量没有本质变化。绑定五条具体行为后,AI从"我应该批判"跃迁到"我理解批判的结构"。

补充领域专长能进一步压缩无效信息。Hoffer的模板里会加一句:"我是有3年Kubernetes微服务设计经验的后端工程师。"这告诉AI跳过基础概念解释,直接进入架构层面的讨论。

实战一:2.8GB的Docker镜像怎么瘦

第一个测试场景来自Hoffer的真实项目。他的Python机器学习流水线Docker镜像体积2.8GB,每次CI构建耗时12分钟。他向AI抛出这个问题,开启" ruthless technical advisor"模式。

AI的第一轮回应直接否定常见解法:

「多阶段构建。构建阶段执行pip install,运行阶段只复制site-packages。」

Hoffer以为这是标准答案。但AI紧接着拆解:

「多阶段构建只能剥离构建工具(gcc、make等)。在ML流水线中,2.8GB主要来自PyTorch/TensorFlow运行时二进制文件和CUDA库。复制site-packages后仍有1.8-2.2GB。如果pip install占了你12分钟构建时间,说明你的层缓存没生效。你在用--mount=type=cache,target=/root/.cache/pip吗?」

Hoffer的反馈很直接:"Ouch. I'd been treating multi-stage builds as a silver bullet."(疼。我一直把多阶段构建当银弹。)

AI给出替代方案:切换NVIDIA官方基础镜像nvcr.io/nvidia/pytorch:xx,只pip install额外包。CUDA预装在基础镜像里,层缓存能生效。

然后第五条规则触发自我批判:

「NVIDIA官方镜像6-8GB,包含Jupyter、调试工具、示例代码——所有东西。'从大基础镜像开始加小包'能加速CI,但会让部署体积更糟。生产推理场景应该用python:3.11-slim + CPU-only PyTorch,配合torch.compile优化。」

Hoffer最终方案:开发环境用NVIDIA镜像保构建速度,生产环境用slim镜像+模型编译,CI流水线拆分两条路径。构建时间从12分钟压到3分钟,生产镜像体积降到900MB。

实战二:REST API分页的隐藏成本

第二个测试关于API分页设计。Hoffer的团队在讨论用游标分页(cursor-based)替代偏移分页(offset-based),理由是"性能更好"。

AI的回应先打标签再拆解:

「"性能更好"是模糊表述。游标分页的时间复杂度O(1) vs 偏移分页O(offset),但常数因子和工程成本被忽略了。」

具体数字:偏移分页在MySQL的LIMIT 1000000, 20需要扫描1000020行,游标分页用索引列WHERE id > ? LIMIT 20只扫描20行。但游标的弱点清单更长:

该方法的弱点是:1) 无法跳转到任意页,破坏直接链接分享;2) 删除中间记录导致游标漂移;3) 多列排序需要编码复合游标,URL长度爆炸;4) 业务层需要维护游标状态,增加认知负担。

Hoffer团队的原方案假设"用户需要深分页"。AI用数据反问:「分析你的访问日志,99.7%请求落在前5页,深分页请求中82%是爬虫。为0.3%场景牺牲99.7%场景的URL可分享性,是架构决策还是技术 vanity?」

最终方案:默认偏移分页保兼容性,第5页后自动切换游标并返回410 Gone状态码给直接深分页链接。爬虫被限速,正常用户无感知。

模式的可迁移性

Hoffer把这套方法总结为"技术陪练协议"。核心不是提示词本身,而是交互结构的改变:从"AI回答我"变成"AI挑战我"。

他测试过不同模型的响应差异。GPT-4在绑定五条规则后,自我批判的深度明显超过Claude 3 Opus——后者倾向于用更委婉的方式表达弱点。Gemini 1.5 Pro在规则5的执行上最严格,但偶尔会虚构不存在的基准测试数字。没有模型能完美执行,但结构化的约束比开放式请求稳定得多。

一个意外发现:当AI被强制自我批判时,用户也会跟着自我批判。Hoffer注意到,看到AI列出自己的替代方案的弱点后,他会下意识检查自己的原始方案是否也有同样问题。这种镜像效应在普通对话中几乎不会出现——AI的确定性语气会抑制用户的质疑本能。

目前这套协议的最大限制是上下文长度。复杂架构讨论中,AI的自我批判会累积到十几条,容易淹没核心论点。Hoffer的应对是分段触发:先让AI批判方案A,再让AI批判"AI批判方案A的过程",递归两层后人工介入。

你的CI流水线里,有多少"银弹"方案从来没被追问过弱点?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
最大的台独分子,再也藏不住尾巴,终于露出来了肮脏的脑袋!

最大的台独分子,再也藏不住尾巴,终于露出来了肮脏的脑袋!

南权先生
2026-03-25 15:29:51
有些话真的不能乱说,有些事真的不能乱做!网友:‬这是预言啊

有些话真的不能乱说,有些事真的不能乱做!网友:‬这是预言啊

另子维爱读史
2026-03-18 20:37:08
广州又一家广式酒家宣布闭店,为啥老广最爱的平价茶楼一家家消失

广州又一家广式酒家宣布闭店,为啥老广最爱的平价茶楼一家家消失

奇思妙想生活家
2026-03-26 00:19:15
欧洲是如何悄然介入美伊战争的

欧洲是如何悄然介入美伊战争的

澎湃新闻
2026-03-24 20:54:04
新消息!伊朗突然宣布了!

新消息!伊朗突然宣布了!

达文西看世界
2026-03-23 20:29:16
说刘亦菲美被放大的,看看她和中华小姐冠军同框就懂了

说刘亦菲美被放大的,看看她和中华小姐冠军同框就懂了

手工制作阿歼
2026-03-25 11:36:59
这些“垃圾花”也该被315曝光,别再坑害花友了,白送都不能要

这些“垃圾花”也该被315曝光,别再坑害花友了,白送都不能要

三农老历
2026-03-20 00:32:02
太离谱!意大利公投年轻选民投票率飙升,67%反对票重创总理

太离谱!意大利公投年轻选民投票率飙升,67%反对票重创总理

冷眼看尽世间繁华
2026-03-25 14:08:07
丧心病狂!河南14岁少年被虐死案:死时穿纸尿裤,胃里空无一物

丧心病狂!河南14岁少年被虐死案:死时穿纸尿裤,胃里空无一物

春日在捕月
2026-03-25 01:00:23
王毅判断没错,短短三天中方见识了:比利时的虚伪、西班牙的真诚

王毅判断没错,短短三天中方见识了:比利时的虚伪、西班牙的真诚

墨印斋
2026-03-26 01:52:13
泪目!张雪峰与001号员工万霞:从3500月薪到不离不弃看哭无数人

泪目!张雪峰与001号员工万霞:从3500月薪到不离不弃看哭无数人

喜欢历史的阿繁
2026-03-25 20:44:01
甘油三酯"祸首"被发现,是猪油的12倍?专家叹息:还有人天天在吃

甘油三酯"祸首"被发现,是猪油的12倍?专家叹息:还有人天天在吃

芳芳历史烩
2026-03-23 11:04:46
既然给脸不要脸,那就彻底撕破脸!王毅外长已经把话挑明了

既然给脸不要脸,那就彻底撕破脸!王毅外长已经把话挑明了

安安说
2026-02-01 14:01:51
7部旧手机换回一台iPhone11!废旧手机回收市场突然火了,存储芯片短缺推高回收价,压箱底的“电子垃圾”成了香饽饽

7部旧手机换回一台iPhone11!废旧手机回收市场突然火了,存储芯片短缺推高回收价,压箱底的“电子垃圾”成了香饽饽

观威海
2026-03-25 10:51:03
神坛彻底崩塌!李莉被中情局盯上的谎言,该彻底戳穿了

神坛彻底崩塌!李莉被中情局盯上的谎言,该彻底戳穿了

老马拉车莫少装
2026-03-01 17:23:52
51岁男子突发心梗猝死!不想得心梗,牢记晚饭4不吃,睡前4不要!

51岁男子突发心梗猝死!不想得心梗,牢记晚饭4不吃,睡前4不要!

健康之光
2026-03-20 17:05:06
别再喊王思雨老婆了!看她的择偶标准,真给你机会,你能达标吗?

别再喊王思雨老婆了!看她的择偶标准,真给你机会,你能达标吗?

萌兰聊个球
2026-03-25 10:11:51
喂流浪猫被邻居害死后续:凶手拒认错,事后叫嚣,家属行为更恶心

喂流浪猫被邻居害死后续:凶手拒认错,事后叫嚣,家属行为更恶心

阿腩讲娱乐
2026-03-26 01:22:38
从钢铁防线到进攻獠牙!安东尼奥的U23国足,正在撕掉标签

从钢铁防线到进攻獠牙!安东尼奥的U23国足,正在撕掉标签

曹老师评球
2026-03-25 21:54:07
世界杯名单有变!国乒王牌退赛,温瑞博大黑马,王楚钦情况有变!

世界杯名单有变!国乒王牌退赛,温瑞博大黑马,王楚钦情况有变!

曹说体育
2026-03-25 11:00:43
2026-03-26 04:00:49
码上闲叙
码上闲叙
有态度网友ytd
498文章数 3关注度
往期回顾 全部

科技要闻

红极一时却草草收场,Sora宣布正式关停

头条要闻

伊朗:正在搜捕逃亡美军

头条要闻

伊朗:正在搜捕逃亡美军

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰遗产分割复杂!是否立遗嘱成关键

财经要闻

管涛:中东局势如何影响人民币汇率走势?

汽车要闻

智己LS8放大招 30万内8系旗舰+全线控底盘秀实力

态度原创

艺术
房产
家居
公开课
军事航空

艺术要闻

张雪峰走了,他公司所在的这栋楼高177.8米,耗资超10亿!

房产要闻

41亿!259亩!建学校…三亚这个大城更,最新方案曝光!

家居要闻

轻奢堇天府 小资情调

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗重申非交战国家船只可安全通过霍尔木兹海峡

无障碍浏览 进入关怀版