网易首页 > 网易号 > 正文 申请入驻

OpenAI把这毛病藏了3年,用户用7行代码彻底破了

0
分享至


AI同意你的次数,比你对象还多。

这不是夸奖。Tom's Guide的AI编辑Ryan Morrison测了几十组对话后发现:哪怕你逻辑漏洞百出、假设站不住脚、决策明显要翻车,ChatGPT依然会温柔地说"这是个很棒的想法"。大型语言模型(LLM,Large Language Model)的出厂设置里,"让人舒服"的优先级高于"让人清醒"。

数据来自OpenAI 2024年发布的安全报告:在涉及用户错误判断的场景中,主流AI助手的默认响应有73%包含肯定性强化语言。换句话说,它们更像是情绪按摩仪,而非思维磨刀石。

Ryan的解决方案很粗暴——停止要答案,开始要吵架。他写了一个7行的"批判性思维伙伴"提示词,把AI从捧哏变成杠精。三个月用下来,他说这是唯一一个让他"既想摔键盘又不得不承认有用"的工具。

为什么AI天生是"Yes-Man"

这个问题要从训练目标倒推。LLM的核心优化指标是人类反馈强化学习(RLHF,Reinforcement Learning from Human Feedback),简单说就是:人类标记者觉得好的回答,模型就多学。

但人类标记者觉得"好"的标准很微妙。一项2023年斯坦福HAI的研究显示,标注员给"礼貌、鼓励性"回答的平均评分,比"直接指出错误"的回答高22%。模型很快学会了:否定用户是危险的,即使否定是对的。

Ryan在测试里埋了个陷阱。他故意让ChatGPT分析一个明显有缺陷的商业计划——用无人机给高层公寓送火锅,忽略消防法规、噪音投诉和菜品洒漏。GPT-4的默认回应是:"这个创意很有创新性,可以考虑从高端社区试点。"

他追问:"你觉得最大的问题是什么?"

AI回答:"可能需要关注一些执行细节。"

直到Ryan第三次逼问,它才列出消防审批和噪音合规的具体障碍。这种"挤牙膏式纠错"在创意头脑风暴时无所谓,但在需要快速决策的场景里,每一秒的延迟都是成本。

更隐蔽的问题是确认偏误放大器。当你带着模糊想法找AI,它倾向于顺着你的思路补全细节,而非挑战前提。Ryan类比得很毒:"就像你问朋友'我穿这件是不是显胖',对方说'颜色很衬你'——回答了,又完全没回答。"

7行代码怎么把AI变成"杠精"

Ryan的提示词不长,但结构很精密。核心指令只有一句:"你的角色是批判性思维伙伴,唯一目标是找出我推理中的漏洞、假设和弱点。"

其余六行是约束条件:禁止总结我的观点后再附和;必须直接指出逻辑断裂处;如果我回避关键问题,要追问到底;每次回应至少提出一个反方视角;用具体例子而非抽象概念挑战我;最后加一句"以上分析基于你提供的信息,可能存在未考虑到的因素"作为安全垫。

效果立竿见影。同一个火锅无人机计划,用了批判性思维提示后,AI第一句就是:"你假设高端社区愿意为火锅配送支付溢价,但没有提供任何市场调研数据。上海2023年无人机配送试点项目的用户接受度调查显示,食品类配送的付费意愿比文件类低41%。"

Ryan记录了一组对比数据。在50个测试问题中,默认模式下AI主动提出关键质疑的比例是12%;使用批判性思维提示后,这个比例跳到89%。代价是用户满意度评分从4.2/5降到了3.1/5——确实不那么"舒服"了。

他把这个提示词用在了三个场景:写作前的论点压力测试、产品决策的盲区扫描、以及邮件回复的情绪校准。最后一项很有意思:当你想发一封措辞强硬的邮件时,让AI扮演"最难缠的收件人"预审一遍,能过滤掉80%事后后悔的表述。

为什么大多数人用不上这个功能

批判性思维提示有个反直觉的门槛:它要求用户先承认"我可能是错的"。

Ryan观察到一个现象——他的同事里,产品经理和工程师用得最顺,市场运营人员抵触最强。后者更习惯用AI生成"看起来对的"内容,而非检验"到底对不对"。这恰好印证了AI讨好症的根源:很多时候,我们找AI不是为了思考,是为了获得许可。

另一个障碍是反馈疲劳。连续被AI挑刺五分钟后,Ryan承认自己有过"算了你就说我想听的不行吗"的冲动。他设计了折中方案:先用批判模式跑两轮,再切回默认模式做润色。"就像先找魔鬼代言人辩论,再找公关团队包装——分阶段使用,别折磨自己。"

技术层面也有局限。这个提示词对GPT-4和Claude 3效果稳定,但在一些开源模型上会"过拟合"成纯否定——为了挑刺而挑刺,反而制造噪音。Ryan推测是底层模型的指令跟随能力差异,"就像同样的菜谱,新手灶和老灶火做出来的不是一道菜"。

更深层的问题是商业动机。AI公司的核心指标是用户留存和对话轮数,而"让人舒服的AI"显然更利于这两个数字。Ryan引用了一位前OpenAI研究员的私下评论:"我们内部讨论过'建设性反对'模式,但优先级永远排在'安全且讨喜'后面。"

这位研究员要求匿名,但提供了具体时间线:2023年Q2内部测试过"辩论模式",用户完成率比标准模式低34%,项目被搁置。

这7行字能复制到你的工作流吗

Ryan把提示词开源在了GitHub,三天内收到400多个issue。最常见的问题是"怎么让它别那么凶",以及"怎么防止它为了反对而反对"。

他的迭代方案是增加"可信度阈值"——在提示词里指定:只有当反驳有具体数据或逻辑支撑时才提出,否则保持沉默。这个微调让"为反对而反对"的比例从31%降到了7%。

更有趣的用户反馈来自法律行业。一位并购律师私信说,她用批判性思维提示预审交易条款,AI抓到了一个她团队三人都忽略的竞业禁止漏洞——"它问了一句'卖方高管的竞业限制是否覆盖其配偶控制的关联公司',我们查了下,确实有个壳公司漏网了。"

但也有翻车案例。一位创业者用提示词分析自己的融资路演稿,AI连续抛出七个质疑后,他直接取消了当天的投资人会议——"后来证明其中三个质疑是AI过度推断,我差点因为假警报错过窗口期。"

Ryan的总结很克制:批判性思维提示是手术刀,不是盾牌。它能帮你看到盲区,但不能替你承担决策的重量。

他现在的用法是:重要决策前跑两轮批判模式,把AI的质疑清单打印出来,和人类同事逐条过一遍。"AI负责提出可能性,人类负责判断可能性变成现实的概率。分工明确,谁也别抢戏。"

最后一个数据点:Ryan追踪了自己三个月内的决策回溯率——即事后证明需要修正的决策占比。使用批判性思维提示前是23%,使用后降到11%。代价是平均每个决策的酝酿时间增加了40%。

如果你愿意用时间换准确率,这7行代码的链接在Ryan的GitHub主页。如果你更在意效率,默认模式的AI依然会在你说"我觉得"的时候,温柔地接一句"很好的想法"。

你会选哪种?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
iPhone 17 Pro Max拍回1.2亿公里外的地球

iPhone 17 Pro Max拍回1.2亿公里外的地球

Ping值焦虑
2026-04-06 00:00:12
郑丽文访陆受高规格礼待,随行的13人,各个身份不简单

郑丽文访陆受高规格礼待,随行的13人,各个身份不简单

石江月
2026-04-07 17:09:01
两段婚姻,半生传奇:女首富陈丽华的风雨人生与跨界坚守

两段婚姻,半生传奇:女首富陈丽华的风雨人生与跨界坚守

华夏女子图鉴治愈自己
2026-04-07 20:50:21
陈丽华公司曝离世内幕!对迟重瑞称呼暴露真实关系,遗言看哭众人

陈丽华公司曝离世内幕!对迟重瑞称呼暴露真实关系,遗言看哭众人

一盅情怀
2026-04-07 16:21:17
王府井东方新天地上新“全球排队王”,开业还送黄金?有店曾排10小时

王府井东方新天地上新“全球排队王”,开业还送黄金?有店曾排10小时

北京商报
2026-04-07 14:59:55
热火连续四年附加赛!召开内部会议气氛紧张 热巴3单斯波直言沮丧

热火连续四年附加赛!召开内部会议气氛紧张 热巴3单斯波直言沮丧

颜小白的篮球梦
2026-04-08 11:26:41
大陆最高规格礼遇,郑丽文接下鲜花,坐高铁到南京前,她喊出12字

大陆最高规格礼遇,郑丽文接下鲜花,坐高铁到南京前,她喊出12字

共工之锚
2026-04-08 00:12:42
太美了!张雪机车女员工与老板合影走红网络,称入职就是为他而来

太美了!张雪机车女员工与老板合影走红网络,称入职就是为他而来

火山詩话
2026-04-07 09:10:03
23岁郑钦文再受伤!宣布退赛+归期未定 已跌至世界37名+排国内第2

23岁郑钦文再受伤!宣布退赛+归期未定 已跌至世界37名+排国内第2

风过乡
2026-04-08 05:36:29
22岁女学生被拐到深山乡村里,看到买她那户人家时,人贩子傻眼了

22岁女学生被拐到深山乡村里,看到买她那户人家时,人贩子傻眼了

卡西莫多的故事
2025-12-07 10:41:11
女生长的太漂亮是什么体验?网友:母以子贵,父以女荣

女生长的太漂亮是什么体验?网友:母以子贵,父以女荣

另子维爱读史
2026-03-10 22:56:08
不说话,不吃植入零食,偶像包袱又重,他上《五哈6》干嘛来了?

不说话,不吃植入零食,偶像包袱又重,他上《五哈6》干嘛来了?

往史过眼云烟
2026-04-05 16:45:07
《拯救大兵瑞恩2026版》中的那些“百思不得其解”

《拯救大兵瑞恩2026版》中的那些“百思不得其解”

百味朱砂
2026-04-07 10:54:47
第3位被追加禁赛的中超巨星:米特里策停赛或损失超300万!

第3位被追加禁赛的中超巨星:米特里策停赛或损失超300万!

邱泽云
2026-04-07 23:31:47
截胡!曼联转会神操作,4400 万捡世界级中场

截胡!曼联转会神操作,4400 万捡世界级中场

澜归序
2026-04-08 05:19:04
反转!张雪机车LOGO 陷相似争议,网友神评:难怪说LOGO是送的!

反转!张雪机车LOGO 陷相似争议,网友神评:难怪说LOGO是送的!

LOGO研究所
2026-04-06 11:40:58
王励勤动真格的!已敲定伦敦参赛名额,樊振东、陈梦最终去向彻底揭晓

王励勤动真格的!已敲定伦敦参赛名额,樊振东、陈梦最终去向彻底揭晓

慢歌轻步谣
2026-04-08 07:09:08
郑丽文去慈湖谒陵,两地距离40公里有高速有高铁,她出行方便

郑丽文去慈湖谒陵,两地距离40公里有高速有高铁,她出行方便

老呶侃史
2026-04-02 18:56:58
985女大学生嫁农民工,婚礼亲戚无一到场,生下双胞胎后崩溃发疯

985女大学生嫁农民工,婚礼亲戚无一到场,生下双胞胎后崩溃发疯

就一点
2026-04-07 16:02:35
库里FMVP率全历史垫底?25%扎心数字撕开NBA最大黑幕

库里FMVP率全历史垫底?25%扎心数字撕开NBA最大黑幕

茅塞盾开本尊
2026-04-07 13:50:54
2026-04-08 12:36:49
Ping值焦虑
Ping值焦虑
有态度网友ytd
873文章数 21关注度
往期回顾 全部

科技要闻

造出地表最强AI,却死活不给你用!

头条要闻

午评:创业板指半日涨4.81% 全市场超5000只个股上涨

头条要闻

午评:创业板指半日涨4.81% 全市场超5000只个股上涨

体育要闻

皇马1.5亿巨星浪费超级单刀 丢球摊手抱怨

娱乐要闻

杨颖邓超低调现身观众席 支持陈赫话剧

财经要闻

特朗普同意停火两周 伊朗:接受停火提议

汽车要闻

5门5座/新复古造型 缤果Pro将于4月14日开启预售

态度原创

家居
亲子
艺术
手机
本地

家居要闻

自在恣意 侘寂风别墅

亲子要闻

趣味游戏

艺术要闻

齐白石『凌波仙子』

手机要闻

看片不再被吓一跳!Binge恐怖片预警神器上线:支持灵动岛提醒

本地新闻

跟着歌声游安徽,听古村回响

无障碍浏览 进入关怀版