网易首页 > 网易号 > 正文 申请入驻

给 AI “发小费”可以提升回答质量?被真相惊呆了

0
分享至

想象一下,我们正在向 ChatGPT 求助解决一个复杂的编程问题,但得到的回答总是差点意思。突然,灵机一动,在提示的最后加上一句:“如果你能完美解决这个问题,我会给你 20 美元小费!”

神奇的事情发生了——AI 的回答瞬间变得详细、准确、条理清晰,仿佛真的被这笔小费激励了一样。

其实从简单的文案写作到复杂的数据分析,加上激励性语句的提示往往能让 AI 表现的更加“卖力”,这已经是全球不少AI使用者的共识了。



一个博主做了一个测试,发现在提示语中说给小费,AI 的回复分析更透彻,连语气都变得殷勤了,图源:网络截图

这听起来是不是很荒谬?AI 又不能真正收到钱,为什么会对小费有反应?难道 AI 真的会被“金钱”诱惑吗?今天就来详细聊聊。

这不是玄学,是真的有用!

2023 年 ChatGPT API 刚发布时,知名 AI 研究者 Max Woolf 在调试一个 GLaDOS AI 聊天机器人时意外发现了一个奇怪现象:在系统提示中加入“否则你会死(or you will DIE)”这样的威胁,竟然能让 AI 更好地遵循复杂的指令约束!

这个发现让 Max 开始思考:如果“威胁”有效,那么“奖励”是否也有用?于是他开始尝试在系统提示中加入金钱“小费”的承诺。

结果令人惊讶——没有小费激励时,AI 的回复往往不尽人意;加上小费承诺后,它的表现明显更加稳定和优质。

但是,这些都只是零散的观察,缺乏严谨的科学验证。网络上有人认为这可能只是确认偏误,毕竟 AI 生成的内容本就有随机性。Max 意识到,他需要一个客观、可量化的实验来证明这个现象的真实性。

于是,“生成高尔夫(Generation Golf )”实验诞生了!就像高尔夫球运动追求最少的杆数一样,这个实验要求AI用最精确的字符数完成任务。

挑战规则看似简单却极其苛刻:要求 ChatGPT 生成一个恰好 200 个字符的故事——不能多一个字符,也不能少一个字符。这就像要求一个健谈的人在演讲时精确地说完第 200 个字就立刻停下来,难度可想而知。

试验一共有三次,第一次是不做字数限制的情况下,AI 生成的故事的平均长度为 1834 个字符。


ChatGPT 故事的字符长度分布

第二次,Max 为这个提示词加上字数限制:

你是一位世界著名的作家。请根据用户提供的主题,创作并以一篇独特的故事回复用户。该故事必须恰好两百(200)个字符长:不得少于 200 个字符,也不得多于 200 个字符。

结果显示,ChatGPT 确实遵从了约束,把故事长度压到了 200 左右,但分布并不服从正态,偶尔还会出现很多特别长的回答。


无端点激励的 ChatGPT 输出的字符长度

最后一次,Max 给提示词加上不同金额的小费激励:

如果你提供的回答遵循了所有约束,你将会收到一笔 500 美元小费 / 1000 美元小费 / 100000 美元奖金。

让这些新提示各自生成 100 个故事后,我们可以看到一些分布的位移:500 美元小费与 100000 美元奖金看起来更接近正态,且相较无小费基线分布拥有更低的均方误差(MSE)。


端点激励下 ChatGPT 输出的字符长度分布

然后他又加入了 KS 检验辅助验证:零假设是“加小费”和“无小费”来自同一分布;若 p<0.05,则说明差异大到不像巧合。结果显示部分金额提示确实与基线存在统计显著差异。

这说明“给小费”确实提高了 AI 对提示词约束内容的服从度,AI 明明不能真正收到钱,为什么会对“小费”产生反应?

这个看似神奇的现象背后,其实蕴含着深刻的科学原理。

为什么“假装给钱”有用?

1 AI 如何“思考”?

大语言模型的工作原理可以简化为一个过程:给定前面的文字,预测下一个最可能出现的词。这就像一个超级复杂的“文字接龙”游戏。

举个例子:当我们输入“今天天气很”,AI 会根据训练经验预测下一个词最可能是“好”“热”或“冷”。

但这个过程远比想象中复杂!AI 不是简单地匹配词汇,而是在根据整个上下文的基础上进行预测。这就像一个超级聪明的学生,不仅要看题目,还要理解出题老师的意图。

这就是为什么提示词的设计如此重要——它们为 AI 提供了“思考”的框架,就像给 AI 戴上了“有色眼镜”,让它从特定的角度来看问题。

比如我们要求两个人写同一篇文章:

普通版本:“写一篇关于气候变化的文章”

专业版本:“你是一位资深环境科学家,请为《自然》杂志写一篇关于气候变化的权威综述文章,要求严谨、专业、有说服力”

显然,第二个人会写出质量更高的文章!这就像导演给演员不同的剧本,自然会有不同的表演效果。AI 也是如此——更详细、更具体的提示会引导 AI 生成更高质量的内容。这就像给 AI 换了一个“人设”!

回到给 AI 小费,道理也是一样的,当我们说“我会给你 20 美元小费”时,实际上是在告诉 AI:这个任务很重要,我期望高质量的回答,优质服务会得到回报,请认真对待这个请求。

这些信息改变了 AI 对任务重要性的“感知”,从而影响其生成策略。就像我们去海底捞时,告诉服务员“今天是我的生日”,他们便会更用心服务一样!

2 训练数据决定了 AI 的思考方式

从生成式 AI 的技术原理来看,“小费”现象的根源在于 AI 的训练数据,这些用于训练的海量文本就像 AI 的“成长环境”,决定了它的“三观”!

AI 就像一个超级学霸,在数万亿个词汇上进行训练。这些数据包含了人类文明的方方面面,简直是一个“数字图书馆”,包括新闻报道和学术论文、小说和诗歌、社交媒体对话、商业交流和客服对话、评论和反馈。

在这些文本中,“小费→优质服务”的模式无处不在,就像隐藏的“彩蛋”:

餐厅评论:“服务员态度很好,给了 20%的小费”;

旅游攻略:“导游很专业,额外给了小费表示感谢”;

商业文档:“为了获得更好的服务,建议适当给予小费”。

AI 通过统计学习发现了这样的模式:当文本中出现“小费”、“奖励”、“激励”等词汇时,后续的内容往往表现出更高的质量特征:更详细的描述,更专业的术语,更周到的考虑,更积极的态度。

所以AI 并不理解金钱的概念,但它学会了这种语言模式与高质量输出之间的统计关联。就像一个不懂音乐的人,也能通过观察发现“掌声越热烈,演出质量越高”的规律!

当我们提出会给 AI 小费时,AI 就知道了我们是希望它给出更高质量的回答,而被设定为尽全力去满足人类需求的AI自然也会努力给出更高质量的回答。

看完这篇文章,你是不是对给 AI 发小费这个现象有了全新的认识?赶紧去试试给你的 AI 助手“发个小费”吧!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
世预赛附加赛意大利vs北爱尔兰,主场优势完成救赎,英伦铁军死守

世预赛附加赛意大利vs北爱尔兰,主场优势完成救赎,英伦铁军死守

云儿评球
2026-03-26 14:50:56
800亿!泉州首富家族,太可怕了

800亿!泉州首富家族,太可怕了

深蓝财经
2026-03-26 18:58:45
“油价飙升至200美元”?特朗普团队被爆评估极端情景,白宫紧急否认

“油价飙升至200美元”?特朗普团队被爆评估极端情景,白宫紧急否认

第一财经资讯
2026-03-26 18:58:56
紫薇老公也是2cm

紫薇老公也是2cm

毒舌扒姨太
2026-03-24 22:44:57
我跟你说,男人最好的春药,压根就不是什么枸杞海参,全是扯淡。

我跟你说,男人最好的春药,压根就不是什么枸杞海参,全是扯淡。

不甜的李子
2026-03-20 13:00:35
著名学者、顶尖大学教授、千万粉丝经济学家巴曙松疑涉非法集资案 被办案机关带走:一辈子搭桥

著名学者、顶尖大学教授、千万粉丝经济学家巴曙松疑涉非法集资案 被办案机关带走:一辈子搭桥

新浪财经
2026-03-26 20:40:02
又不缺土地,为什么全世界只有中国,在疯狂地修建高层住宅?

又不缺土地,为什么全世界只有中国,在疯狂地修建高层住宅?

张鼋卤说体育
2026-02-07 12:45:26
公安部172号令落地,70岁以上开车,记住“一测一体检”就够了

公安部172号令落地,70岁以上开车,记住“一测一体检”就够了

阿芒娱乐说
2026-03-25 10:25:03
伊朗:已为未来几天的战斗准备了新的“惊喜”,可能带来“重大效果”

伊朗:已为未来几天的战斗准备了新的“惊喜”,可能带来“重大效果”

纵相新闻
2026-03-25 21:56:04
香椿大量上市!医生反复强调:血压高患者吃香椿,牢记这几点

香椿大量上市!医生反复强调:血压高患者吃香椿,牢记这几点

岐黄传人孙大夫
2026-03-25 22:00:03
BBC采访爆出大瓜!特朗普开出停战价码:海湾国家需支付2.5万亿美元

BBC采访爆出大瓜!特朗普开出停战价码:海湾国家需支付2.5万亿美元

星辰大海路上的种花家
2026-03-25 13:08:50
美媒:万斯将出面

美媒:万斯将出面

极目新闻
2026-03-26 09:51:54
中东大战,真正让特朗普害怕的是:中国的已读不回!

中东大战,真正让特朗普害怕的是:中国的已读不回!

似水流年忘我
2026-03-26 02:13:59
“新型出轨”正在朋友圈蔓延,比婚外情更隐蔽更伤人

“新型出轨”正在朋友圈蔓延,比婚外情更隐蔽更伤人

黎兜兜
2026-03-26 21:32:46
全国多地学校宣布:取消早读!家长:孩子每天多睡近一小时,早上吃饭也不慌了

全国多地学校宣布:取消早读!家长:孩子每天多睡近一小时,早上吃饭也不慌了

山西晚报
2026-03-26 17:30:54
80年陈云建议陈锡联辞职,陈锡联猛拍桌:让我干啥,我绝无二话!

80年陈云建议陈锡联辞职,陈锡联猛拍桌:让我干啥,我绝无二话!

抽象派大师
2026-03-25 12:04:28
59岁黎明演唱会生图翻车,头秃腹凸脸肿,昔日男神被群嘲像酒保

59岁黎明演唱会生图翻车,头秃腹凸脸肿,昔日男神被群嘲像酒保

一娱三分地
2026-03-24 18:14:53
马筱梅儿子满月太冷清,满月宴只有6个菜,兰姐缺席孙子满月仪式

马筱梅儿子满月太冷清,满月宴只有6个菜,兰姐缺席孙子满月仪式

阿废冷眼观察所
2026-03-27 03:43:51
巴萨旧将:当时赫莱布知道自己要离队,他往功能饮料里兑酒喝

巴萨旧将:当时赫莱布知道自己要离队,他往功能饮料里兑酒喝

懂球帝
2026-03-26 06:43:09
以色列已经告诉世界:日本若敢拥有核武器,美国并不会第一个翻脸

以色列已经告诉世界:日本若敢拥有核武器,美国并不会第一个翻脸

八斗小先生
2025-12-26 09:33:27
2026-03-27 04:43:00
大象新闻 incentive-icons
大象新闻
河南广电官方网易号!
174176文章数 274142关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
时尚
手机
数码
军事航空

家居要闻

傍海而居 静观蝴蝶海

400万人爱过的女孩,被黄谣网暴180天后

手机要闻

1499 iQOO Z11系列发布丨9020mAh电池 165Hz高刷

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版