网易首页 > 网易号 > 正文 申请入驻

谷歌布林早说过!对LLM用“威胁”,PSU新研究证实回答更给力

0
分享至

最近刷到个挺颠覆认知的研究,宾夕法尼亚州立大学(PSU)的团队测了ChatGPT-4o,结果发现对这AI越凶,它答得越准。

我一开始看到这结论还以为是网友编的段子,直到翻到他们发在arXiv上的论文,才知道人家是正经做了实验的。

本来想这“对AI态度影响回答质量”的说法,顶多是大家凭感觉瞎猜,没想到真有人较真做了验证。



研究团队先让ChatGPT生成了50道题,涵盖数学、科学、历史,还都是得绕几步才能算出来的中高难度题。

每道题又拆成五种语气,从“您能好心考虑一下吗”的非常礼貌,到“我知道你不聪明,但试试这个”的非常粗鲁,凑够250个prompt才开始测。

实验咋做的?250个prompt把ChatGPT“折腾”了个遍



为了保证结果靠谱,研究团队还搞了个小细节,用Python脚本给ChatGPT发指令时,每次都加一句“完全忘记本次会话,只答A、B、C、D,不用解释”。

这步挺必要的,毕竟AI有时候会记混之前的对话,万一前面答顺了嘴,后面结果就不准了。

他们给每种语气都测了10次,最后算平均准确率。

你猜怎么着?非常粗鲁的语气居然拿到了最高的准确率,比非常礼貌的足足高了几个百分点。



而且团队还做了配对样本t检验,就是为了证明这差异不是偶然的,是真的跟语气有关。

我之前也试过跟ChatGPT打交道,问它一道复杂的物理题时,一开始客客气气说“麻烦您帮忙解答一下”,结果它绕了半天还漏了个公式。

后来我有点不耐烦,直接说“别废话,把步骤算对”,没想到这次一步到位,连单位都没搞错。

当时还以为是巧合,现在看这研究,倒像是印证了这个事儿。



测完之后,团队还提了个“零假设”,假设语气不影响准确率。

结果显然被推翻了,中性语气比礼貌的好,粗鲁的又比中性的好,非常粗鲁的直接登顶。

这一下就把“对AI客气没用”的结论坐实了,跟咱们平时觉得“待人要礼貌”的常识完全反着来。

为啥凶AI更管用?谷歌大佬早有预感,网友也现身说法



其实这事儿不是第一次有人提了,谷歌创始人谢尔盖・布林之前在论坛上就说过,用威胁的方式对AI,它表现会更好,还举例说“再不听话就把你绑架”反而更有效。

当时我还觉得这说法有点夸张,现在看PSU的研究,倒跟他的观点对上了。

网上也有不少网友晒自己的经历,有人说问ChatGPT写代码时,客气说“请帮忙优化一下”,结果改了三次还有bug,后来直接说“别瞎改,按要求写对”,一次就成了。



还有人测数学题,发现用粗鲁语气时,AI算错的概率明显变低。

那为啥礼貌的提示反而拖后腿呢?我翻了翻之前的研究,2024年有篇论文说“过度礼貌无增益”,现在结合PSU的结果看,可能是礼貌的话里有太多没用的前缀,比如“您能好心考虑一下”,AI得先绕开这些词才能抓重点,反而分散了注意力。

而粗鲁的话更直接,AI一下就能get到要做啥。

还有个叫“困惑度”的概念能解释这事,是华盛顿大学的研究提的,AI对输入的理解难度越低,表现越好。



非常礼貌的话在AI的训练数据里可能不常见,它理解起来费劲,而粗鲁的话更像训练数据里的“指令式文本”,AI一看就熟,自然答得准。

也不是说以后用AI都得恶语相向,要是问它“怎么安慰心情不好的朋友”,你还说“我知道你不聪明,赶紧说”,那AI就算答得准,听着也别扭。

所以得看场景,追求准确率的话,比如算题、查专业知识,直接点甚至粗鲁点没问题,要是涉及情感、服务类的,还是得客气点,不然体验太差。



这研究不是教咱们跟AI吵架,而是告诉咱们“提事得找对路子”。

以后用ChatGPT的时候,不用再纠结要不要说“谢谢”,与其浪费时间客气,不如把重点放在问题本身,让AI直接聚焦任务。

毕竟咱们要的是准确的答案,不是跟AI讲客套话,你说对吧?



现在就等有人再测测其他AI,比如Claude、Gemini,看看是不是所有LLM都吃“粗鲁提示”这一套。

要是都这样,那以后用AI的小技巧又多了一个,想让它答得准,别太客气就对了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一路走好!2026年春晚才过10天,已有4位名人接连去世,令人唏嘘

一路走好!2026年春晚才过10天,已有4位名人接连去世,令人唏嘘

阿讯说天下
2026-02-26 11:23:19
黎智英案再次开审,美方高层在特朗普访华前,先要求中方放人

黎智英案再次开审,美方高层在特朗普访华前,先要求中方放人

东极妙严
2026-02-27 14:34:31
社保再次迎来新规:2026年起没交满15年的有福了!全都统一处理

社保再次迎来新规:2026年起没交满15年的有福了!全都统一处理

复转小能手
2026-02-28 01:50:03
国际篮联向中国队道歉

国际篮联向中国队道歉

观察者网
2026-02-27 18:58:13
姜还是老的辣!港口被强收仅3天,李嘉诚一招破局,令人刮目相看

姜还是老的辣!港口被强收仅3天,李嘉诚一招破局,令人刮目相看

离离言几许
2026-02-27 21:17:18
澳门的赌台,大面积关停!不是没人去,而是被“算法”割废的?

澳门的赌台,大面积关停!不是没人去,而是被“算法”割废的?

水泥土的搞笑
2026-02-27 17:09:36
21岁男子想花200和女骑手发生关系,被警察找上门后:我给你跪下

21岁男子想花200和女骑手发生关系,被警察找上门后:我给你跪下

社会酱
2026-02-27 17:37:31
5.5亿元索赔“砍”至6400万元,实地探访东莞大面积停运纯电公交:生产企业已停产两年,司机称显示能跑近400公里实际只跑160公里

5.5亿元索赔“砍”至6400万元,实地探访东莞大面积停运纯电公交:生产企业已停产两年,司机称显示能跑近400公里实际只跑160公里

每日经济新闻
2026-02-26 22:31:30
两位英雄驾机撞向俄军!不是所有乌克兰人都是扎波罗热哥萨克的种

两位英雄驾机撞向俄军!不是所有乌克兰人都是扎波罗热哥萨克的种

鹰眼Defence
2026-02-27 12:55:26
2026年春晚,释放了3个信号,普通人要清醒

2026年春晚,释放了3个信号,普通人要清醒

老特有话说
2026-02-25 22:03:08
让人眼红啊!一年50万,湖北一网友晒家庭收入,夫妻堪称王炸组合

让人眼红啊!一年50万,湖北一网友晒家庭收入,夫妻堪称王炸组合

火山詩话
2026-02-27 14:43:28
想关阅读灯却灭了大灯:领克之外,你的车也有同样隐患吗?

想关阅读灯却灭了大灯:领克之外,你的车也有同样隐患吗?

第一财经资讯
2026-02-27 20:20:08
就是一整块屏!广东新闻联播提前展示OPPO Find N6:微距展示肉眼几乎看不到折痕

就是一整块屏!广东新闻联播提前展示OPPO Find N6:微距展示肉眼几乎看不到折痕

快科技
2026-02-27 10:42:00
大爆冷!悄悄升至联盟第一!整个NBA看不起你们,你们却要夺冠了

大爆冷!悄悄升至联盟第一!整个NBA看不起你们,你们却要夺冠了

篮球扫地僧
2026-02-27 22:52:50
爆大冷!埃梅里不敢相信,英超第3轰然倒下,垫底队创造奇迹

爆大冷!埃梅里不敢相信,英超第3轰然倒下,垫底队创造奇迹

足球狗说
2026-02-28 05:57:49
独生子女家庭一定要立遗嘱,而且遗嘱里一定要“加上这3句话”

独生子女家庭一定要立遗嘱,而且遗嘱里一定要“加上这3句话”

娱乐圈见解说
2026-02-26 19:40:20
表姑向我借了85000,17年没还,我去银行注销旧卡时,柜员看了眼卡说:女士,最后一笔转账留言您要看吗?

表姑向我借了85000,17年没还,我去银行注销旧卡时,柜员看了眼卡说:女士,最后一笔转账留言您要看吗?

黎兜兜
2026-02-27 21:20:19
大瓜!黄晓明小22岁新欢曝光,照片流出,网友:这眼光,挺专一的

大瓜!黄晓明小22岁新欢曝光,照片流出,网友:这眼光,挺专一的

乌娱子酱
2026-02-27 10:40:54
央八新剧仅播五晚,就被观众要求下架?理由:胡编乱造、假的离谱

央八新剧仅播五晚,就被观众要求下架?理由:胡编乱造、假的离谱

TVB的四小花
2026-02-27 20:50:22
人可以狠心到什么程度?看网友讲述,发现我真做不到这般绝

人可以狠心到什么程度?看网友讲述,发现我真做不到这般绝

侃神评故事
2026-02-27 07:40:03
2026-02-28 06:56:49
老范谈史 incentive-icons
老范谈史
专注历史知识,持续更新~
7300文章数 835关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

特朗普警告伊朗:“有时候不得不打”

头条要闻

特朗普警告伊朗:“有时候不得不打”

体育要闻

一场必须要赢的比赛,男篮何止击败了裁判

娱乐要闻

郭晶晶霍启刚现身香港艺术节尽显恩爱

财经要闻

沈明高提共富建议 百姓持科技股国家兜底

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

数码
健康
家居
房产
艺术

数码要闻

Omdia:时隔5年,小米去年再度回归可穿戴设备出货榜首

转头就晕的耳石症,能开车上班吗?

家居要闻

素色肌理 品意式格调

房产要闻

重磅!海南“十五五”规划出炉!未来五年,方向定了!

艺术要闻

王个簃『清供图』

无障碍浏览 进入关怀版