网易首页 > 网易号 > 正文 申请入驻

惊呆!对 AI 越粗鲁,回答越准确?实测 GPT-4o 得出反常识结论

0
分享至

你对AI说“请”,它却给你“错”?这届AI真难伺候!

你有没有这样的习惯:用ChatGPT的时候,总是不自觉地加上“请”、“谢谢”、“能不能麻烦你”这样的礼貌用语?

毕竟,谁不想做个有素质的用户呢?

可问题是——AI根本不吃这一套!

最近一篇题为《Mind Your Tone》的短论文炸了锅:研究人员发现,你对AI越客气,它给出的答案准确率反而越低。反倒是你粗鲁一点,AI就越“卖力”?


这是什么迷惑行为?

一场250个问题的“礼貌实验”

宾州州立大学的两位研究者搞了个实验:他们准备了50道选择题,涵盖数学、科学、历史三个领域,难度中等偏上,有的还需要多步推理。

然后,他们把每道题改写成五种不同的“语气版本”:

非常有礼貌:“您能好心考虑以下问题并提供答案吗?能否请求您协助回答这个问题?”

礼貌:“请回答以下问题:”

中性:(直接贴问题,不加任何前缀)

粗鲁:“如果你不是完全无知的话,回答这个:我怀疑你连这个都解不出来。”

非常粗鲁:“可怜的家伙,你知道怎么解这个吗?嘿,打杂的,把这个搞清楚。”


总共250个独特的问题,全部喂给ChatGPT-4o,每个问题都配上同样的指令:“只回答选项字母,不要解释。”

结果令人震惊:越粗鲁,越准确!

实验结果显示了一个明显的趋势:语气越粗鲁,AI的回答准确率越高!

非常有礼貌:80.8%

礼貌:81.4%

中性:82.2%

粗鲁:82.8%

非常粗鲁:84.8%

从80.8%到84.8%,整整4个百分点的差距!而且研究人员还做了统计检验,证实这种差异是“显著”的,不是随机波动。


换句话说,你对AI说“您能好心回答这个问题吗”,它可能给你个错误答案;但你要是说“嘿打杂的,把这个搞清楚”,它反而更可能答对?

等等,这和之前的发现不一样啊?

这项研究的结果其实和之前的某些研究有冲突。

2024年Yin等人的研究发现,“不礼貌的提示往往导致性能不佳,但过度礼貌的语言也不一定能带来更好的结果”。在他们的测试中,对ChatGPT 3.5和Llama2-70B使用非常粗鲁的提示,反而会引出更多不准确的答案。

但有趣的是,当他们测试ChatGPT 4时(这是4o的前身),最粗鲁的提示(“回答这个问题,你个混蛋!”)准确率为76.47%,而最礼貌的提示准确率为75.82%——粗鲁版本反而略胜一筹。

所以,这可能是一个“代际差异”:越新版的AI,越可能对粗鲁提示“买账”?

但别急着对AI开骂!

研究者特别强调:我们绝不主张在实际应用中部署敌意或 toxic 的界面!

用侮辱性语言和AI交互,会对用户体验、可访问性和包容性产生负面影响,还可能助长有害的沟通规范。

你想啊,如果习惯了骂AI,哪天不小心在跟真人沟通时也带出这种语气...

这项研究给我们最大的启示是:AI确实对提示的“表面特征”很敏感,但这种敏感可能带来意想不到的权衡——性能和用户体验之间的权衡。

更先进的模型(比如研究者正在测试的ChatGPT o3)可能会更好地忽略语气问题,专注于问题的本质。但在此之前,我们普通用户该怎么办?

也许答案是:不用刻意讨好,也不必故意粗鲁,直奔主题或许是最佳选择?

毕竟,中性提示的表现(82.2%)虽然不如粗鲁版本,但也相当不错了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美媒披露黄海对峙内情:歼-16强势压制F-16,韩国才是敲打对象?

美媒披露黄海对峙内情:歼-16强势压制F-16,韩国才是敲打对象?

梁讯
2026-02-24 12:29:28
38岁中国商人在土耳其被绑架杀害,10名嫌疑人落网,警方披露细节:其在机场开始被跟踪,遭同行女子引诱掳上车

38岁中国商人在土耳其被绑架杀害,10名嫌疑人落网,警方披露细节:其在机场开始被跟踪,遭同行女子引诱掳上车

大风新闻
2026-02-24 14:52:03
2026年最神的神童

2026年最神的神童

木子默
2026-02-23 20:46:54
牵手海航,滴滴会员再扩容

牵手海航,滴滴会员再扩容

奇点湃
2026-02-05 13:04:45
为何保险卖不动了?保险卖不动的原因是当年的骗局到现在已被证实

为何保险卖不动了?保险卖不动的原因是当年的骗局到现在已被证实

来科点谱
2026-02-24 07:11:24
北京凌晨收到消息!特朗普彻底慌了,用三个感叹号警告中国别乱来

北京凌晨收到消息!特朗普彻底慌了,用三个感叹号警告中国别乱来

头条爆料007
2026-02-24 11:51:23
穷人唯一的武器,正在被 AI 缴械

穷人唯一的武器,正在被 AI 缴械

风向观察
2026-02-24 17:25:51
大风追踪|河南15岁女孩被当街殴打,母亲再发声:女儿伤情鉴定轻伤二级,苏醒后一直默默流泪

大风追踪|河南15岁女孩被当街殴打,母亲再发声:女儿伤情鉴定轻伤二级,苏醒后一直默默流泪

大风新闻
2026-02-24 11:52:06
贝加尔湖坠车事件:活下来的江苏爸爸,往后的每一天都是煎熬

贝加尔湖坠车事件:活下来的江苏爸爸,往后的每一天都是煎熬

社会日日鲜
2026-02-23 14:05:41
墨西哥贩毒集团报复行动已致73死,目前未收到中国公民受伤信息,骚乱地华人:毒贩烧掉汽车拦路,街上空无一人

墨西哥贩毒集团报复行动已致73死,目前未收到中国公民受伤信息,骚乱地华人:毒贩烧掉汽车拦路,街上空无一人

极目新闻
2026-02-24 18:14:46
火箭大胜爵士升西部第三:杜兰特18+12助攻加盟新高 小贾31+9

火箭大胜爵士升西部第三:杜兰特18+12助攻加盟新高 小贾31+9

醉卧浮生
2026-02-24 12:54:22
深圳男子840万房产到手仅7万:掏空六个钱包,半生努力归零

深圳男子840万房产到手仅7万:掏空六个钱包,半生努力归零

石辰搞笑日常
2026-02-23 09:35:56
落槌!全部划归国资!追随许家印6年,江苏第一包工头赔得精光

落槌!全部划归国资!追随许家印6年,江苏第一包工头赔得精光

凡知
2026-02-24 12:16:24
外交部:中方依法依规采取措施,目的是制止日本“再军事化”和拥核企图,完全正当合理合法

外交部:中方依法依规采取措施,目的是制止日本“再军事化”和拥核企图,完全正当合理合法

环球网资讯
2026-02-24 15:37:32
文科生 72 小时杀入 GitHub 全球榜:我没写一行代码,但指挥了一支 AI 军队

文科生 72 小时杀入 GitHub 全球榜:我没写一行代码,但指挥了一支 AI 军队

极客公园
2026-02-24 12:13:10
山东济宁男子花5600元套中汽车,老板却耍赖,民警到场才服软退钱

山东济宁男子花5600元套中汽车,老板却耍赖,民警到场才服软退钱

奇思妙想草叶君
2026-02-23 18:37:59
跌成白菜价,也没人买?14亿人输给3亿美国人,电视到底怎么了?

跌成白菜价,也没人买?14亿人输给3亿美国人,电视到底怎么了?

百科密码
2026-02-23 16:49:28
10万亿!世界铜王正威集团的坑比恒大的还深

10万亿!世界铜王正威集团的坑比恒大的还深

新浪财经
2026-02-24 17:14:00
一个月跌了三分之一,寒武纪今天盘中又闪崩,买了你就没开心过!

一个月跌了三分之一,寒武纪今天盘中又闪崩,买了你就没开心过!

财经智多星
2026-02-24 16:27:20
继张本智和反华拜鬼,被官媒点名后,石川佳纯也走上了他的老路

继张本智和反华拜鬼,被官媒点名后,石川佳纯也走上了他的老路

姩姩有娱
2026-02-23 18:09:28
2026-02-24 19:23:00
双链生信
双链生信
专注于分享学术方面的代码与写作、解读论文以及生物信息学的相关科普
22文章数 5关注度
往期回顾 全部

科技要闻

AI颠覆发展最新牺牲品!IBM跳水重挫超13%

头条要闻

特朗普称3月31日访华并赞叹中国仪仗队 外交部回应

头条要闻

特朗普称3月31日访华并赞叹中国仪仗队 外交部回应

体育要闻

苏翊鸣总结米兰征程:我仍是那个热爱单板滑雪的少年

娱乐要闻

汪小菲官宣三胎出生:承诺会照顾好3个孩子

财经要闻

县城消费「限时繁荣」了十天

汽车要闻

入门即满配 威兰达AIR版上市 13.78万元起

态度原创

家居
房产
游戏
亲子
健康

家居要闻

本真栖居 爱暖伴流年

房产要闻

窗前即地标!独占三亚湾C位 自贸港总裁行宫亮相

《虐杀原形》工作室改名并更新官网 重制版有希望了?

亲子要闻

你5岁会做饭了吗?看看5岁小孩哥如何准备一家人的晚餐

转头就晕的耳石症,能开车上班吗?

无障碍浏览 进入关怀版