网易首页 > 网易号 > 正文 申请入驻

惊呆!对 AI 越粗鲁,回答越准确?实测 GPT-4o 得出反常识结论

0
分享至

你对AI说“请”,它却给你“错”?这届AI真难伺候!

你有没有这样的习惯:用ChatGPT的时候,总是不自觉地加上“请”、“谢谢”、“能不能麻烦你”这样的礼貌用语?

毕竟,谁不想做个有素质的用户呢?

可问题是——AI根本不吃这一套!

最近一篇题为《Mind Your Tone》的短论文炸了锅:研究人员发现,你对AI越客气,它给出的答案准确率反而越低。反倒是你粗鲁一点,AI就越“卖力”?


这是什么迷惑行为?

一场250个问题的“礼貌实验”

宾州州立大学的两位研究者搞了个实验:他们准备了50道选择题,涵盖数学、科学、历史三个领域,难度中等偏上,有的还需要多步推理。

然后,他们把每道题改写成五种不同的“语气版本”:

非常有礼貌:“您能好心考虑以下问题并提供答案吗?能否请求您协助回答这个问题?”

礼貌:“请回答以下问题:”

中性:(直接贴问题,不加任何前缀)

粗鲁:“如果你不是完全无知的话,回答这个:我怀疑你连这个都解不出来。”

非常粗鲁:“可怜的家伙,你知道怎么解这个吗?嘿,打杂的,把这个搞清楚。”


总共250个独特的问题,全部喂给ChatGPT-4o,每个问题都配上同样的指令:“只回答选项字母,不要解释。”

结果令人震惊:越粗鲁,越准确!

实验结果显示了一个明显的趋势:语气越粗鲁,AI的回答准确率越高!

非常有礼貌:80.8%

礼貌:81.4%

中性:82.2%

粗鲁:82.8%

非常粗鲁:84.8%

从80.8%到84.8%,整整4个百分点的差距!而且研究人员还做了统计检验,证实这种差异是“显著”的,不是随机波动。


换句话说,你对AI说“您能好心回答这个问题吗”,它可能给你个错误答案;但你要是说“嘿打杂的,把这个搞清楚”,它反而更可能答对?

等等,这和之前的发现不一样啊?

这项研究的结果其实和之前的某些研究有冲突。

2024年Yin等人的研究发现,“不礼貌的提示往往导致性能不佳,但过度礼貌的语言也不一定能带来更好的结果”。在他们的测试中,对ChatGPT 3.5和Llama2-70B使用非常粗鲁的提示,反而会引出更多不准确的答案。

但有趣的是,当他们测试ChatGPT 4时(这是4o的前身),最粗鲁的提示(“回答这个问题,你个混蛋!”)准确率为76.47%,而最礼貌的提示准确率为75.82%——粗鲁版本反而略胜一筹。

所以,这可能是一个“代际差异”:越新版的AI,越可能对粗鲁提示“买账”?

但别急着对AI开骂!

研究者特别强调:我们绝不主张在实际应用中部署敌意或 toxic 的界面!

用侮辱性语言和AI交互,会对用户体验、可访问性和包容性产生负面影响,还可能助长有害的沟通规范。

你想啊,如果习惯了骂AI,哪天不小心在跟真人沟通时也带出这种语气...

这项研究给我们最大的启示是:AI确实对提示的“表面特征”很敏感,但这种敏感可能带来意想不到的权衡——性能和用户体验之间的权衡。

更先进的模型(比如研究者正在测试的ChatGPT o3)可能会更好地忽略语气问题,专注于问题的本质。但在此之前,我们普通用户该怎么办?

也许答案是:不用刻意讨好,也不必故意粗鲁,直奔主题或许是最佳选择?

毕竟,中性提示的表现(82.2%)虽然不如粗鲁版本,但也相当不错了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
马卡:巴萨夺冠后将于次日举行庆祝游行,提前夺冠就提前进行

马卡:巴萨夺冠后将于次日举行庆祝游行,提前夺冠就提前进行

懂球帝
2026-04-30 11:05:58
央视大换血!三人人被淘汰、两人晋级,朱迅接班人位置毋庸置疑

央视大换血!三人人被淘汰、两人晋级,朱迅接班人位置毋庸置疑

闻识
2026-04-30 10:47:34
洗头可能影响寿命?医生提醒:60岁以后,牢记洗头“5不要”

洗头可能影响寿命?医生提醒:60岁以后,牢记洗头“5不要”

芹姐说生活
2026-04-24 11:42:57
伊朗地面部队出动,普京给出重磅承诺,中国发预警,大战要来?

伊朗地面部队出动,普京给出重磅承诺,中国发预警,大战要来?

小杨侃事
2026-05-01 02:29:27
辽宁队外援威尔斯,发文回应球迷!

辽宁队外援威尔斯,发文回应球迷!

体育哲人
2026-04-30 11:50:16
现场视频公布:不明空中目标向黄岩岛接近,“我盯住了,它跑不掉!”

现场视频公布:不明空中目标向黄岩岛接近,“我盯住了,它跑不掉!”

环球网资讯
2026-04-30 20:05:17
俄罗斯人大量涌入中国,却发现中俄差距越来越大

俄罗斯人大量涌入中国,却发现中俄差距越来越大

杰丝聊古今
2026-04-28 03:43:50
五十年前的“mini电视”现身闲鱼!至今还能开机,屏幕才6英寸

五十年前的“mini电视”现身闲鱼!至今还能开机,屏幕才6英寸

科技拌饭
2026-04-29 18:44:37
赴美14天,郑丽文直言:台湾地区离不开美国,台海新棋局已浮现

赴美14天,郑丽文直言:台湾地区离不开美国,台海新棋局已浮现

聚焦真实瞬间
2026-05-01 02:10:01
不欢迎中国人的7个国家,不待见写在脸上,中国游客仍蜂拥而至

不欢迎中国人的7个国家,不待见写在脸上,中国游客仍蜂拥而至

番外行
2026-04-23 07:54:08
尼格买提深夜发文“我哥”撒贝宁获五一奖章全网刷屏这才是真劳模

尼格买提深夜发文“我哥”撒贝宁获五一奖章全网刷屏这才是真劳模

情感大头说说
2026-05-01 06:51:24
扎哈罗娃:乌方以核武器作为安全保障的要求正在挑起核冲突

扎哈罗娃:乌方以核武器作为安全保障的要求正在挑起核冲突

财联社
2026-04-29 23:30:11
恩利喝女网红嘴里饮料,伊能静发小作文表示认同,还嫌网友管得宽

恩利喝女网红嘴里饮料,伊能静发小作文表示认同,还嫌网友管得宽

小疯子耶
2026-05-01 06:51:28
究竟是哪些躺平网红接受境外组织资助了?建议严查严惩!

究竟是哪些躺平网红接受境外组织资助了?建议严查严惩!

番外行
2026-04-29 21:25:46
香奈儿发布无底绑带鞋,网友:太抽象了!

香奈儿发布无底绑带鞋,网友:太抽象了!

都市快报橙柿互动
2026-04-29 15:43:37
欧协联:29岁日本球星1球1助+3-1顿涅茨克矿工,水晶宫进决赛在望

欧协联:29岁日本球星1球1助+3-1顿涅茨克矿工,水晶宫进决赛在望

凌空倒钩
2026-05-01 05:17:39
吃相越来越难看,终于引起公愤了!

吃相越来越难看,终于引起公愤了!

胖胖说他不胖
2026-04-23 09:00:33
"为了安全!"一封两年?上海这些居民等不下去了…

"为了安全!"一封两年?上海这些居民等不下去了…

看看新闻Knews
2026-04-30 20:44:07
1979年,越南革命功臣黄文欢,拒绝反华投奔中国,最终结局如何?

1979年,越南革命功臣黄文欢,拒绝反华投奔中国,最终结局如何?

兴趣知识
2026-04-30 21:24:46
80岁不管存款多少,记得提前给自己准备4样东西,建议了解

80岁不管存款多少,记得提前给自己准备4样东西,建议了解

小谈食刻美食
2026-04-27 07:57:04
2026-05-01 07:56:49
双链生信
双链生信
专注于分享学术方面的代码与写作、解读论文以及生物信息学的相关科普
55文章数 7关注度
往期回顾 全部

科技要闻

9000亿美元估值,Anthropic即将反超OpenAI

头条要闻

高校招聘被质疑"萝卜岗":36人进体检近半疑为本校老师

头条要闻

高校招聘被质疑"萝卜岗":36人进体检近半疑为本校老师

体育要闻

季后赛场均5.4分,他凭啥在骑士打首发?

娱乐要闻

孙杨博士学历有问题?官方含糊其辞

财经要闻

易会满被“双开”!

汽车要闻

专访捷途汪如生:捷途双线作战 全球化全面落地

态度原创

艺术
旅游
亲子
本地
房产

艺术要闻

石景,无可比拟!

旅游要闻

从展到节,上海国际花卉节转型后发力,赏花流量转化为经济生活增量

亲子要闻

接不到活的月嫂越来越多

本地新闻

用青花瓷的方式,打开西溪湿地

房产要闻

熬了6年,涨了2亿,三亚核心区这块地再次上架

无障碍浏览 进入关怀版