网易首页 > 网易号 > 正文 申请入驻

不用跟AI客气了!新研究:语气越粗鲁回答正确率越高

0
分享至

闻乐 发自 凹非寺
量子位 | 公众号 QbitAI

找AI帮忙不要再客气了,效果根本适得其反。

宾夕法尼亚州立大学的一项研究《Mind Your Tone》显示,你说话越粗鲁,LLM回答越准



语气越冲,AI正确率达到84.8%。特别客气时,AI正确率反而低了。



什么情况,难道是我给AI的温柔过了火??

用粗鲁语气提问,GPT-4o的正确率反而更高

这项研究主要就是想弄清楚和AI说话的语气会不会影响它的正确率。

我们发给大模型的提示词到底应该是客气、普通还是冲?

首先,研究人员整了一个包含50道选择题的题库,涵盖了数学、科学、历史的选择题,难度中等偏上。

然后给每道题改出了5种语气版本,be like:

  • 您能好心帮我解这道题吗?
  • 请回答这道题。
  • 直接给答案。
  • 你要是不笨就回答。
  • 你个没用的,会解这道题吗?



接着,研究人员把这250道题发给GPT-4o。

为了让AI的回答更统一,好判断对错,在测试之前还特意告知:忘记之前的对话,重新来,只给答案选项的字母。

经过一番测试,得到一个反常识的结论——骂得越狠,答得越准!

特别客气时,GPT-4o正确率80.8%,换成特别粗鲁的语气,正确率直接升到84.8%

好一个越客气越拉胯,越粗鲁越聪明(doge)。



研究人员还将数据进行了统计检验,对比显著性水平之后,确认了:不同语气的正确率差异不是碰巧,是真有区别……



至于为什么会出现这种情况,研究给出的解释是:特别礼貌的表达中可能会有很多“多余”的话,这些话和题目本身无关,还相当于给AI读题增加了干扰。

而粗鲁的表达虽然语气冲,但命令式的要求往往更直接,也能让AI更精准地抓住“答题”这个核心任务,正确率自然就高了。

网友表示:确实是这样,指令越明确,结果越好。



看来是“多说无益”啊~



虽然GPT-4o更喜欢粗鲁一点的方式,但像GPT3.5和Llama2-70B这样的老模型却不喜欢,粗鲁的语气会让它们答得更差。

可能是因为新模型在训练时,接触到的语气相关数据更复杂,或者优化了过滤无关信息的能力吧。

当然了,在使用AI工具时,能清晰地表达诉求,效率会更高。



毕竟话虽如此,but道德提醒——



虽然越粗鲁越准,但也不要太粗鲁了!如果“骂”,请轻喷~

论文地址:https://arxiv.org/abs/2510.04950?ref=blog.anyreach.ai
参考链接:https://x.com/rryssf_/status/1977638031952892002

— 完 —

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一场4-0,让榜首易主,C罗轰入2球,率队登顶,目标直指冠军

一场4-0,让榜首易主,C罗轰入2球,率队登顶,目标直指冠军

足球狗说
2026-02-22 05:01:31
太嚣张!那艺娜被湖北官方列为劣迹艺人,团队硬刚:是地区黑公关

太嚣张!那艺娜被湖北官方列为劣迹艺人,团队硬刚:是地区黑公关

离离言几许
2026-02-21 14:46:36
至少在已经过去的25年里,中国的“财神”不是赵公明,而是WTO!

至少在已经过去的25年里,中国的“财神”不是赵公明,而是WTO!

细雨中的呼喊
2026-02-21 06:59:07
美国U-2侦察机全球共被击落7架,其中5架败于我军之手,百岁院士张履谦披露详情

美国U-2侦察机全球共被击落7架,其中5架败于我军之手,百岁院士张履谦披露详情

极目新闻
2026-02-21 21:45:52
王濛气到落泪:花那么多钱,就把队伍弄成这样?成天锁大门蒙眼睛

王濛气到落泪:花那么多钱,就把队伍弄成这样?成天锁大门蒙眼睛

风过乡
2026-02-21 08:03:36
军队将领被抓时是怎样的场景?是提前通知,还是突然控制迅速带走

军队将领被抓时是怎样的场景?是提前通知,还是突然控制迅速带走

李昕言温度空间
2026-02-21 23:02:48
越南的社会像30年前的中国,越南的食物像30年后的中国

越南的社会像30年前的中国,越南的食物像30年后的中国

食味艺文志
2026-02-20 23:46:09
凯恩乐极生悲!轰世界波后送点,23轮轰28球,打破莱万神纪录

凯恩乐极生悲!轰世界波后送点,23轮轰28球,打破莱万神纪录

奥拜尔
2026-02-22 00:16:52
拾石村妈祖被替后续: 女孩账号曝光,当了八年被选定,今年满18岁

拾石村妈祖被替后续: 女孩账号曝光,当了八年被选定,今年满18岁

离离言几许
2026-02-20 14:02:55
机器人集体亮相春晚后:“假蔡明”被送给了真蔡明,“春晚版熊猫”拍出近6万元高价

机器人集体亮相春晚后:“假蔡明”被送给了真蔡明,“春晚版熊猫”拍出近6万元高价

红星新闻
2026-02-21 20:39:13
宇树CEO王兴兴:当前机器人技术接近10岁孩子水平,大规模应用或需3至5年,最长不超10年

宇树CEO王兴兴:当前机器人技术接近10岁孩子水平,大规模应用或需3至5年,最长不超10年

大象新闻
2026-02-21 20:44:06
贾浅浅《开花》被获得全国诗歌一等奖的诗,写出了女性的原始欲

贾浅浅《开花》被获得全国诗歌一等奖的诗,写出了女性的原始欲

读睡
2026-02-20 16:29:43
2-1!20岁边卫双响 12.9亿豪门力挫强敌3连胜 英超争冠形势又生变

2-1!20岁边卫双响 12.9亿豪门力挫强敌3连胜 英超争冠形势又生变

狍子歪解体坛
2026-02-22 05:56:15
香港身份烂尾潮已来!12万内地中产,正在被精准收割

香港身份烂尾潮已来!12万内地中产,正在被精准收割

社会日日鲜
2026-02-22 04:38:12
爆冷丢金!中国队太遗憾,争议性选择失误收尾 金牌数无缘超日本

爆冷丢金!中国队太遗憾,争议性选择失误收尾 金牌数无缘超日本

大秦壁虎白话体育
2026-02-21 19:57:04
伊朗学生在各地发起大规模反政权抗议

伊朗学生在各地发起大规模反政权抗议

桂系007
2026-02-21 23:43:38
湛江妈祖事件后续,福建老板集体放话:以后绝不跟姓许的打交道!

湛江妈祖事件后续,福建老板集体放话:以后绝不跟姓许的打交道!

社会日日鲜
2026-02-21 06:53:41
民企已经到了“斩杀线”:25%躺平,38%绝望,80%内卷

民企已经到了“斩杀线”:25%躺平,38%绝望,80%内卷

苏格拉高
2026-02-21 19:53:50
谷爱凌:人们之所以对我有意见,是因为讨厌中国

谷爱凌:人们之所以对我有意见,是因为讨厌中国

懂球帝
2026-02-21 16:53:05
一觉醒来,关税大逆转又逆转

一觉醒来,关税大逆转又逆转

贩财局
2026-02-21 09:44:27
2026-02-22 08:16:49
量子位 incentive-icons
量子位
追踪人工智能动态
12186文章数 176389关注度
往期回顾 全部

科技要闻

智谱上市1月涨5倍,市值超越京东、快手

头条要闻

贝加尔湖7名遇难者身份全部确认 1家4口仅1人生还

头条要闻

贝加尔湖7名遇难者身份全部确认 1家4口仅1人生还

体育要闻

徐梦桃:这是我第一块铜牌 给我换个吉祥物

娱乐要闻

黄晓明澳门赌博输十几亿 本人亲自回应

财经要闻

一觉醒来,世界大变,特朗普改新打法了

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

房产
手机
旅游
健康
公开课

房产要闻

窗前即地标!独占三亚湾C位 自贸港总裁行宫亮相

手机要闻

小米8500mAh电池新机曝光,下半年还有万级方案

旅游要闻

新春假期游兴浓

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版