网易首页 > 网易号 > 正文 申请入驻

把问题说两遍,AI就变聪明了?

0
分享至

快速阅读:谷歌研究人员发现,把同一条提示词复制粘贴两遍再发送,能让大语言模型的准确率提升21%到97%。这个发现既简单粗暴,又令人不安。

该图片可能由AI生成

三位谷歌研究员最近发表了一篇论文,结论简单到有点荒谬:你只需要把发给人工智能的问题复制一遍,粘贴在原文后面一起发送,模型给出正确答案的概率就会大幅提升。不需要任何特殊技巧,全选、复制、光标移到末尾、粘贴,完事。

准确率提升幅度:21%到97%。

有网友马上动手试了试,用那道经典的“洗车店距我家50米,我该走路还是开车去?”测试了一遍、两遍、三遍重复提示词的效果。结果很有意思:发一遍,模型说走路更好;发两遍,模型开始犹豫;发三遍,模型终于意识到你是要把车开过去洗,当然得开车。

这道题本身值得多说两句。题目没有明确说“车就在你身边”,只说洗车店离家50米。有观点认为,这其实是一个表述不清的问题,正确答案要看车在哪里。也有观点反驳说,“我该走路还是开车去”这个问题在日常语言逻辑里天然蕴含了“车就在手边”的前提,要求把所有隐含条件全部显式列出,对话就没法进行了。

两种观点都有道理,但真正耐看的问题在于:为什么重复同一段文字,机器就能“想清楚”这件事?

技术层面的解释来自几位懂行的网友。大语言模型是单向从左到右处理文本的,早期出现的词条只能通过“向前看”来获取信息,看不到后面的内容。把提示词重复一次,相当于给每个词条都创造了一次“回望”的机会,让输入文本的不同部分能够彼此关联,降低了模型对词语顺序和位置的偏见。

还有一个更直白的说法:更长的上下文等于更低的困惑度。推理模型之所以表现好,部分原因就是它们在正式给出答案前,先生成了大量的“思考过程”文本,这些文本为最终答案积累了丰富的上下文。重复提示词,本质上是在用一种笨办法模拟这个过程。有观点指出,即便用完全无关的填充文字,比如让模型数数“1、2、3……”,也能改善答案质量,只是效果不如重复提示词明显。

换句话说,给模型更多“时间”,它就能想得更好。这和人类在考试时把题目默读两遍再作答,并没有本质区别。

当然,随着推理模型的普及,这个技巧对最新一代模型的加成效果会打折扣。论文测试的还是非推理模型,用的是2024年初发布的旧版本。有观点吐槽说,学术界的研究速度实在感人,实验做完到论文发出去,中间拖了将近一年。

不过问题还没解决:这个技巧究竟对哪类问题最有效,重复几次是上限,取决于什么变量?论文里目前还没有给出系统性的答案。

简评:

人工智能最让人不安的,不是它太聪明,而是它的聪明方式我们看不懂。

复制粘贴一下问题,准确率就能飙升97%——这个发现简单到近乎羞辱。我们造出了人类历史上最复杂的计算系统,却要用幼儿园级别的技巧来哄它认真思考。

但仔细想想,人不也一样吗?老板把重要的事情说三遍,老师让学生把题目读两遍,广告词永远是循环播放。重复,从来不是因为听者愚蠢,而是因为理解这件事本身就需要时间和冗余。

这个实验真正揭示的是:无论碳基还是硅基,智能的底层逻辑是相通的——不是一次性输入正确答案,而是给足够的时间让信息在系统里“发酵”。

所以下次跟AI对话,别急着嫌它笨。把问题多说一遍,就像你对待一个需要思考时间的聪明朋友。毕竟,耐心这件事,对人对机器,都是一种尊重。

论文:arxiv.org/abs/2512.14982

Reddit:www.reddit.com/r/singularity/comments/1r85zst/research_prompt_repetition_improves_nonreasoning/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女演员自曝投资失败,从800平大房子搬进80平出租屋:把所有钱放股市,赔了几百万

女演员自曝投资失败,从800平大房子搬进80平出租屋:把所有钱放股市,赔了几百万

大象新闻
2026-02-12 11:45:10
破防!谷爱凌接连传来“噩耗”,比外婆去世更糟心的事儿发生了

破防!谷爱凌接连传来“噩耗”,比外婆去世更糟心的事儿发生了

陈意小可爱
2026-02-23 12:57:32
曼联近9场英超不败,上一次更长不败是在2021年5月

曼联近9场英超不败,上一次更长不败是在2021年5月

懂球帝
2026-02-23 21:11:04
那些不听医嘱的狠人最后怎么样了?网友:有些人就是犟

那些不听医嘱的狠人最后怎么样了?网友:有些人就是犟

另子维爱读史
2026-02-23 21:53:16
俄罗斯发出警告,24小时不到,中方霸气现身:谁敢乱来!

俄罗斯发出警告,24小时不到,中方霸气现身:谁敢乱来!

音乐时光的娱乐
2026-02-22 19:58:25
妈祖交待的话,唯有阿童敢传!十几岁的她,藏着众人的敬畏

妈祖交待的话,唯有阿童敢传!十几岁的她,藏着众人的敬畏

小陆搞笑日常
2026-02-23 18:27:55
业内最薄充电宝 小米金沙江磁吸充电宝将发布新配色

业内最薄充电宝 小米金沙江磁吸充电宝将发布新配色

PChome电脑之家
2026-02-23 17:39:42
男子大扫除把旧冰箱卖了,母亲傍晚回家告诉他:冰箱里有现金、金银首饰、玉器挂件,“把家底卖了”

男子大扫除把旧冰箱卖了,母亲傍晚回家告诉他:冰箱里有现金、金银首饰、玉器挂件,“把家底卖了”

犀利强哥
2026-02-23 17:19:04
湖北夫妻档小吃摊年入超100万,已买房买车:每天炸500多根年糕、1100多根淀粉肠

湖北夫妻档小吃摊年入超100万,已买房买车:每天炸500多根年糕、1100多根淀粉肠

台州交通广播
2026-01-08 07:18:03
王思聪大概率不会再回国了,不是因为他欠了20亿,也不是王健林

王思聪大概率不会再回国了,不是因为他欠了20亿,也不是王健林

趣味萌宠的日常
2026-02-23 18:48:02
机器人赛道爆发!宇树供应链名单曝光,这5家处于低位

机器人赛道爆发!宇树供应链名单曝光,这5家处于低位

我不叫阿哏
2026-02-23 15:19:03
起效速度是西地那非2倍!全球首款舌下ED药,千亿市场洗牌在即?

起效速度是西地那非2倍!全球首款舌下ED药,千亿市场洗牌在即?

思思夜话
2026-02-23 17:37:21
72万个充电桩,年入40亿,常州夫妇边赚钱边收割,如今要上市了

72万个充电桩,年入40亿,常州夫妇边赚钱边收割,如今要上市了

毒sir财经
2026-02-22 10:38:14
高血压最怕缺钾?长期服用降压药的人,建议常吃4种高钾食物

高血压最怕缺钾?长期服用降压药的人,建议常吃4种高钾食物

健身狂人
2026-02-23 19:59:08
波齐姆斯基18分15篮板9助攻3三分 成为NBA历史替补首人

波齐姆斯基18分15篮板9助攻3三分 成为NBA历史替补首人

北青网-北京青年报
2026-02-23 19:34:04
突然,暴跌超20%!大牛股,急速跳水!发生了什么?

突然,暴跌超20%!大牛股,急速跳水!发生了什么?

数据宝
2026-02-23 18:31:34
《细胞》子刊:茶叶代谢产物或能促炎,可能加重特定疾病症状

《细胞》子刊:茶叶代谢产物或能促炎,可能加重特定疾病症状

医学新视点
2026-02-23 17:34:35
四大追兵趴了仨!国米10分领跑全靠同行衬托 再赢2场硬仗冠军稳了

四大追兵趴了仨!国米10分领跑全靠同行衬托 再赢2场硬仗冠军稳了

雪狼侃体育
2026-02-23 15:30:55
《镖人》海外口碑爆了,评分接近满分,全球票房将破纪录

《镖人》海外口碑爆了,评分接近满分,全球票房将破纪录

影视高原说
2026-02-22 09:52:32
共享单车市场:200亿资金烧光,70家公司倒闭的背后故事

共享单车市场:200亿资金烧光,70家公司倒闭的背后故事

百科密码
2026-02-23 16:45:17
2026-02-23 22:36:49
呼呼历史论
呼呼历史论
分享有趣的历史
379文章数 16423关注度
往期回顾 全部

科技要闻

智谱、MiniMax合计蒸发近千亿市值,为何?

头条要闻

德国总理默茨周三访华:将访两市 30位企业家或随行

头条要闻

德国总理默茨周三访华:将访两市 30位企业家或随行

体育要闻

哈登版骑士首败:雷霆的冠军课

娱乐要闻

那艺娜账号被禁止关注,视频已清空!

财经要闻

美国海关将停止征收被裁定违法的关税

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

本地
旅游
亲子
艺术
公开课

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

旅游要闻

接待游客超5800万人次!马年春节四川为何成为世界的年味“坐标”?

亲子要闻

春季长高黄金期,孩子踢被子隐患大!

艺术要闻

十大名家画春,送给春天的你!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版