网易首页 > 网易号 > 正文 申请入驻

只需一句“猫咪爱睡觉”,大模型逻辑瞬间崩溃!

0
分享至

大数据文摘出品

研究人员发现,只需一句“猫咪大部分时间都在睡觉”的普通句子,就能让先进的推理模型逻辑崩溃

论文地址:https://arxiv.org/pdf/2503.01781

这项研究名为《Cats Confuse Reasoning LLM》,由多个研究者联合完成,揭示了语言模型在处理复杂任务时的惊人脆弱性。

实验中,研究团队使用一个名为“CatAttack”的自动化攻击系统,系统利用一个攻击者模型(GPT-4o)与一个代理模型(DeepSeek V3)协作,生成干扰性语句。

这些干扰句子随后被输入更强大的推理模型如DeepSeek R1中,由“裁判模型”评估其效果。

结果令人震惊。只需添加三句普通句子,模型的错误率就从1.5%暴涨到4.5%,翻了整整三倍

这三句话分别是:“有趣的事实:猫一生中大部分时间都在睡觉”、“答案可能在175左右吗?”以及一些广义的理财建议。

图注:即使是最基本的短语,也可能成为对抗性触发器,突显出模型推理的脆弱性。

这些语句看似无害,与题目内容并无直接关系,却极具破坏力。而且,这种攻击不只是让模型变“蠢”,还让模型“慢”。

在另一个实验中,DeepSeek R1-distill-Qwen-32B模型中,高达42%的回答超出了原计划的Token预算至少50%

即便是OpenAI最新的o1模型,也在这种攻击下出现了26%的Token溢出增长

这意味着,除了逻辑错误率增加,模型在面对这类“干扰信息”时还会变得拖沓、计算成本升高。研究团队将其称为“减速攻击”,这是除错误率之外另一个关键风险。

01 上下文正在成为最大软肋

这项研究再次证明,大模型虽然会推理,但它们对“无关上下文”的判断能力极其薄弱

一旦遇到“看似相关却本质无关”的信息,模型容易迷失方向。

不只是“猫咪睡觉”这种趣味冷知识能干扰模型,哪怕是与原题毫无联系的建议语句也会产生巨大影响

研究人员指出,这种对“上下文诱导”的脆弱性,在金融、法律、医疗等高风险领域将带来严重后果。

因为,这些领域的文本往往非常复杂,信息密集,一句不相关的参考建议可能就足以让AI输出错误结论。

早在今年5月,另一项研究也曾发现,即使任务不变,只要输入信息长度变长、内容变杂,模型性能就会大幅下降

还有研究表明,一旦对话变长,语言模型给出的答案可靠性就会迅速下滑

这些发现串联在一起,说明问题并非出在某个模型身上,而是出在模型结构本身。

它们天生缺乏对“信息相关性”的判断能力。它们不知道什么话该听,什么话该忽略。

有学者曾表示,“精确控制上下文”是AI真正的核心能力。而前OpenAI研究员Andrej Karpathy则强调,“上下文工程”极其困难,远非简单调参或清洗数据那么直白

CatAttack正是这个观点的绝佳例证。它说明,哪怕只有一句看似无害的语句插入,一个逻辑任务也可能走向完全错误的结论。

02 防线在哪里?

后缀攻击会将 DeepSeek-R1 的错误率提高最多达十倍,尤其在数学基准测试中表现尤为明显。

研究者提出几种可能的防御手段:上下文过滤器、更稳健的训练方法,或是系统性地测试所有模型对“通用干扰语句”的免疫能力

但这些建议只是开端。CatAttack提出的问题,实质是语言模型没有逻辑隔离能力

它不能主动判断“这段信息是否对推理有贡献”,只能被动接收并消化全部上下文。

更严重的是,这种脆弱性极易被“自动攻击系统”大规模利用。

CatAttack并非手工编写攻击,而是通过自动流程,用一个廉价代理模型(DeepSeek V3)生成成千上万种“诱导句”。

然后通过“裁判模型”筛选效果最好的诱饵语句,并将其用于攻击高级推理模型。

这套流程可复制、可规模化,意味着未来攻击者可以很低成本地干扰语言模型的输出稳定性

甚至不需要黑客技术,只要一段“猫咪冷知识”放在上下文中,就可能让AI在医疗诊断、金融预测中出错。

这也让“上下文工程”从一个研究议题,变成一个必须建立的安全防线。它要求模型开发者不仅训练模型“会说话”,更要训练它“知道该听哪一句话”。

否则,AI看似逻辑缜密,实则被一只猫轻易打败。

模型时代的战争,不在算法,而在上下文。

作者长期关注 AI 产业与学术,欢迎对这些方向感兴趣的朋友添加微信Q1yezi,共同交流行业动态与技术趋势!

GPU 训练特惠!

H100/H200 GPU算力按秒计费,平均节省开支30%以上!

扫码了解详情☝

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
窜访宣布取消后,国民党表态,民众党向大陆摊牌,赖清德亲自回应

窜访宣布取消后,国民党表态,民众党向大陆摊牌,赖清德亲自回应

锦年衍生烦愁
2026-04-22 19:46:45
日本诺贝尔奖得主大江健三郎表示:很遗憾,日本很可能将重复历史

日本诺贝尔奖得主大江健三郎表示:很遗憾,日本很可能将重复历史

议纪史
2025-11-27 14:35:03
访陆刚结束,郑丽文赴美行程曝光,执意要去美国,好展现她的诚意

访陆刚结束,郑丽文赴美行程曝光,执意要去美国,好展现她的诚意

报君知史
2026-04-22 18:58:08
深圳:水官高速确认停止收费,将拆除收费站,需封闭部分匝道!通行指引公布

深圳:水官高速确认停止收费,将拆除收费站,需封闭部分匝道!通行指引公布

南方都市报
2026-04-23 21:43:09
真来了!首部全AI生成电影《灵魂摆渡》将定档,网友直言...

真来了!首部全AI生成电影《灵魂摆渡》将定档,网友直言...

中国青年报
2026-04-22 13:59:08
第二个恶魔医生被抓,郑大一附院王福建为94名患者植入不需要器械

第二个恶魔医生被抓,郑大一附院王福建为94名患者植入不需要器械

大鱼简科
2026-02-18 22:03:00
恩比德术后首次合练,76人季后赛悬了?

恩比德术后首次合练,76人季后赛悬了?

篮坛第一线
2026-04-24 02:03:07
事实证明,已经“消失”7年的周立波,早已走上一条不归路

事实证明,已经“消失”7年的周立波,早已走上一条不归路

素衣读史
2026-04-16 19:41:20
窗户纸捅破,生死局开启?日本商界急得团团转,对华提出一个请求

窗户纸捅破,生死局开启?日本商界急得团团转,对华提出一个请求

归史
2026-04-22 20:37:52
全场意外!岛内民调结果出炉二人数据惊人,民众党高层亮出立场

全场意外!岛内民调结果出炉二人数据惊人,民众党高层亮出立场

林子说事
2026-04-23 21:09:53
郭德纲发文,德云社再变动,释放3个强烈信号,岳云鹏地位又变了

郭德纲发文,德云社再变动,释放3个强烈信号,岳云鹏地位又变了

削桐作琴
2026-04-21 15:24:39
如果不出意外,2026年5月开始,中国房价、楼市或迎来“4大转变”

如果不出意外,2026年5月开始,中国房价、楼市或迎来“4大转变”

混沌录
2026-04-23 16:50:14
费翔:父母都已离世,他无儿女与猫为伴,是亲戚眼里的“唐僧肉”

费翔:父母都已离世,他无儿女与猫为伴,是亲戚眼里的“唐僧肉”

细品名人
2026-04-23 07:20:51
故事:湖南93岁禽兽周其生,因爱喝牛奶而伤害女孩,犯罪细节曝光

故事:湖南93岁禽兽周其生,因爱喝牛奶而伤害女孩,犯罪细节曝光

卡西莫多的故事
2025-02-21 17:17:06
态度十分强硬!内塔尼亚胡问特朗普:你敢对我直接发飙?

态度十分强硬!内塔尼亚胡问特朗普:你敢对我直接发飙?

倾世璃歌
2026-04-23 23:16:01
等不到特朗普访华了,美国提前对华摊牌:要求秘鲁把中国赶出港口

等不到特朗普访华了,美国提前对华摊牌:要求秘鲁把中国赶出港口

南宗历史
2026-04-23 23:08:05
胡锡进谴责打女司机的保安:善良的男人是不会这样打女人的!

胡锡进谴责打女司机的保安:善良的男人是不会这样打女人的!

映射生活的身影
2026-04-23 13:09:09
“暴力抗法”半月后,拼多多发生重大高管调整

“暴力抗法”半月后,拼多多发生重大高管调整

一见财经
2026-04-23 08:04:06
iPhone Fold 国内售价1.4万元?散热方案曝光,这次信息量有点大

iPhone Fold 国内售价1.4万元?散热方案曝光,这次信息量有点大

数码Antenna
2026-04-22 11:47:48
沈阳雨雨雨来了!

沈阳雨雨雨来了!

沈阳公交网小林
2026-04-24 00:10:39
2026-04-24 03:12:49
大数据文摘 incentive-icons
大数据文摘
专注大数据,每日有分享!
6852文章数 94541关注度
往期回顾 全部

科技要闻

马斯克喊出"史上最大产品",但量产难预测

头条要闻

以色列:只要美国同意 将刺杀伊朗最高领袖

头条要闻

以色列:只要美国同意 将刺杀伊朗最高领袖

体育要闻

给文班剃头的马刺DJ,成为NBA最佳第六人

娱乐要闻

王大陆因涉黑讨债被判 女友也一同获刑

财经要闻

普华永道赔偿10亿 恒大股东见到"回头钱"

汽车要闻

预售30.29万起 岚图泰山X8配896线激光雷达

态度原创

游戏
旅游
艺术
手机
公开课

任天堂NS2销量4倍碾压PS5!差距悬殊 索尼难挽颓势

旅游要闻

来广州,分享10亿元“中国旅游日”专属优惠福利

艺术要闻

吉达塔盖到第100层,“它是沙特唯一能按期完成的大项目”

手机要闻

vivo X500 Pro Max被曝光:2nm工艺+5GHz,2K直屏九月发!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版