网易首页 > 网易号 > 正文 申请入驻

人类秒懂,AI崩溃:一个简单测试,就让顶级大模型集体“翻车”

0
分享至

VYU团队 投稿
量子位 | 公众号 QbitAI

人类一眼就能看懂的文字,AI居然全军覆没。

来自A*STAR、NUS、NTU、清华、南开等机构的研究团队,最近有个新发现:

不管是OpenAI的GPT-5、GPT-4o,还是谷歌Gemini、Anthropic Claude,甚至国内的Qwen、LLaVA,在面对一些“看得见但读不懂”的文字时,全都表现极差,直接“翻车”。



先切再叠,AI束手无策

VYU团队设计了两个小实验:

1、选取了100条四字成语,把每个汉字横切、竖切、斜切,再把碎片重新拼接。



人类读起来毫无压力,AI却几乎全错。





2、挑选了100个八字母英文单词,把前后两半分别用红色和绿色渲染,再叠加在一起。



对人类来说,这几乎不构成挑战——因为我们的视觉系统对红/绿通道异常敏感,大脑能自动分离颜色,然后拼出完整的单词。

但对AI模型来说,结果却完全不同:





即使是最新发布的大模型,在这些问题上也屡屡碰壁。

无论是Gemini 2.5 Pro:





还是Kimi 2(Switch to 1.5 for visual understanding) :





(PS:Kimi 2最终推测的答案是hardline)

又或者Qwen3-Max-Preview





全都得不到正确的结果。

AI不懂符号分割与组合

对该现象进行分析,VYU团队认为,根本原因在于AI靠模式匹配,不懂文字结构

人类之所以能“读懂”,是因为我们依赖结构先验——知道汉字由偏旁部首组成,知道英文是按字母组合的。

而大模型只是把文字当作“图片模式”来识别,没有符号分割与组合的机制。

于是,只要文字稍作扰动(但人类依旧能看懂),AI就会彻底崩溃。



这个问题之所以值得研究,是因为它关系到AI落地的核心挑战:

  • 在教育和无障碍应用里,AI可能无法正确识别“非标准文本”。
  • 在历史文献与科学笔记整理中,AI无法像人类一样从残缺文字中恢复含义。
  • 在安全场景里,攻击者甚至可以利用这种“盲点”绕过AI审查。

VYU团队认为,要想让AI拥有类似人类的韧性,必须重新思考VLMs如何整合视觉与文本——

也许需要新的训练数据、更注重分割的结构先验,或者全新的多模态融合方式。

更重要的是,这一结果也提醒我们:人类的阅读理解从来不是单一模态的过程,而是依赖多重感知与推理的综合能力。

论文链接:https://zjzac.github.io/publications/pdf/Visible_Yet_Unreadable__A_Systematic_Blind_Spot_of_Vision_Language_Models_Across_Writing_Systems__ArXiv.pdf

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
华裔女子在美遭警察3枪射伤,还被诬袭警,获赔675万美元!警方:当初陈述不准确

华裔女子在美遭警察3枪射伤,还被诬袭警,获赔675万美元!警方:当初陈述不准确

红星新闻
2025-09-16 16:26:12
89%到58%!中国台湾企业加速把生产线搬出大陆?

89%到58%!中国台湾企业加速把生产线搬出大陆?

随波荡漾的漂流瓶
2025-09-16 16:45:07
陆毅女儿16岁的贝儿眼睛是标准的丹凤眼吧,这是真的中了基因彩票

陆毅女儿16岁的贝儿眼睛是标准的丹凤眼吧,这是真的中了基因彩票

喜欢历史的阿繁
2025-09-17 00:06:05
谷歌靠Nano Banana超越ChatGPT!登顶苹果App Store第一,玩疯了

谷歌靠Nano Banana超越ChatGPT!登顶苹果App Store第一,玩疯了

量子位
2025-09-15 15:36:13
全裸出镜,一脱爆火,这尺度新剧实在太敢拍

全裸出镜,一脱爆火,这尺度新剧实在太敢拍

喜欢历史的阿繁
2025-09-11 13:13:52
炸裂!200多名包括旅长在内的俄军官兵,被自己战友勾结乌军屠杀

炸裂!200多名包括旅长在内的俄军官兵,被自己战友勾结乌军屠杀

雪中风车
2025-09-15 11:18:12
看了宋伊人的照片,让我不寒而栗

看了宋伊人的照片,让我不寒而栗

魔都姐姐杂谈
2025-09-15 22:38:35
特雷·杨:在我生涯第八年,球队终于有了争夺总冠军的实力

特雷·杨:在我生涯第八年,球队终于有了争夺总冠军的实力

雷速体育
2025-09-16 08:43:08
医生给300名老人做假手术,10年无人发现,医生:反正他们快死了

医生给300名老人做假手术,10年无人发现,医生:反正他们快死了

悬案解密档案
2025-09-15 15:20:47
【2025.9.16】扒酱料不停:那些你不知道的八卦一二三

【2025.9.16】扒酱料不停:那些你不知道的八卦一二三

娱乐真爆姐
2025-09-16 23:26:55
李斌2014年说的话,大家终于发现是对的

李斌2014年说的话,大家终于发现是对的

财经无忌
2025-09-15 18:41:45
女优守屋芳乃青涩女秘书,摘下眼镜后兽性大发!

女优守屋芳乃青涩女秘书,摘下眼镜后兽性大发!

葫芦哥爱吐槽
2025-09-16 14:00:50
男性留学生被安排入住女生宿舍,画面曝光,校方回应却难平争议

男性留学生被安排入住女生宿舍,画面曝光,校方回应却难平争议

娱乐壹点半
2025-09-16 17:03:42
王楚钦被女子贴身尾随,遭驱赶后仍继续跟随,还追问:加不加我微信?以后联系联系

王楚钦被女子贴身尾随,遭驱赶后仍继续跟随,还追问:加不加我微信?以后联系联系

台州交通广播
2025-09-17 00:46:00
肌肉少了,血糖就不听话!注意这5个肌肉减少的信号,教你3招改善

肌肉少了,血糖就不听话!注意这5个肌肉减少的信号,教你3招改善

蜡笔小小子
2025-08-31 14:29:03
辛柏青丧妻刚满100天,离谱的事就发生了,被撮合娶马伊琍引争议

辛柏青丧妻刚满100天,离谱的事就发生了,被撮合娶马伊琍引争议

凉羽亭
2025-08-28 11:40:48
中国偏偏不让出港口,19国军队堵门,导弹都架好了,倒逼中方让步

中国偏偏不让出港口,19国军队堵门,导弹都架好了,倒逼中方让步

一个有灵魂的作者
2025-07-26 08:38:25
秦安:以色列72小时内袭击6国,胡塞武装要卡塔尔五千亿灭以色列

秦安:以色列72小时内袭击6国,胡塞武装要卡塔尔五千亿灭以色列

秦安战略
2025-09-17 06:10:22
2909亿身价有何用?97岁的李嘉诚无力回天,两个60岁儿子已成心病

2909亿身价有何用?97岁的李嘉诚无力回天,两个60岁儿子已成心病

归史
2025-08-27 14:29:47
中国女篮热身赛名单:韩旭、张子宇领衔,李梦、王思雨等不在列

中国女篮热身赛名单:韩旭、张子宇领衔,李梦、王思雨等不在列

懂球帝
2025-09-16 10:21:08
2025-09-17 06:52:49
量子位 incentive-icons
量子位
追踪人工智能动态
11329文章数 176274关注度
往期回顾 全部

科技要闻

2025款Apple Watch全系怎么选?

头条要闻

女子误踩"化骨水"去世:9点误踩15点心脏衰竭 当天死亡

头条要闻

女子误踩"化骨水"去世:9点误踩15点心脏衰竭 当天死亡

体育要闻

2022:勇士归来,库里的第四个冠军

娱乐要闻

李小璐母亲:女儿嫁给贾乃亮我好后悔

财经要闻

扩大服务消费 9部门提出5方面19条举措

汽车要闻

智能体豪华旅行车 享界S9T30.98万元起售

态度原创

房产
健康
亲子
手机
家居

房产要闻

当海口书包房卷向「未来」,这里的孩子和房价,都在高速超车!

内分泌科专家破解身高八大谣言

亲子要闻

宝妈必学,警惕孩子玩玩具时有这样的行为!

手机要闻

华为鸿蒙 HarmonyOS 6.0.0.100 开发者 / 用户尝鲜版本开启推送

家居要闻

江南秘境 理想生活模样

无障碍浏览 进入关怀版