网易首页 > 网易号 > 正文 申请入驻

人类秒懂,AI崩溃:一个简单测试,就让顶级大模型集体“翻车”

0
分享至

VYU团队 投稿
量子位 | 公众号 QbitAI

人类一眼就能看懂的文字,AI居然全军覆没。

来自A*STAR、NUS、NTU、清华、南开等机构的研究团队,最近有个新发现:

不管是OpenAI的GPT-5、GPT-4o,还是谷歌Gemini、Anthropic Claude,甚至国内的Qwen、LLaVA,在面对一些“看得见但读不懂”的文字时,全都表现极差,直接“翻车”。



先切再叠,AI束手无策

VYU团队设计了两个小实验:

1、选取了100条四字成语,把每个汉字横切、竖切、斜切,再把碎片重新拼接。



人类读起来毫无压力,AI却几乎全错。





2、挑选了100个八字母英文单词,把前后两半分别用红色和绿色渲染,再叠加在一起。



对人类来说,这几乎不构成挑战——因为我们的视觉系统对红/绿通道异常敏感,大脑能自动分离颜色,然后拼出完整的单词。

但对AI模型来说,结果却完全不同:





即使是最新发布的大模型,在这些问题上也屡屡碰壁。

无论是Gemini 2.5 Pro:





还是Kimi 2(Switch to 1.5 for visual understanding) :





(PS:Kimi 2最终推测的答案是hardline)

又或者Qwen3-Max-Preview





全都得不到正确的结果。

AI不懂符号分割与组合

对该现象进行分析,VYU团队认为,根本原因在于AI靠模式匹配,不懂文字结构

人类之所以能“读懂”,是因为我们依赖结构先验——知道汉字由偏旁部首组成,知道英文是按字母组合的。

而大模型只是把文字当作“图片模式”来识别,没有符号分割与组合的机制。

于是,只要文字稍作扰动(但人类依旧能看懂),AI就会彻底崩溃。



这个问题之所以值得研究,是因为它关系到AI落地的核心挑战:

  • 在教育和无障碍应用里,AI可能无法正确识别“非标准文本”。
  • 在历史文献与科学笔记整理中,AI无法像人类一样从残缺文字中恢复含义。
  • 在安全场景里,攻击者甚至可以利用这种“盲点”绕过AI审查。

VYU团队认为,要想让AI拥有类似人类的韧性,必须重新思考VLMs如何整合视觉与文本——

也许需要新的训练数据、更注重分割的结构先验,或者全新的多模态融合方式。

更重要的是,这一结果也提醒我们:人类的阅读理解从来不是单一模态的过程,而是依赖多重感知与推理的综合能力。

论文链接:https://zjzac.github.io/publications/pdf/Visible_Yet_Unreadable__A_Systematic_Blind_Spot_of_Vision_Language_Models_Across_Writing_Systems__ArXiv.pdf

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不查不知道一查吓一跳,掌管少林寺38年的释永信,私下到底多享受

不查不知道一查吓一跳,掌管少林寺38年的释永信,私下到底多享受

凡知
2025-08-16 09:25:44
陈百强自杀真相曝光!王晶揭穿32年豪门谎言:他根本不是为情所困

陈百强自杀真相曝光!王晶揭穿32年豪门谎言:他根本不是为情所困

八斗小先生
2025-12-08 11:07:02
马年春晚带火了机器人,机器人卖爆了,就连售价63万元的机器人也秒光

马年春晚带火了机器人,机器人卖爆了,就连售价63万元的机器人也秒光

极目新闻
2026-02-17 11:03:42
王菲化妆师回应造型翻车,晒水滴耳环近照称:问就是大水滴反光

王菲化妆师回应造型翻车,晒水滴耳环近照称:问就是大水滴反光

月光作笺a
2026-02-17 23:32:13
0.09秒奇迹!中国队再创历史,吴宇喜极而泣,李琰疯狂庆祝

0.09秒奇迹!中国队再创历史,吴宇喜极而泣,李琰疯狂庆祝

奥拜尔
2026-02-17 23:50:31
“我作为犹太人很光荣。”回以色列认祖归宗,等待她的却是噩梦

“我作为犹太人很光荣。”回以色列认祖归宗,等待她的却是噩梦

有书
2026-02-16 22:40:03
春晚赞助商换了一拨:机器人5亿,追觅2亿,潮玩卡牌上桌

春晚赞助商换了一拨:机器人5亿,追觅2亿,潮玩卡牌上桌

娱乐资本论
2026-02-18 10:34:52
德国总理默茨:期待在不久的将来访华

德国总理默茨:期待在不久的将来访华

北青网-北京青年报
2026-02-18 13:45:03
区别对待!赴日游客骤减后,才发现中国人在日本背了这么多锅!

区别对待!赴日游客骤减后,才发现中国人在日本背了这么多锅!

比利
2026-02-18 06:26:30
纽约期金突破4900美元/盎司

纽约期金突破4900美元/盎司

每日经济新闻
2026-02-18 07:22:18
2金!冬奥会奖牌榜乱了:213万人口小国逆袭 排名比中国韩国还高

2金!冬奥会奖牌榜乱了:213万人口小国逆袭 排名比中国韩国还高

侃球熊弟
2026-02-18 07:46:58
“00后”陈某某被押赴刑场 执行死刑

“00后”陈某某被押赴刑场 执行死刑

闪电新闻
2026-02-07 16:53:35
34岁东北姑娘拿下81岁全球首富,长的很漂亮,一年抱俩娃身价上亿

34岁东北姑娘拿下81岁全球首富,长的很漂亮,一年抱俩娃身价上亿

云舟史策
2025-09-13 07:37:04
甜馨跟着爸爸回村过年,贾乃亮一张全家福,意外曝光神秘拍照人

甜馨跟着爸爸回村过年,贾乃亮一张全家福,意外曝光神秘拍照人

乐界品鉴官
2026-02-18 06:38:10
辞去央视工作,嫁大18岁李铁为妻,如今52岁张泉灵已走上另一条路

辞去央视工作,嫁大18岁李铁为妻,如今52岁张泉灵已走上另一条路

白面书誏
2026-01-07 17:17:06
法国姑娘哭诉“被中国分手”?全球年轻人正集体“极致中国化”

法国姑娘哭诉“被中国分手”?全球年轻人正集体“极致中国化”

生活魔术专家
2026-02-17 14:22:08
人过60,我才渐明白:只要能健康的活着,其他的,有点就该知足了

人过60,我才渐明白:只要能健康的活着,其他的,有点就该知足了

小马达情感故事
2026-02-17 15:20:03
我从油车换到电车后,终于明白:还有那么多人不换车,不是傻,而是聪明

我从油车换到电车后,终于明白:还有那么多人不换车,不是傻,而是聪明

刘哥谈体育
2026-02-16 20:29:51
为什么领导很少生病请假,总是精力充沛?主要有这4点

为什么领导很少生病请假,总是精力充沛?主要有这4点

细说职场
2026-02-11 17:27:08
春晚歌舞类收视榜出炉!凤凰传奇第二,成龙第四,第一名都没想到

春晚歌舞类收视榜出炉!凤凰传奇第二,成龙第四,第一名都没想到

观察鉴娱
2026-02-17 16:43:01
2026-02-18 15:52:49
量子位 incentive-icons
量子位
追踪人工智能动态
12176文章数 176386关注度
往期回顾 全部

科技要闻

怒烧45亿,腾讯字节阿里决战春节

头条要闻

赖清德新年发福袋 宫庙主委突然捂嘴呕吐喷溅他身上

头条要闻

赖清德新年发福袋 宫庙主委突然捂嘴呕吐喷溅他身上

体育要闻

夺银被问丢金,谷爱凌回击外媒:很荒谬

娱乐要闻

6大卫视春晚收视出炉 北京台稳居第一

财经要闻

面条火腿香菇酱!上市公司这些年请你吃

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

本地
旅游
艺术
健康
公开课

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

旅游要闻

弦子的山海经|从“成为中国人”到“在中国过春节”,老外为啥都爱上了中国?

艺术要闻

白宫东翼扩建详细图纸,刚曝光就火速撤下!

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版