网易首页 > 网易号 > 正文 申请入驻

人类秒懂,AI崩溃:一个简单测试,就让顶级大模型集体“翻车”

0
分享至

VYU团队 投稿
量子位 | 公众号 QbitAI

人类一眼就能看懂的文字,AI居然全军覆没。

来自A*STAR、NUS、NTU、清华、南开等机构的研究团队,最近有个新发现:

不管是OpenAI的GPT-5、GPT-4o,还是谷歌Gemini、Anthropic Claude,甚至国内的Qwen、LLaVA,在面对一些“看得见但读不懂”的文字时,全都表现极差,直接“翻车”。

先切再叠,AI束手无策

VYU团队设计了两个小实验:

1、选取了100条四字成语,把每个汉字横切、竖切、斜切,再把碎片重新拼接。

人类读起来毫无压力,AI却几乎全错。

2、挑选了100个八字母英文单词,把前后两半分别用红色和绿色渲染,再叠加在一起。

对人类来说,这几乎不构成挑战——因为我们的视觉系统对红/绿通道异常敏感,大脑能自动分离颜色,然后拼出完整的单词。

但对AI模型来说,结果却完全不同:

即使是最新发布的大模型,在这些问题上也屡屡碰壁。

无论是Gemini 2.5 Pro:

还是Kimi 2(Switch to 1.5 for visual understanding) :

(PS:Kimi 2最终推测的答案是hardline)

又或者Qwen3-Max-Preview

全都得不到正确的结果。

AI不懂符号分割与组合

对该现象进行分析,VYU团队认为,根本原因在于AI靠模式匹配,不懂文字结构

人类之所以能“读懂”,是因为我们依赖结构先验——知道汉字由偏旁部首组成,知道英文是按字母组合的。

而大模型只是把文字当作“图片模式”来识别,没有符号分割与组合的机制。

于是,只要文字稍作扰动(但人类依旧能看懂),AI就会彻底崩溃。

这个问题之所以值得研究,是因为它关系到AI落地的核心挑战:

  • 在教育和无障碍应用里,AI可能无法正确识别“非标准文本”。
  • 在历史文献与科学笔记整理中,AI无法像人类一样从残缺文字中恢复含义。
  • 在安全场景里,攻击者甚至可以利用这种“盲点”绕过AI审查。

VYU团队认为,要想让AI拥有类似人类的韧性,必须重新思考VLMs如何整合视觉与文本——

也许需要新的训练数据、更注重分割的结构先验,或者全新的多模态融合方式。

更重要的是,这一结果也提醒我们:人类的阅读理解从来不是单一模态的过程,而是依赖多重感知与推理的综合能力。

论文链接:https://zjzac.github.io/publications/pdf/Visible_Yet_Unreadable__A_Systematic_Blind_Spot_of_Vision_Language_Models_Across_Writing_Systems__ArXiv.pdf

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不服气!“黄毛”发小居然比教师混得成功引争议,网友:凭什么啊

不服气!“黄毛”发小居然比教师混得成功引争议,网友:凭什么啊

火山詩话
2026-05-31 12:52:32
一直等不到片商邀约⋯业界最好的刺青女优用「这种方式」引退!

一直等不到片商邀约⋯业界最好的刺青女优用「这种方式」引退!

孤独的独角兽影视
2026-06-01 12:05:10
两岸统一开始提速! 大陆开始着手接管台湾治权, 赖清德的桌子被掀

两岸统一开始提速! 大陆开始着手接管台湾治权, 赖清德的桌子被掀

别吵吵
2026-06-01 08:42:07
全面补强!曼联中场锋线双线引援提速,身价6000万边锋决意加盟

全面补强!曼联中场锋线双线引援提速,身价6000万边锋决意加盟

夜白侃球
2026-06-01 10:56:39
比徐正源名气大!K联赛名宿要来泰山?李平康:京鲁都是执教目标

比徐正源名气大!K联赛名宿要来泰山?李平康:京鲁都是执教目标

建哥说体育
2026-05-31 20:04:50
莫言:主动买单、不占便宜、不斤斤计较的男人,注定是干大事的人

莫言:主动买单、不占便宜、不斤斤计较的男人,注定是干大事的人

杏花烟雨江南的碧园
2026-05-26 16:15:03
婚姻糜烂的康有为:55岁娶17岁日本女佣,却生下了自己的孙女

婚姻糜烂的康有为:55岁娶17岁日本女佣,却生下了自己的孙女

墨策史
2026-05-11 02:40:09
汶川地震中,丢了学生逃跑的老师“范跑跑”,18年后竟成了大赢家

汶川地震中,丢了学生逃跑的老师“范跑跑”,18年后竟成了大赢家

芳芳历史烩
2026-05-24 01:06:29
穆里尼奥不要的人,阿隆索当成宝!切尔西强挖 8700 万伯纳乌真核

穆里尼奥不要的人,阿隆索当成宝!切尔西强挖 8700 万伯纳乌真核

澜归序
2026-06-01 06:43:38
明后天最高气温接近34度

明后天最高气温接近34度

脊梁in上海
2026-06-01 08:23:21
55年王牌旅长授少校衔,他说太丢脸我转业,7年后密报惊动省领导

55年王牌旅长授少校衔,他说太丢脸我转业,7年后密报惊动省领导

云端小院
2026-06-01 09:42:35
你以为麻豆传媒是卖片的,其实它是卖人的

你以为麻豆传媒是卖片的,其实它是卖人的

创始人笔记
2026-04-23 21:44:50
因遭“死亡恐吓” 190元榴莲被“仅退款”商家报警并获刑事立案

因遭“死亡恐吓” 190元榴莲被“仅退款”商家报警并获刑事立案

封面新闻
2026-05-30 17:42:05
颠覆认知!近2万人研究:每周一次性生活,男性癌症风险降低69%

颠覆认知!近2万人研究:每周一次性生活,男性癌症风险降低69%

科技虎虎
2026-05-31 10:09:27
扎根南京二十载合法企业遭暴力强拆 省劳模蒋岸川七年维权路漫漫

扎根南京二十载合法企业遭暴力强拆 省劳模蒋岸川七年维权路漫漫

CC说话的人
2026-06-01 09:34:06
成都多家茶馆被同一个号码举报“无证泡茶” 商家怀疑遭“职业索赔”报警获受理

成都多家茶馆被同一个号码举报“无证泡茶” 商家怀疑遭“职业索赔”报警获受理

封面新闻
2026-05-31 18:34:39
俄军开始从两个战场撤退,瑞典36架鹰狮助力乌克兰空军

俄军开始从两个战场撤退,瑞典36架鹰狮助力乌克兰空军

史政先锋
2026-05-29 15:58:46
半导体港股走低 华虹半导体跌6%,澜起科技(06809.HK)跌6%,中芯国际(00981.HK)跌2%。

半导体港股走低 华虹半导体跌6%,澜起科技(06809.HK)跌6%,中芯国际(00981.HK)跌2%。

财联社
2026-06-01 11:20:09
中方警告话音未落,不到24小时,日本拉上菲澳新,加速输出护卫舰

中方警告话音未落,不到24小时,日本拉上菲澳新,加速输出护卫舰

锅锅爱历史
2026-06-01 13:18:17
优质内容创作者为何青睐上海?他们提到政策支持、行业生态与城市氛围

优质内容创作者为何青睐上海?他们提到政策支持、行业生态与城市氛围

澎湃新闻
2026-05-30 16:54:28
2026-06-01 14:16:49
量子位 incentive-icons
量子位
追踪人工智能动态
12721文章数 176476关注度
往期回顾 全部

科技要闻

关停三年后,天涯社区今起开放访问

头条要闻

普京将乌无人机残骸交于美方 被指发表"极其危险言论"

头条要闻

普京将乌无人机残骸交于美方 被指发表"极其危险言论"

体育要闻

哭过之后,文班亚马想给波波维奇打电话

娱乐要闻

张凌赫活动商场玻璃被挤爆5人受伤

财经要闻

网红驱蚊产品,标注化妆品竟含农药成分

汽车要闻

上市三周交付3603台!华境S跻身旗舰大六座第一梯队

态度原创

时尚
手机
家居
游戏
公开课

女人不管多大年纪,夏天都要准备一条白色阔腿裤,百搭又清爽

手机要闻

小米17系列即将突破500万销量,国产安卓第一人有意见吗?

家居要闻

自信舒展 高背座椅

“并非bug”!《GTA6》悬浮路灯竟是佛罗里达真实实景

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版