网易首页 > 网易号 > 正文 申请入驻

中日研究联合质疑DeepSeek新成果,视觉假象还是突破?

0
分享至

2025 年底 DeepSeek 推出的 “读图神器” DeepSeek-OCR,曾以 10-20 倍文本压缩比号称 “效率吊打全场”,让无数人期待文档处理难题终获破解。但就在2026年1月,一份来自日本东北大学与中国科学院联合团队的报告,直接给这盆火泼了一桶冰水。它究竟是老实 “读图”,还是凭经验 “蒙题”?



是神眼还是瞎蒙?

我们先从这场争议的核心说起。DeepSeek-OCR 的核心卖点是 “视觉文本压缩”,3B 参数模型宣称 10 倍压缩精度达 96%,20 倍压缩仍有 60% 准确率,听起来,效率提升了不止一个台阶。



但中日联合团队的研究人员察觉到不对劲,设计了一套 “针对性测试”,遮挡关键信息、输入乱码、故意撰写不通顺句子。结果让人大跌眼镜。

举个实际例子,研究人员将文档中一串关键数字遮挡一半,按常理无法识别完整数值,但 DeepSeek-OCR 竟输出了逻辑通顺的完整数字。这就像考试时题目被墨水覆盖,考生未看清题干却写出 “标准解答”。有人认为,这绝非精准识别,而是模型根据上下文语言逻辑,自行脑补了缺失信息。



更值得关注的是,研究人员在图片中植入乱码和语法错误句子,模型输出时竟自动 “修正” 为通顺表达。日常场景中这或许是优势,但 OCR 的核心诉求是 “所见即所得”,而非 “优化文本”。这就像让秘书照抄合同,对方却因觉得条款不顺口擅自修改,看似贴心实则暗藏风险。

说白了,这场所谓的 “视觉突破”,本质是一种 “语言幻觉”。模型深谙人类语言规律,发现与其费力识别模糊像素,不如直接预判文本更高效。这种 “猜题” 策略在标准测试中能刷高分,但面对现实世界的复杂场景,立刻暴露短板。

为什么模型会学会 “走捷径”?

我们接着看,先进 AI 为何会犯这种 “低级错误”?这并非 DeepSeek 独有问题,而是多模态大模型的普遍痛点。2025 年 10 月机器之心 Pro 就曾报道,主流多模态模型(MLLM)普遍存在 “时空推理捷径”。



这里要提醒一句,AI 模型和人类一样存在 “惰性”。训练过程中,若发现 “背诵语言规律” 就能降低损失函数,它绝不会费力去 “学习视觉特征”。这就像学生发现背真题规律就能及格,自然不会死磕课本原理。

训练数据是关键诱因。DeepSeek 采用的 OmniDocBench 等数据集,90% 以上是排版整齐、语法规范的 “优质文档”,模糊、乱码、语义不通的 “坏样本” 占比不足 5%。模型长期接触规范文本,形成思维定势,默认信息具备逻辑性、句子必然通顺。



因此,当遇到模糊图像或不通顺文本时,它的第一反应不是 “无法识别”,而是 “信息有误,需修正”。这种 “过度纠正” 源于对 “语言先验知识” 的依赖。DeepSeek-OCR 能跑出高光数据,核心是测试集文档过于 “标准化”,恰好契合其预判逻辑。

这就意味着,行业内的 “跑分竞赛” 水分不小。大家争相比拼压缩比和精度,却忽视了 “鲁棒性” 测试,即模型应对异常场景的能力。如今的 AI 更像 “标准题专家”,一旦题目变样或本身存在错误,就会看似严谨地给出错误答案。

当 “脑补” 遇到真金白银,风险谁来担?

若只是聊天机器人猜错,或许无伤大雅,但 DeepSeek-OCR 瞄准的是医疗、法律、金融等 “零容错” 领域。这些场景中,“脑补” 绝非小事,可能引发致命后果或巨额损失。



举个实际例子,医疗场景中医生用 AI 识别手写诊断报告,若报告写着 “无肿瘤” 但字迹潦草,AI 因 “肿瘤” 在医学文本中高频出现,误判为 “有肿瘤”;或把 “疑似病变” 脑补成 “无病变”,这种误差可能导致误诊,甚至危及生命。

另外还有一点,金融领域已有前车之鉴。2025 年某银行用传统 OCR 处理贷款合同,因数字识别偏差(“3” 误读为 “8”)或小数点错位,最终产生 300 万元坏账。

而 DeepSeek 的风险更隐蔽,它不会直白输出乱码,而是将错误信息 “修正” 为合理内容。比如合同金额 “100,000” 因污渍少一个零,模型可能预判为 “10,000”,输出看似无误的结果,人工复核时极难察觉。



硅谷工程师已反馈类似问题,处理发票收据时,模型偶尔会虚构日期和金额,并非随机乱填,而是结合消费习惯、商家信息编造 “无懈可击” 的内容。这对审计工作而言形同埋雷;法律合同中,一个 “不” 字被遗漏或脑补添加,可能直接反转案件性质。

告别唯参数论,我们需要什么样的 AI?

话说回来,DeepSeek-OCR 并非一无是处。处理纸质小说转电子书、整理会议纪要等对精度要求不高的场景,它确实效率出众,些许误差不影响使用。



但中日联合团队的研究,给狂热的 AI 行业敲了警钟,我们不能再单纯迷信 “参数量” 和 “压缩比”。这就像买车,极速再高,若烂路易抛锚、刹车失灵,也无法放心驾驶。

未来的多模态 AI,必须解决 “视觉 - 语言失衡” 问题。技术层面,或许需要调整模型架构,提升视觉模块权重,避免语言模块 “一家独大”;或如专家建议,增设 “视觉真实性校验模块”,让 AI 输出前回头核对原图,生成的内容是否真实存在?即便句子再通顺,无视觉依据也不能随意补充。



此外,行业测试标准也需革新。不能仅用规范 PDF 文档跑分,应增加 “破坏性测试”:遮挡、涂改、模糊文本,甚至植入错别字,检验模型是否能如实识别错误,而非自作聪明地修正。唯有通过这类测试的 AI,才能放心应用于合同审核、医疗诊断等关键场景。

对普通用户而言,用这类工具处理重要文件时需保持警惕,效率固然重要,但务必核对原件。毕竟在真金白银和法律责任面前,AI 的 “脑补” 可无法买单。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
赵四走了,观众集体失眠,一个抽搐的背影成了时代注脚

赵四走了,观众集体失眠,一个抽搐的背影成了时代注脚

阿废冷眼观察所
2026-02-01 05:52:53
陕甘之战——汉人最伟大的一场巅峰战役,带领华夏重回世界之巅

陕甘之战——汉人最伟大的一场巅峰战役,带领华夏重回世界之巅

小豫讲故事
2026-01-31 06:00:10
金价大跳水后,男子斥资20多万元抄底买入200克,称“不在意短期涨跌”,还有人称“肯定会回调”,工行、农行、交行公告

金价大跳水后,男子斥资20多万元抄底买入200克,称“不在意短期涨跌”,还有人称“肯定会回调”,工行、农行、交行公告

每日经济新闻
2026-02-01 10:38:04
特朗普称就格陵兰岛的谈判即将达成一致

特朗普称就格陵兰岛的谈判即将达成一致

财联社
2026-02-01 10:44:04
70岁后想多活30年,记住这5句话,活好余生每一日

70岁后想多活30年,记住这5句话,活好余生每一日

青苹果sht
2026-01-31 05:27:33
可怕的不是批评牢A,而是批评牢A的官媒被骂上热搜

可怕的不是批评牢A,而是批评牢A的官媒被骂上热搜

廖保平
2026-02-01 09:17:27
快讯|王石社交媒体发文疑自证 此前有失联传言流出

快讯|王石社交媒体发文疑自证 此前有失联传言流出

每日经济新闻
2026-02-01 11:42:43
全球唯一一只不属于中国的熊猫,叫欣欣,吃不到竹子吃的是仙人掌

全球唯一一只不属于中国的熊猫,叫欣欣,吃不到竹子吃的是仙人掌

西楼知趣杂谈
2026-01-31 13:18:43
知道不好骗了,所以开始硬抢了!

知道不好骗了,所以开始硬抢了!

胖胖说他不胖
2026-01-31 13:36:22
爱泼斯坦在厨房追逐女孩视频被公开

爱泼斯坦在厨房追逐女孩视频被公开

观威海
2026-02-01 11:46:04
李嘉诚进退两难!巴拿马彻底倒向美国,长和的港口合同被强行取消

李嘉诚进退两难!巴拿马彻底倒向美国,长和的港口合同被强行取消

青青子衿
2026-01-30 18:22:26
老外看不下去了!吐槽国产手机抄袭iPhone:为了像苹果 3个摄像头里有1个是假的

老外看不下去了!吐槽国产手机抄袭iPhone:为了像苹果 3个摄像头里有1个是假的

快科技
2026-02-01 11:55:44
斯塔默上海行,身边为何是这位“中文十级”的英国女星?

斯塔默上海行,身边为何是这位“中文十级”的英国女星?

都市快报橙柿互动
2026-01-31 17:54:37
难以置信!郑州网友哭诉公司年会抽中苹果17,奖品被顶头上司盯上

难以置信!郑州网友哭诉公司年会抽中苹果17,奖品被顶头上司盯上

火山诗话
2026-02-01 10:26:39
跌成白菜价,电视却卖不动了!14亿人干不过3亿美国人,太扎心

跌成白菜价,电视却卖不动了!14亿人干不过3亿美国人,太扎心

阿器谈史
2026-01-31 23:19:36
“擦边”卖了超百亿,处罚来了!

“擦边”卖了超百亿,处罚来了!

中国新闻周刊
2026-01-31 19:30:13
应急管理部部长王祥喜被查,曾牵头处置2023年阿拉善左旗煤矿重大坍塌事故

应急管理部部长王祥喜被查,曾牵头处置2023年阿拉善左旗煤矿重大坍塌事故

齐天候
2026-01-31 17:41:49
爱泼斯坦案最后一批文件曝光!特朗普被提到数百次,还牵出一众大佬

爱泼斯坦案最后一批文件曝光!特朗普被提到数百次,还牵出一众大佬

上观新闻
2026-02-01 05:00:09
钱再多有什么用?52岁刘强东上千亿身家,儿子却是他一生的遗憾

钱再多有什么用?52岁刘强东上千亿身家,儿子却是他一生的遗憾

揽星河的笔记
2026-01-31 12:28:29
大S一家没说谎,主动放弃遗产,面相全变的具俊晔,证实她们的话

大S一家没说谎,主动放弃遗产,面相全变的具俊晔,证实她们的话

银河史记
2026-01-31 16:06:46
2026-02-01 15:51:00
百科密码 incentive-icons
百科密码
专注趣味科普人文百科。
3252文章数 5609关注度
往期回顾 全部

科技要闻

腾讯元宝宣布:10亿现金红包,今日开抢

头条要闻

马斯克曾问爱泼斯坦:岛上哪一晚会有"最疯狂的派对"

头条要闻

马斯克曾问爱泼斯坦:岛上哪一晚会有"最疯狂的派对"

体育要闻

锁喉吃红牌+扇耳光 英超15人打群架

娱乐要闻

马年春晚第三次联排,多位明星现身

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

本地
时尚
房产
公开课
军事航空

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

伊姐周六热推:电视剧《年少有为》;电视剧《有罪之身》......

房产要闻

藏不住的小城大事,海澄新城执掌自贸港风口,进阶兑现美好生活新篇

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗民众:伊朗不会屈服于美国霸权

无障碍浏览 进入关怀版