网易首页 > 网易号 > 正文 申请入驻

DeepSeek革了Adobe们的命

0
分享至

(文/陈济深 编辑/张广凯)

当开年以来AI界都在讨论智能体和AI员工的话题时,DeepSeek在1月27日悄无声息地发布了一项看似"无聊"的更新——DeepSeek-OCR2。


作为2025年10月20日DeepSeek-OCR1发布后时隔三个月的最新更新,尽管看似并不如传说中的V4让人期待,但是DeepSeek-OCR2的公布可能直接敲响了OCR(文档识别)这个千亿级市场的丧钟。

过去十年,OCR一直是一门隐秘而暴利的生意。从Adobe的PDF编辑器,到扫描全能王的会员费,再到亚马逊AWS Textract昂贵的API调用,无数公司靠着"教机器认字"赚取了丰厚的利润。

以全能扫描王的母公司合合信息为例,其财报显示公司毛利率常年以来维持在85%的水平。但一夜之间,DeepSeek告诉市场:识图认字可以不需要这么贵。

从机械扫描到智能阅读

DeepSeek-OCR2的核心创新在于引入了名为DeepEncoder-V2的新型编码器结构,它能够根据图像语义动态调整视觉信息的处理顺序,使模型在进行文字识别前先对视觉内容进行智能排序。

传统OCR就像一个"勤奋但死板的抄写员",它通常按从左到右、从上到下的顺序机械地扫描图片。

这种模式的死穴在于"不懂逻辑"。遇到报纸的跨栏排版,它会把两篇无关的文章拼在一起;面对扭曲的发票,就找不到对齐线;对于密集的小字财报,只能看到模糊化的文本。

而DeepSeek-OCR2引入了"视觉因果流"的概念。在DeepEncoder-V2中,研究团队用一种类语言模型结构替代了原先基于CLIP的视觉编码模块,并在编码器内部引入可学习的"因果流查询token"。

其编码器同时包含双向注意力与因果注意力两种处理模式,原始视觉信息通过双向注意力进行全局感知,而新增的查询标记则通过因果注意力逐步建立语义顺序。

这相当于给AI戴上了"自适应显微镜"。它不再暴力压缩图片,而是根据内容密度动态切片。哪里字多,就切细点看;哪里是空白,就跳过。

理解力的革命

在OmniDocBench v1.5基准上的测试结果显示,在视觉token上限更低的情况下,DeepSeek-OCR2的整体得分达到91.09%,相较DeepSeek-OCR提升了3.73%。特别是在阅读顺序准确度方面,编辑距离从0.085降至0.057。

但性能提升只是表象,真正革命性的是其背后的理解能力。

DeepSeek-OCR2不是简单地把图变成文字,而是直接输出Markdown或JSON格式。它看到的不是线条和墨水,而是"键值对"。

这意味着企业原本需要雇佣工程师编写大量正则表达式来清洗数据的工作,瞬间失去了价值。更关键的是它自带质量控制功能。如果你给它一张沾了油渍的超市小票,污渍挡住了"总价",传统OCR会诚实地输出一堆乱码。DeepSeek会读取上面的所有单价和数量,在"心里"做一遍加法,然后推理出:"虽然这里看不清,但根据计算逻辑,总价应该是108.5元"。

这种自带逻辑校验的能力,是银行流水审核、保险理赔录入梦寐以求的"圣杯"。

同时,人类商业文档充满了潜台词:加粗意味着强调,红色意味着亏损,箭头意味着流程。传统OCR会丢掉这些信息,而DeepSeek能保留这些"情绪和重点"。

未来的AI分析师,不仅能读懂财报里的数字,还能读懂管理层试图用排版掩盖的坏消息。

200倍价差的降维打击

除了性能上的进化,DeepSeek再次给了OCR行业一点价格震撼。

根据AWS官方定价,使用Textract的Analyze Document API处理表格,在美国西部(俄勒冈)地区的价格为每页0.015美元(前100万页),超过100万页后为每页0.010美元。如果使用Custom Queries功能,价格更是高达每页0.025美元(前100万页),超过100万页后为每页0.015美元。使用Pretrained Forms和Custom Queries的组合,价格达到每页0.065美元(前100万页)。

这意味着,处理1000页带有复杂表格的金融文档,使用AWS Textract大约需要65美元(约合人民币470元)。

而DeepSeek的Token计费模型,处理同样信息量的文档,成本约为0.28美元(约合人民币2元)。如果命中缓存,成本甚至低至0.028美元。从65美元到0.28美元,这是超过200倍的成本差距。

在任何商业竞争中,当挑战者的成本只有你的1/200时,原本引以为傲的"独家算法"、"私有数据集"都变得毫无意义。

谁在颤抖,谁在狂欢

DeepSeek-OCR2的出现直接让以合合信息、汉王科技、ABBYY为代表的传统OCR厂商"我们积累了十年的票据模板,大模型做不好这些长尾场景"的叙事逻辑直接崩塌。

不过对于不同类型的OCR厂商而言,DeepSeek对他们的冲击显而易见。

合合信息的C端产品主要是扫描全能王、名片全能王、启信宝等APP,B端产品主要是面向各行业客户提供的智能文字识别、商业大数据的产品和服务。当DeepSeek证明了:大模型不仅能做,而且不需要专门训练就能做得更好。当通用模型的泛化能力覆盖了垂直模型的专业能力,这些公司的技术壁垒就消失了,只剩下脆弱的客户关系。

而Adobe Acrobat作为PDF时代的王者,其逻辑是"编辑"。在AI时代,用户不需要"编辑"PDF,需要的是"重构"内容。如果DeepSeek能直接读懂PDF并将其完美转化为可编辑的Word,甚至直接提取数据进入数据库,那么"PDF编辑器"这个工具本身就失去了存在的意义。

AWS Textract的定价从基础文字检测的每页0.0015美元,到表格提取的每页0.015美元,再到表单处理的每页0.05美元。云厂商习惯了将每一个功能封装成昂贵的API出售。DeepSeek的开源策略让企业发现:原来我不需要交这笔"过路费"。

开发者可以在本地部署一个开源的DeepSeek模型,既保护了隐私,又省下了巨额预算。但对于更广泛的商业世界,当机器"读书"不再昂贵,新的机会正在涌现。

原本因为OCR成本高昂而无法实现的小微企业征信服务变得可行;大规模的试卷批改和学习资料数字化成为现实;病历、检查报告的自动化处理和分析得以普及;合同审查、案例检索的智能化升级也将加速。

开源生态的胜利

值得注意的是,DeepSeek-OCR2采用了阿里巴巴轻量级千问Qwen2-0.5b模型取代架构中关键组件之一,展现了中国开源生态系统推动人工智能发展的日益重要性。

DeepSeek团队认为,这为迈向统一的全模态编码器提供了一条有希望的路径。未来,单一编码器可能通过配置特定模态的可学习查询,在同一参数空间内实现对图像、音频和文本的特征提取与压缩。

这种开源协作模式带来的不仅是技术迭代的加速,不同团队的技术成果可以快速整合;更重要的是成本的大幅降低,避免重复造轮子,研发成本得以分摊;最终带来的是整个生态系统的繁荣,更多开发者可以基于开源模型构建应用。

DeepSeek-OCR2的发布,不仅仅是一个技术新闻。它标志着OCR这一伴随了计算机行业几十年的技术,正式完成了历史使命——从一种需要高价购买的"服务",变成了水电煤一样的"基础设施"。

根据DeepSeek公布的技术报告,该模型在保持极高精度的同时,严格控制了计算成本,其视觉Token数量被限制在256至1120之间。这种极致的效率优化,正是基础设施化的典型特征。

对于Adobe和合合信息们来说,凛冬已至;但对于更广泛的商业世界,当机器"读书"不再昂贵,海量沉睡在纸张、PDF和图片里的数据资产,才真正迎来了被唤醒的时刻。

DeepSeek革掉的不是某一家公司的命,它革掉的是旧时代关于"获取信息需要高昂成本"的命。

在这个AI重塑一切的时代,任何建立在信息不对称和技术门槛上的商业模式,都将面临来自开源世界的降维打击。而这,或许只是开始。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
全网吵翻!女子带娃8小时突袭异地分居丈夫,网友们发现不对劲

全网吵翻!女子带娃8小时突袭异地分居丈夫,网友们发现不对劲

一盅情怀
2026-01-27 16:12:31
足智多谋!贵叔用场均7分之人打爆北京队,贾磊:不得不佩服贵叔

足智多谋!贵叔用场均7分之人打爆北京队,贾磊:不得不佩服贵叔

南海浪花
2026-01-29 06:45:31
半导体行业并购潮起,这3家被低估的设计公司或成巨头猎物!

半导体行业并购潮起,这3家被低估的设计公司或成巨头猎物!

小白鸽财经
2026-01-27 20:30:03
Lisa 太敢了!耐克鞋改成 “比基尼” 红勾战袍,引网友热议!

Lisa 太敢了!耐克鞋改成 “比基尼” 红勾战袍,引网友热议!

LOGO研究所
2026-01-28 18:07:40
今夜,涨疯了!

今夜,涨疯了!

中国基金报
2026-01-29 00:19:43
我妈给我500万,我买了一套房,男友大发雷霆:那是我妹的救命钱

我妈给我500万,我买了一套房,男友大发雷霆:那是我妹的救命钱

纸鸢奇谭
2026-01-26 16:59:59
被曝生下畸形儿仅1月,阚清子官宣喜讯,两天发5文,答案不言而喻

被曝生下畸形儿仅1月,阚清子官宣喜讯,两天发5文,答案不言而喻

喜欢历史的阿繁
2026-01-29 08:09:54
终于有人管管美国了!美国遇到大麻烦,美国:中美两国需要携手

终于有人管管美国了!美国遇到大麻烦,美国:中美两国需要携手

福建平子
2026-01-28 10:52:25
伊朗目前的武力值,还能不能打一打?

伊朗目前的武力值,还能不能打一打?

黄娜老师
2026-01-29 00:44:55
人均600万到欠400亿,毁掉“天下第一村”的不是别人,是他们自己

人均600万到欠400亿,毁掉“天下第一村”的不是别人,是他们自己

一家说
2025-05-23 15:05:58
突发!字母哥将被交易!离开雄鹿!

突发!字母哥将被交易!离开雄鹿!

寒律
2026-01-29 00:52:41
高压电线为啥不用铜线,而全用铝线?是为了省钱吗?

高压电线为啥不用铜线,而全用铝线?是为了省钱吗?

向航说
2026-01-22 00:55:03
局长被免职后去世,全局只有我去吊唁,后来他的妻子担任市委书记

局长被免职后去世,全局只有我去吊唁,后来他的妻子担任市委书记

秋风专栏
2025-12-29 16:32:49
加州先跳,“加拿大进口中国电车,一整个期待住了”

加州先跳,“加拿大进口中国电车,一整个期待住了”

观察者网
2026-01-28 11:39:16
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

戗词夺理
2026-01-24 16:05:41
App死了八年,车贴文化反而越传越广

App死了八年,车贴文化反而越传越广

乱翻书
2026-01-27 19:42:22
具俊晔沉冤得雪!放弃大S遗产,小玥儿北京学校定了,头像曝光

具俊晔沉冤得雪!放弃大S遗产,小玥儿北京学校定了,头像曝光

古希腊掌管月桂的神
2026-01-27 16:55:07
媒体人:在李扬未能加盟后,上海海港将目标锁定韩鹏飞

媒体人:在李扬未能加盟后,上海海港将目标锁定韩鹏飞

懂球帝
2026-01-29 00:50:07
美国、英国、法国、德国发表联合声明

美国、英国、法国、德国发表联合声明

环球时报国际
2026-01-28 00:16:49
至今仍健在的开国将帅只剩下一位,已经102岁高龄,身体依旧健朗

至今仍健在的开国将帅只剩下一位,已经102岁高龄,身体依旧健朗

卷史
2026-01-27 12:19:26
2026-01-29 08:44:49
观察者网 incentive-icons
观察者网
全球视野,中国关怀
133389文章数 1849758关注度
往期回顾 全部

科技要闻

刚刚,特斯拉交出"极寒"财报:利润暴跌61%

头条要闻

牛弹琴:全世界都在屏息等待 一场大战即将到来

头条要闻

牛弹琴:全世界都在屏息等待 一场大战即将到来

体育要闻

没天赋的CBA第一小前锋,秘诀只有一个字

娱乐要闻

金子涵拉黑蔡徐坤,蔡徐坤工作室回应

财经要闻

从万科退休20天后,郁亮疑似失联

汽车要闻

新手必看!冰雪路面不敢开?记住这4点 关键时刻真能保命

态度原创

手机
时尚
本地
亲子
公开课

手机要闻

CounterPoint预估2026全球手机芯片出货量:联发科同比降8%

冬天大衣怎么穿才更好看?选好颜色、找对单品,高级简约又大气

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

亲子要闻

何穗称没有年龄焦虑,生命力是最重要的,自曝月子后做了二次手术

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版