网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

DeepSeek新模型被硅谷疯夸！用二维视觉压缩一维文字，单GPU能跑

2025-10-21 07:52:02　来源: 新浪财经

北京举报

0

分享至

来源：市场资讯

（来源：量子位）

DeepSeek最新开源的模型，已经被硅谷夸疯了！

因为实在太DeepSeek了。3B规模、指数级效能变革、大道至简，甚至被认为把谷歌Gemini严防死守的商业机密开源了。

唯一的问题可能就是被“OCR”命名耽误了。

是的，DeepSeek刚刚开源即火爆的模型就叫：DeepSeek-OCR。

这个模型瞄准的是大模型处理长文本时的算力爆炸难题……虽然模型参数很小，但四两拨千斤，其背后所代表的“用视觉方式压缩一切”的思想，大道至简，既是人类智能的现实，也不断出现在诸如《三体》的科幻作品中。

简单来说，由于一张图能包含大量文字（用的token还更少），所以他们想到并验证了“将视觉作为文本压缩媒介”这一方法——就好比优秀的人看书都是扫一眼就知道内容，不必一字一句读完才理解内容。

一图胜千言。

而且DeepSeek研究后发现，当压缩率小于10倍时（即文本token数是视觉token数的10倍以内），模型OCR解码准确率高达97%；即使压缩率高达20倍，准确率依旧能保持在60%左右，效果相当能打。

更主要的是，DeepSeek再次展现了高效能风格，他们的方法之下，生成训练数据——仅凭一块A100-40G GPU，每天就能生成超过20万页的优质LLM/VLM训练数据。

所以这个研究一经公布，已经快速在GitHub斩获了3.3K star。HuggingFace则已经热榜第二……X上热议，好评声一片。

刚“尖锐”评价过AI现状的卡帕西说：我很喜欢……特别是图像比文字更适合LLM输入，妙啊。

还有人认为这是“AI的JPEG时刻”，AI记忆架构打开了新路径。

还有爆料猜测，谷歌Gemini的核心商业机密被开源了：

当然，如此火爆的工作还带了更多思考——不少人看过论文后，认为这种统一视觉与语言的方法，或许是通往AGI的大门之一。

以及DeepSeek还在论文中，谈到了AI的记忆和“遗忘”机制。

所以，DeepSeek的新模型，论文究竟是怎么说的？

DeepSeek新研究：两大核心组件实现“以小博大”

概括而言，DeepSeek这次提出了一种名为“上下文光学压缩”（Contexts Optical Compression）的思路。

其灵感来自这样一个巧妙的逆向思维：

既然一张图片能“装下”成千上万个字，那我们能不能把文字信息压缩到图片里，让模型通过“看图”来理解内容呢？

本质上来说，这就是一种视觉-文本压缩范式，通过用少量的视觉token来表示原本需要大量文本token的内容，以此降低大模型的计算开销。

为验证这一想法，他们构建了3B大小的DeepSeek-OCR模型，结果发现它在主流文档解析基准OmniDocBench上取得了新SOTA。

下图显示，DeepSeek-OCR（红色圆点）在“平均每张图的视觉token数”（横轴）上位于最右侧，这说明它使用的token数量最少；而在“整体性能”（纵轴，越低越好）上，它却达到了SOTA水平，而且大多还是“以小博大”。

更具体的对比如下：

这一切背后都不开DeepSeek-OCR架构的两大核心组件：

这里重点说一下整个系统的创新关键——编码器DeepEncoder。

其核心使命为，在处理高分辨率图像时，能够产出数量极少但信息密度极高的视觉token。

为此它采用了“先局部处理，再压缩，后全局理解”的串行设计：

此外值得一提的是，为了灵活应对不同的压缩比需求和实际应用场景，DeepEncoder被训练成支持从“Tiny”（512x512, 64token）到“Gundam”（动态分块，近800token）等多种输入模式。

就是说，同一个模型可以根据任务需要，随机应变地调整其“压缩强度”。

总之，基于以上原理和组件搭配，目前DeepSeek-OCR除了具备常规识别能力，还支持对金融报表、化学分子式、数学几何图、100多种语言等更为复杂的图像进行深度解析。

三位作者亮相

如此被夸赞的新研究，来自三位研究人员，依然很DeepSeek——几人都相对低调，网上公开资料很少。

Haoran Wei，曾就职于阶跃星辰，当时还主导开发了意在实现“第二代OCR”的GOT-OCR2.0系统。

（2024年9月发表的这篇论文显示，身为论文一作的Haoran Wei所处单位为阶跃。）

此次DeepSeek-OCR的工作也可谓延续了GOT-OCR2.0之前的技术路径，即致力于通过端到端模型解决复杂文档解析问题。

Yaofeng Sun，从去年开始就陆续参与DeepSeek多款模型研发，包括R1、V3中都有他的身影。

Yukun Li（李宇琨），谷歌学术论文近万引研究员，也持续参与了包括DeepSeek V2/V3在内的多款模型研发。

有意思的是，这三人在提出DeepSeek-OCR之后，还贡献了一个脑洞大开的想法——

用光学压缩模拟人类的遗忘机制。

只需将上下文光学压缩与人类记忆的衰退过程进行类比，我们就能发现二者高度相似：

这样一来，理论上模型就可以在处理超长对话或文档时，动态地为不同时期的上下文分配不同数量的计算资源，从而可能构建出一种无限长上下文的架构。

团队表示，虽然这还是个早期研究方向，但不失为模型处理超长上下文的一种新思路。

这个思路确实也更像人类的智能。

之前AI的上下文研究，对于短期中期远期的都是一视同仁，机器味儿十足，但计算资源和响应问题也会相应暴涨……

而现在，DeepSeek提出新思路，是时候让AI记忆更像人了。

传送门：

Hugging Face：

https://huggingface.co/deepseek-ai/DeepSeek-OCR

GitHub：

https://github.com/deepseek-ai/DeepSeek-OCR

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

美反华机构：以后我们每年都要去中国

澎湃新闻 2026-07-28 14:48:08
11712 跟贴 11712
男子遇到挑山工师傅休息，帮忙挑一程尝试下他们的工作

无限鹤壁 2026-07-28 17:27:25
274 跟贴 274

郑大一附院药学部原主任帮助药品进医院，销售金额10.45亿，分成2433万，为躲审查由药商代持

大风新闻 2026-07-28 18:31:41
2075 跟贴 2075

广东一医生工作群里发布极端请假言论引热议医院：高度重视，正在核实调查

封面新闻 2026-07-29 10:58:03
2304 跟贴 2304
上半年税务部门累计征收税费收入16.7万亿元！得益于经济运行总体平稳向好，国家财力保障不断夯实

每日经济新闻 2026-07-28 17:09:08
8497 跟贴 8497

行李箱忘高铁上不给转运女子找朋友开6个小时车取回

大风新闻 2026-07-28 19:56:33
497 跟贴 497

柳智宇谈邓煜、王虹获奖：羡慕他们的纯粹，但从未后悔自己的选择

新京报 2026-07-28 19:05:29
530 跟贴 530
40℃的高温，可乐和冰红茶却“没人要”

蓝鲸新闻 2026-07-28 20:28:17
960 跟贴 960

浙江衢州一骑行步行道上装栏杆？当地体育事业发展中心：防止摩托车电瓶车驶入设置，已将栏杆拆除

洪观新闻 2026-07-28 17:06:13
108 跟贴 108
吴起县联合调查组：大家无需恐慌

新京报政事儿 2026-07-29 06:53:00
867 跟贴 867
游客在景区看演出被激光灼伤眼景区：小概率事件

潇湘晨报 2026-07-27 20:30:14
256 跟贴 256
英官员称在英吉利海峡遭法军舰射击法方暂无回应

界面新闻 2026-07-28 20:48:53
1441 跟贴 1441
天津一女子脚卡方向盘自救2小时后报警：做了很大心理斗争，当时觉得特丢人

潇湘晨报 2026-07-28 22:09:29
70 跟贴 70
广汽埃安推出RAY全新车系

界面新闻 2026-07-28 21:05:46
120 跟贴 120
C919高原型首架机完成首飞

新京报 2026-07-29 10:07:24
777 跟贴 777
废旧硒鼓“回收利用”竟重现涉密文件？很“刑”！

齐鲁壹点 2026-07-29 07:44:32
28 跟贴 28
别碰！厦门沙滩露出密密麻麻的“小管子”

海峡导报大生活 2026-07-29 10:53:38
3 跟贴 3
携程现低价机票，广州飞伦敦不到800元，客服：暂未接到异常通知

齐鲁壹点 2026-07-29 07:22:12
44 跟贴 44
官宣！俄罗斯延长对中国公民的免签政策

大象新闻 2026-07-28 16:31:13
220 跟贴 220
追梦：与库里联手有很大舆论压力是勇士没能签下老詹的原因之一

北青网-北京青年报 2026-07-29 10:14:09
43 跟贴 43
黄总邀请你去包厢：神秘的“黄总”究竟是何方神圣？

雾满拦江 2026-07-29 12:13:36
0 跟贴 0
医院内一男子被殴打？院方：网传监控不完整，双方互殴产生纠纷；辖区派出所：已立案，正调查

大风新闻 2026-07-29 12:18:12
0 跟贴 0

鱼被妻子倒面粉全死光，男子坚决离婚：人到中年，再吵也别踩底线

鱼被妻子倒面粉全死光，男子坚决离婚：人到中年，再吵也别踩底线

爱写的樱桃

2026-07-27 20:15:40

智商230却绅士从容，陶哲轩被称最正常数学家

智商230却绅士从容，陶哲轩被称最正常数学家

粤语音乐喷泉

2026-07-27 17:55:53

中国少年0-19惨败老挝小孩，董路却直言羡慕为何？

中国少年0-19惨败老挝小孩，董路却直言羡慕为何？

天光破云来

2026-07-29 00:08:18

湖人老板爆大瓜！涉嫌160亿，已经被扣押，萧华和联盟迎来新挑战

湖人老板爆大瓜！涉嫌160亿，已经被扣押，萧华和联盟迎来新挑战

你的篮球频道

2026-07-29 10:34:23

有种赚钱方式叫“信息差”网友：一年赚到了几辈子都花不完的钱！

有种赚钱方式叫“信息差”网友：一年赚到了几辈子都花不完的钱！

另子维爱读史

2026-07-26 22:26:01

曾是上海台知名解说，离职后当大公司副总，56岁太沧桑仍在解说席

曾是上海台知名解说，离职后当大公司副总，56岁太沧桑仍在解说席

阿讯说天下

2026-07-28 14:17:58

孟晚舟事件后，中加停了九年的国安对话突然重启，信号不一般

孟晚舟事件后，中加停了九年的国安对话突然重启，信号不一般

农城浪子

2026-07-28 09:11:05

兰州城破后，2000马家军随即跳入黄河，彭德怀：14年血债结清了！

兰州城破后，2000马家军随即跳入黄河，彭德怀：14年血债结清了！

老谢谈史

2026-07-28 10:48:26

庄则栋临终前放心不下日本妻子，眼噙泪水：你没有医保，没有工资

庄则栋临终前放心不下日本妻子，眼噙泪水：你没有医保，没有工资

抽象派大师

2026-05-12 20:36:26

果然不出大陆所料：蓝营三人对台表述罕见升级，郑丽文这次赌对了

果然不出大陆所料：蓝营三人对台表述罕见升级，郑丽文这次赌对了

小陆搞笑日常

2026-07-28 12:11:25

银行员工透露，存款过万办纸质存单的人，其实在交一种隐形税

银行员工透露，存款过万办纸质存单的人，其实在交一种隐形税

户外钓鱼哥阿旱

2026-07-28 13:13:38

“这学历，海底捞都不认！”姐姐晒录取通知书，2字之差，啪啪打脸！

“这学历，海底捞都不认！”姐姐晒录取通知书，2字之差，啪啪打脸！

林林先生

2026-07-28 07:30:03

省长刘小涛一周连见两位行业巨头！江苏的产业大棋局，藏不住了

省长刘小涛一周连见两位行业巨头！江苏的产业大棋局，藏不住了

创客公社-江苏第一创投媒体

2026-07-28 22:03:29

长鑫上市造富神话蔓延婚恋圈！网友喊话“找持股5%的高管男朋友”，高中同学已不回消息：一朝身价A10，朋友圈不再可见

长鑫上市造富神话蔓延婚恋圈！网友喊话“找持股5%的高管男朋友”，高中同学已不回消息：一朝身价A10，朋友圈不再可见

金融界

2026-07-29 11:05:44

我去医院看望53岁植物人大姨，护工借着换药，偷偷塞给我一张字条：别交钱了，查查上周三半夜的监控

我去医院看望53岁植物人大姨，护工借着换药，偷偷塞给我一张字条：别交钱了，查查上周三半夜的监控

背包旅行

2026-07-28 11:28:26

再打下去可能灭国，4年前乌克兰还有4300多万人，如今还有多少？

再打下去可能灭国，4年前乌克兰还有4300多万人，如今还有多少？

麓谷隐士

2026-07-28 06:05:03

历史上“最懒”的诗人：一生就写了一首诗，只有两句，人人都会背

历史上“最懒”的诗人：一生就写了一首诗，只有两句，人人都会背

凉州辞

2026-07-21 11:40:03

又一电影突然宣布：撤档！上映仅5天

又一电影突然宣布：撤档！上映仅5天

南方都市报

2026-07-29 08:40:48

江苏发布高温黄色预警：预计29至31日，南京、无锡、常州、苏州、南通、镇江、扬州南部、泰州中南部地区最高气温可达35℃以上

江苏发布高温黄色预警：预计29至31日，南京、无锡、常州、苏州、南通、镇江、扬州南部、泰州中南部地区最高气温可达35℃以上

鲁中晨报

2026-07-29 10:00:15

果然，这届年轻人个个都是“遮丑高手”！我以前怎么没想到，太绝了

果然，这届年轻人个个都是“遮丑高手”！我以前怎么没想到，太绝了

一枚大装家

2026-07-28 12:15:03

新浪财经是一家创建于1999年8月的财经平台

4249059文章数 9077关注度

往期回顾全部

科技要闻

千名AI员工联署：别让AI快到人类跟不上

头条要闻

女子偷走3瓶茅台后多次变装警方未在其屋内发现白酒

头条要闻

女子偷走3瓶茅台后多次变装警方未在其屋内发现白酒

体育要闻

毫无存在感的NBA状元，最先谢谢惠顾？

娱乐要闻

吴镇宇儿子自曝小学时遭同学霸凌

财经要闻

“轻AI”策略重塑科技股叙事？

汽车要闻

24K金LOGO，纯手工打磨腰线，第二代腾势D9暗夜鎏金高定色，一天只能造3台？

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

艺术

游戏

亲子

房产

中风急救吃安宫牛黄丸？千万别乱喂

艺术要闻

造价20亿美元！印度首富的家，舆论上两极分化

《柏拉图深空》8 月 14 日发售追寻记忆科幻冒险

亲子要闻

怪不得咱们小时候不容易生病，因为不管是吃的喝的还是体能训练，早早的就安排上了

房产要闻

拿下百亩宅地！又一河北民企，重仓海南！

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版