网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

DeepSeek昨天开源的新模型，有点邪门。

2025-10-22 00:10:13　来源: 差评XPIN

浙江举报

0

分享至

DeepSeek 又整出新东西来了，只用到原本十分之一 token，就能存下几乎一样的文字信息，这压缩比，香农看了都要流泪，冯·诺伊曼看了都要沉默。

更是直接把一堆老外给钓成了翘嘴。

昨天，DeepSeek 发布了新模型 DeepSeek-OCR，OCR 这东西咱们都熟悉，就是把图片里的文字给识别出来。

经常用微信的差友应该知道，微信客户端里的图片，被咱们点开后，是可以直接复制文字的。

没错，这就是一种 OCR 技术的应用。

但是 DeepSeek 这次的「技能 OCR」则是刚好相反，它可以把大量文字变成一张图片，作为 AI 的“记忆载体”。

是的，用文字来存储信息，已经不够满足它了。

过去的大模型，不管是什么 ChatGPT、Gemini、Llama、Qwen、还是 DeepSeek 过去的自己，在读取数据的用的都是一种方式：文字，也就是平时常说的 token。

我们写的 Prompt，会被转换成一大堆的 token 给大模型，我们提供的参考资料，会被转换成一大堆的 token 给大模型，就算是能识别图像的多模态的大模型，也是要先把图片转换成了一段文字描述，来交给大模型来做辨认才行。

但文字 token 真的就是大模型理解世界的唯一方式么？

DeepSeek 决定试一试新的路子，毕竟，如果咱们把一张图片和一段文字放在一起，前者明显可以包含下更多的信息。

比如这个描述，就不够全面

既然如此，那我们能不能直接用图片来训练大模型？

于是 DeepSeek 就开始整，结果发现这个用图片训练出来的模型，既中看，又中用。

一方面，它可以用更少的 token，来记住更多的内容。

在测试文档理解能力的任务里，DeepSeek-OCR 只用了100 个视觉 token，就超过了需要 256 个 token 的 GOT-OCR 2.0。

再放狠点，它用不到 800 个视觉 token，就吊打了平均要6000+ token的 MinerU 2.0。

这就意味着、当我们让大模型开始使用图像的这种方式来记住数据了之后，模型就有能力用更少的token资源，来取得更好的表达效果。

另外，DeepSeek-OCR 还支持多种分辨率和压缩模式，来适应不同复杂度的文档：

比如说一张只有图片背景和标题文案的 PPT，可能只需要 64 个视觉token 就足够表示了。

如果这页的文字内容比较多，那就会自动切换到 Large 模式，用上最多 400 个视觉token 来记录。

如果觉得还不够的话，DeepSeek-OCR 还能支持动态调整的 Gundam 模式来记忆图片，主打一个应记就记，分清轻重缓急的记。

而且比起过去只能识别文字的传统模型来说，DeepSeek-OCR 能记住的数据还会更多。

论文里的一张柱状体，DeepSeek-OCR 能够自动把它给识别成 Excel 格式给保存下来。

文章里出现的有机化合物的分子结构图片，也能自动转化为标准的 SMILES（简化分子线性输入规范）格式存储。

不但能记住图片本身，DeepSeek-OCR 还会同时记住这张图片的位置，记住图片附近的文字在写些什么东西。。。

过去很多看不到的二维信息，都会被 DeepSeek-OCR 给再次捕获。

这玩意的价值有多大，可能大家一下都还没意识到。

这两年做大模型，除了显卡不够之外的最大问题，就是没有训练的数据了。

常规的数据集之前都用过了，想要再搞点高质量的数据集，要么偷偷去网上爬，要么花大价钱去买，再要么就是想办法自己合成。

但现在，很多过去没采集到的数据，就可以在二维信息里被采集到了。

就比如说很多论文文件，过去，大模型只能学到里面的文字信息，但是里面的各种图表，插图那都是两眼一摸黑。

但用上了 DeepSeek-OCR 之后，就可以把之前缺的这部分给无痛补上了。

实际上 DeepSeek 也是这么想的，在论文里还特意提了一嘴，说这个新模型在一张 A100 上，一天可以给大模型采集出 20 万页以上的训练数据。

所以说，在有了 DeepSeek-OCR 之后，过去的所有数据都值得用它来再识别一遍。

毫无疑问，这些数据，又会成为下一个大模型的养料。

另一方面，用二维的方式来存储数据后，整个模型运行起来也变得更省资源了。

咱都知道，我们在用大模型的时候，聊天聊的越久、上下文越长，这个模型就越容易出 bug。

这是因为大模型在运行的时候，要处理每一个单词，和其他所有单词的关系。

你把对话的长度增加一倍，整个模型的计算量就增加了四倍，增加了两倍，那整个模型的计算量就变成了原本的九倍。

这也是为啥现在大模型厂商都在给你限制上下文长度的原因之一，你要是在一个对话里聊的太嗨了的话，成本要直接卷上天去了。

而在用上了图像记忆之后，DeepSeek 可以把 token 的数量，压缩到原本的十分之一。。。

同时，还不会让性能有太大的损失。

在论文里可以看到，初出茅庐的 DeepSeek-OCR，就能用原本 1/10 的token 数量，达到原模型 96.5%的准确率。

即使哥们再狠点，给它压缩个20倍，模型的准确率，也还能保持个六成左右。。。

同时，DeepSeek 的研究人员还发现了一件好玩的事情。

他们会感觉大模型通过不同的清晰度来存储图像的方式，其实和我们人类遗忘信息的方式很像。

对我们人类来说，遗忘是一个循序渐进的过程。

刚发生的事情，就有点像是 DeepSeek 用 Gundam 模式存下来的数据，最清晰。

而随着时间的推移，这件事的重要性也会逐渐降低，存储它的格式也会从最大的 Gundam 一路降级，从 Large 一路降到最小的 Tiny，占用的 token 数量也会越来越少。

把这个概念引入到大模型里的话，咱们就可以把最近的聊天记录，用“4K HDR蓝光” 的格式来存储，而那些早年不太重要的聊天记录，则是给压缩成 480P 的文件保存。

通过这种主动遗忘的方式，是否能让大模型的上下文能力变得更强呢？

这个想法很有意思，只不过目前就连 DeepSeek 自己也没能给出一个明确的答案。

不过好在 DeepSeek-OCR 还是和过去一样开源的，相信这个问题，要不了多久就会变成热门，整出不少新东西来。

最后，提到开源，我还注意到另外一件事。。。

这次研究不但是 DeepSeek 自己的成果，也是开源社区集体的胜利

比如训练数据里，用到了华为的 Wukong 数据集，在生成样本文字时，借助了百度的 PaddleOCR，而在图像特征提取部分，核心组件竟然是 Meta 开源的 SAM，在视觉语义理解层面，还整合了 OpenAI 的 CLIP 模型。

正是这些来自全球的开源成果，被 DeepSeek 重新编织成了一个能“用图片思考”的 AI。

所以，R2 什么时候会来呢。

撰文：早起

编辑：江江 & 面线

美编：焕妍

图片、资料来源：

DeepSeek 官网

Bilibili、小红书

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

于东来从30岁开始吃药，拍CT上百次，身体出什么问题都不足为奇，哪天说不定没了就没了

新闻晨报 2026-03-25 21:24:37
4693 跟贴 4693
纽约时报：许多美国官员从未去过中国应该去中国看看

环球网资讯 2026-03-26 00:05:09
1926 跟贴 1926

张少康辞去广东省人民政府副省长职务

新快报新闻 2026-03-26 11:50:03
21 跟贴 21

生死12分钟！广东一男子踢球时心脏骤停一群医生冲上前接力心肺复苏救回一命

闪电新闻 2026-03-26 11:46:05
53 跟贴 53
收评：沪指跌1.09% 全市场成交额不足2万亿元

证券时报 2026-03-26 15:22:10
449 跟贴 449

10元/斤，最近这一口“鲜货”正肥！杭州一摊主：一天上百斤不够卖

环球网资讯 2026-03-25 13:22:33
432 跟贴 432

中原消费金融为催收“买”借款人手机号码三大运营商均中标或涉买卖个人信息惹争议

信网 2026-03-26 19:12:37
0 跟贴 0
火车站“老师儿！出租车在这乘坐”标语引热议，网友称一看就是山东济南，车站工作人员：在当地这是尊称

极目新闻 2026-03-26 12:06:40
108 跟贴 108

宁马城际铁路最快有望4月底前通车运营

现代快报 2026-03-26 20:02:04
0 跟贴 0
广东一男子买啤酒抽中电动车大奖，将中奖二维码发网上询问后被他人扫走核销，网友：“这下又上了一课”

洪观新闻 2026-03-26 10:56:49
0 跟贴 0
千万粉丝大V，微博账号被禁止关注

第一财经资讯 2026-03-26 12:19:47
53 跟贴 53
联大通过决议，宣布“最严重反人类罪”

澎湃新闻 2026-03-26 11:03:06
80 跟贴 80
泰国征兵广告用张凌赫做海报：想像“武安侯”一样帅气骑马吗？今年四月报名参军选择骑兵部队

闪电新闻 2026-03-26 17:45:38
16 跟贴 16
法系在华销冠车型降价20%，车名叫凡尔赛

第一财经资讯 2026-03-26 10:16:14
94 跟贴 94
美媒称美考虑将援助乌克兰的武器转至中东

新华社 2026-03-26 20:05:17
587 跟贴 587
一天蒸发6200亿！谷歌算法黑科技击溃存储股，华尔街痛批市场“不懂技术”

每日经济新闻 2026-03-26 19:00:13
6 跟贴 6
5家快递企业联合调价行业告别低价“内卷”

中国能源网 2026-03-26 07:40:03
198 跟贴 198
中东局势影响原油进口韩国多地垃圾袋紧缺，有超市每人限购10个，在韩华人：跑七八家便利店“抢到”150个垃圾袋

极目新闻 2026-03-26 19:53:02
19 跟贴 19
首秀库拉索，国足主帅邵佳一：国家队的比赛没有友谊赛

澎湃新闻 2026-03-26 15:58:27
0 跟贴 0
100只整装待发！量产机器狼“-20℃极寒测试”现场曝光

中国网 2026-03-26 15:55:11
97 跟贴 97
市场猫贩子杀猫卖钱，遇到救助人坐地起价，“100元一只猫，不要就拉走杀死！”

把话筒递给猫 2026-03-26 21:28:50
0 跟贴 0
开门杀！电动车连人带车被撞翻！

广西交警总队 2026-03-26 21:25:58
0 跟贴 0
绿化带变停车场，草坪大面积损毁！海口五源河农贸市场违停现象频发

蓬勃新闻 2026-03-26 21:35:50
0 跟贴 0

伊朗获得强援，又一中东国家下场，还是美国亲自送上门的帮手

伊朗获得强援，又一中东国家下场，还是美国亲自送上门的帮手

快看张同学

2026-03-26 14:46:05

2026年身份证就是老年证！爸妈满60岁别办证，这4件事千万不能忘

2026年身份证就是老年证！爸妈满60岁别办证，这4件事千万不能忘

复转这些年

2026-03-26 09:26:17

杨振宁猝然离世5个月后，翁帆突传新消息，怀孕传闻早就真相大白

杨振宁猝然离世5个月后，翁帆突传新消息，怀孕传闻早就真相大白

李橑在北漂

2026-03-25 23:30:59

人狂自有天收

李老逵乱摆龙门阵

2025-09-11 09:01:28

巴基斯坦把稀土卖给美国，以为捏住中国“七寸”，如今自食恶果

巴基斯坦把稀土卖给美国，以为捏住中国“七寸”，如今自食恶果

沧海旅行家

2026-03-25 16:13:09

跟着黄仁勋下注：如今的token可能就是20年的房子

跟着黄仁勋下注：如今的token可能就是20年的房子

梦大明白

2026-03-24 11:05:49

快讯！欧尔班的回旋镖来了！

达文西看世界

2026-03-26 12:23:16

我在小城市，一个人做电商，半年挣300万

我在小城市，一个人做电商，半年挣300万

南风窗

2026-03-26 10:07:51

两大致命短板，一个悬疑谜题！央媒怒批王励勤，国乒王朝悬了？

两大致命短板，一个悬疑谜题！央媒怒批王励勤，国乒王朝悬了？

成吉思热

2026-03-26 10:06:14

伊朗：击中击落美以202架飞机；以方：坦格西里身亡，他负责封锁霍尔木兹！想快速抽身，特朗普：打伊朗不是战争，是“军事行动”

伊朗：击中击落美以202架飞机；以方：坦格西里身亡，他负责封锁霍尔木兹！想快速抽身，特朗普：打伊朗不是战争，是“军事行动”

每日经济新闻

2026-03-26 17:27:09

他俩才是最牛岳父母，3个女儿全嫁百亿富豪，一个比一个漂亮厉害

他俩才是最牛岳父母，3个女儿全嫁百亿富豪，一个比一个漂亮厉害

白面书誏

2026-03-26 18:13:05

79元太火！小米磁吸玩偶卖断货官方承诺加快生产

79元太火！小米磁吸玩偶卖断货官方承诺加快生产

快科技

2026-03-26 07:09:03

原来他12年前就已离世！患病3年女儿不愿照看，死后为争遗产现身

原来他12年前就已离世！患病3年女儿不愿照看，死后为争遗产现身

白面书誏

2026-03-26 13:38:18

原来她是张雪峰母亲，一生操劳全力托举儿子，却中年丧夫晚年丧子

原来她是张雪峰母亲，一生操劳全力托举儿子，却中年丧夫晚年丧子

以茶带书

2026-03-26 13:38:50

东莞长安医院“慰问用水果篮”中标价492元/份？医院采购办称水果篮包含11种水果，纪检办回应正在调查中

东莞长安医院“慰问用水果篮”中标价492元/份？医院采购办称水果篮包含11种水果，纪检办回应正在调查中

极目新闻

2026-03-26 18:38:43

伊朗对以色列发起导弹打击以多地响起防空警报

伊朗对以色列发起导弹打击以多地响起防空警报

财联社

2026-03-26 14:50:24

太扎心！辽宁一中年男子小便怒斥妻子举布遮挡稍高，就撒手人寰了

太扎心！辽宁一中年男子小便怒斥妻子举布遮挡稍高，就撒手人寰了

火山詩话

2026-03-26 06:16:11

马英九基金会决定中止今年两岸青年交流，马应该出面声明！

马英九基金会决定中止今年两岸青年交流，马应该出面声明！

达文西看世界

2026-03-26 10:58:22

伊朗用导弹拼出尊严，中国导弹实力藏不住了，俄专家给出硬核定论

伊朗用导弹拼出尊严，中国导弹实力藏不住了，俄专家给出硬核定论

探源历史

2026-03-25 13:22:35

东北两省书记省长会见刘强东

观察者网

2026-03-25 21:43:37

用知识和观点Debug the world！

10468文章数 489521关注度

往期回顾全部

科技要闻

Meta高管狂分百亿期权，700名员工却下岗

头条要闻

美国总统特朗普公开宣布访华行程外交部回应

头条要闻

美国总统特朗普公开宣布访华行程外交部回应

体育要闻

申京努力了，然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声！称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普？一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

艺术

房产

数码

公开课

本地新闻

救命，这只酱板鸭已经在我手机复仇了一万遍

艺术要闻

哪一座桥不是风景？

房产要闻

突发，三亚又有大批征迁补偿方案出炉！

数码要闻

iQOO Z11x发布：LCD党的护眼神机 1499元起

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版