网易首页 > 网易号 > 正文 申请入驻

DeepSeek开源新模型:单张A100日处理可超20万页数据

0
分享至

2025.10.20

本文字数:1556,阅读时长大约3分钟

作者 |第一财经 刘晓洁

DeepSeek又发新模型了,这次是一个OCR 模型。10月20日,DeepSeek在Github开源了这一新模型,并发布《DeepSeek-OCR:Contexts Optical Compression》(《DeepSeek OCR:上下文光学压缩》)论文,解释了这一成果。

论文提到,当前的大语言模型在处理过程中面临着重大的计算挑战,文本内容过长,因此团队探索了一种具有潜力的解决方案:利用视觉模态作为文本信息的高效压缩介质。

具体来说,这一OCR模型可以将文本压缩成视觉模态,所谓“一图胜千言”,这样可以消耗更少的Token,测试显示,通过文本到图像的方法可以实现近 10 倍无损上下文压缩,OCR 准确率还能保持在 97% 以上。

论文提到,在实际应用中,单张A100-40G显卡,可支持每日20万页以上的大语言模型/视觉语言模型训练数据生成。

简单来看,团队的思路是,既然一张图就能包含大量文字信息,同时用的 Token 更少,那就可以将文本转成图像,这就是题目中提到的“光学压缩”,用视觉模态压缩文本信息。这一结果显示出该方法在长上下文压缩和大模型的记忆遗忘机制等研究方向上具有相当潜力。

DeepSeek-OCR由两个核心组件组成,其中DeepEncoder(编码器)负责图像特征提取和压缩,DeepSeek3B-MoE(解码器)负责从压缩后的视觉 Token 中重建文本。

解码器用的是 DeepSeek-3B-MoE 架构。虽然只有 3B 参数,但采用了 MoE(混合专家)设计,64 个专家中激活 6 个,再加 2 个共享专家,实际激活参数约 5.7 亿。这也让模型既有 30 亿参数模型的表达能力,又保持了5亿参数模型的推理效率。

实验数据显示,当文本 token 数量在视觉 token 的 10 倍以内(即压缩率小于10倍)时,模型的解码(OCR)精度可达 97%;即使在压缩率达到 20倍的情况下,OCR 准确率仍保持在约60%。

DeepSeek 团队在论文里还提出了具有想象力的未来——用光学压缩模拟人类的遗忘机制。人类的记忆会随时间衰退,越久远的事情记得越模糊,那是否AI也能这样?于是,团队设计将更久远的上下文,逐步缩小渲染图像的大小,以进一步减少token消耗。随着图像越来越小,内容也越来越模糊,最终达到“文本遗忘”的效果,就像人类记忆的衰退曲线一样。

论文中提到,这还是个需要进一步调查的早期研究方向,但这对于平衡理论上无限的上下文信息是一个很好的方法,如果真能实现,对于处理超长上下文将是个巨大突破。因此,这次发布的DeepSeek-OCR 表面上是个 OCR 模型,但从另一个角度来看,其研究代表了一个有前景的新方向。

有网友认为,这是一步好棋,人类就是阅读视觉文字,同时理解物理世界的时空概念,如果能统一语言和视觉,可能通向超级智能。

这一OCR模型发布不久就在GitHub获得超过1400颗星星。从论文署名来看,这一项目由 DeepSeek 三位研究员 Haoran Wei、Yaofeng Sun、Yukun Li 共同完成。行业消息显示,其中一作 Haoran Wei 曾在阶跃星辰工作过,曾主导开发了旨在实现“第二代 OCR”的 GOT-OCR2.0 系统,因此由其主导 DeepSeek 的 OCR 项目也在情理之中。

不过,DeepSeek迟迟不发R2这样的新模型,市场已经有一些声音认为其落后了,也有观点认为,DeepSeek目前只是在修炼“内功”,为下一代模型蓄力。

微信编辑| 苏小

第一财经持续追踪财经热点。若您掌握公司动态、行业趋势、金融事件等有价值的线索,欢迎提供。专用邮箱:bianjibu@yicai.com

(注:我们会对线索进行核实。您的隐私将严格保密。)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“我妈有两个老公”,OPPO至少惹怒了三群人

“我妈有两个老公”,OPPO至少惹怒了三群人

万能的大叔
2026-05-09 00:17:51
A股:大家系好安全带了,不出意外的话,明天周二或将再次历史重演?

A股:大家系好安全带了,不出意外的话,明天周二或将再次历史重演?

趋势清风侠
2026-05-11 16:42:37
皇马更衣室提前站队?3大核心力挺穆里尼奥,除贝林厄姆还有谁

皇马更衣室提前站队?3大核心力挺穆里尼奥,除贝林厄姆还有谁

万花筒体育球球
2026-05-11 17:37:10
万科最值钱的资产浮出水面

万科最值钱的资产浮出水面

36氪财经
2026-05-11 19:03:06
提醒老年人:过了70岁,宁愿天天玩手机,也不要随便做这5件事!

提醒老年人:过了70岁,宁愿天天玩手机,也不要随便做这5件事!

垚垚分享健康
2026-05-10 22:20:05
央视“砍价”2026年世界杯:天价转播权为何遇冷

央视“砍价”2026年世界杯:天价转播权为何遇冷

每日经济新闻
2026-05-10 20:56:18
10只皮皮虾461元,深圳女子吐槽潮汕大排档宰客,辱骂潮汕人黑心

10只皮皮虾461元,深圳女子吐槽潮汕大排档宰客,辱骂潮汕人黑心

映射生活的身影
2026-05-10 12:33:21
英特尔盘前涨幅扩大至8%

英特尔盘前涨幅扩大至8%

每日经济新闻
2026-05-11 17:58:41
大争议!文班亚马肘击里德喉部 被吹罚二级恶犯生涯首次被驱逐

大争议!文班亚马肘击里德喉部 被吹罚二级恶犯生涯首次被驱逐

醉卧浮生
2026-05-11 08:32:04
广东将遭遇新一轮暴雨、大暴雨

广东将遭遇新一轮暴雨、大暴雨

中国能源网
2026-05-11 16:49:04
形势有多严峻?曾经的王牌专业凉了!辅导员和教授感到无力和沉重

形势有多严峻?曾经的王牌专业凉了!辅导员和教授感到无力和沉重

慧翔百科
2026-05-09 11:34:26
看了两集央视《主角》,我想说,刘浩存把央视年代剧大门踹烂了

看了两集央视《主角》,我想说,刘浩存把央视年代剧大门踹烂了

一娱三分地
2026-05-11 12:52:50
出乎众人预料,中方提前48小时官宣特朗普访华,高市早苗心愿落空

出乎众人预料,中方提前48小时官宣特朗普访华,高市早苗心愿落空

策前论
2026-05-11 18:13:56
5月11日译名发布:毛焦尔·彼得

5月11日译名发布:毛焦尔·彼得

参考消息
2026-05-11 11:26:34
正式淘汰!2亿先生仅得7分!生涯第二次被横扫

正式淘汰!2亿先生仅得7分!生涯第二次被横扫

篮球教学论坛
2026-05-11 17:29:41
“台湾永远不是中国的?” 郑丽君放狂言,被67岁艺人当众扇耳光

“台湾永远不是中国的?” 郑丽君放狂言,被67岁艺人当众扇耳光

橙星文娱
2026-05-10 13:42:19
50岁李小冉机场吃面,褪去滤镜才懂,普通人的衰老藏不住

50岁李小冉机场吃面,褪去滤镜才懂,普通人的衰老藏不住

梦想的旅途照进现实
2026-05-09 18:40:12
外交部回应普京最新涉华表态

外交部回应普京最新涉华表态

中国网
2026-05-11 16:22:47
“吓死我了”!今早,大批人收到地震有关短信!广东地震局最新回应

“吓死我了”!今早,大批人收到地震有关短信!广东地震局最新回应

南方都市报
2026-05-11 11:06:04
冲上热搜!突然收到地震局短信,很多人吓一跳!上海明天也有,莫慌莫慌

冲上热搜!突然收到地震局短信,很多人吓一跳!上海明天也有,莫慌莫慌

上观新闻
2026-05-11 14:58:22
2026-05-11 19:52:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
252809文章数 622258关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

媒体:中美元首即将北京会晤 美方一细节耐人寻味

头条要闻

媒体:中美元首即将北京会晤 美方一细节耐人寻味

体育要闻

梁靖崑:可能是最后一届了,想让大家记住这个我

娱乐要闻

“孕妇坠崖案”王暖暖称被霸凌协商解约

财经要闻

多重催化剂共振,人民币汇率升破6.8

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

家居
本地
房产
公开课
军事航空

家居要闻

多元生活 此处无声

本地新闻

用苏绣的方式,打开江西婺源

房产要闻

产业赋能教育!翰林府与北师大的这场签约,绝不那么简单!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:伊朗的回应“完全不可接受”

无障碍浏览 进入关怀版