网易首页 > 网易号 > 正文 申请入驻

DeepSeek开源新模型!单张A100日处理可超20万页数据

0
分享至

DeepSeek又发新模型了,这次是一个OCR 模型。10月20日,DeepSeek在Github开源了这一新模型,并发布《DeepSeek-OCR:Contexts Optical Compression》(《DeepSeek OCR:上下文光学压缩》)论文,解释了这一成果。


论文提到,当前的大语言模型在处理过程中面临着重大的计算挑战,文本内容过长,因此团队探索了一种具有潜力的解决方案:利用视觉模态作为文本信息的高效压缩介质。

具体来说,这一OCR模型可以将文本压缩成视觉模态,所谓“一图胜千言”,这样可以消耗更少的Token,测试显示,通过文本到图像的方法可以实现近 10 倍无损上下文压缩,OCR 准确率还能保持在 97% 以上。

论文提到,在实际应用中,单张A100-40G显卡,可支持每日20万页以上的大语言模型/视觉语言模型训练数据生成。

简单来看,团队的思路是,既然一张图就能包含大量文字信息,同时用的 Token 更少,那就可以将文本转成图像,这就是题目中提到的“光学压缩”,用视觉模态压缩文本信息。这一结果显示出该方法在长上下文压缩和大模型的记忆遗忘机制等研究方向上具有相当潜力。

DeepSeek-OCR由两个核心组件组成,其中DeepEncoder(编码器)负责图像特征提取和压缩,DeepSeek3B-MoE(解码器)负责从压缩后的视觉 Token 中重建文本。

解码器用的是 DeepSeek-3B-MoE 架构。虽然只有 3B 参数,但采用了 MoE(混合专家)设计,64 个专家中激活 6 个,再加 2 个共享专家,实际激活参数约 5.7 亿。这也让模型既有 30 亿参数模型的表达能力,又保持了5亿参数模型的推理效率。

实验数据显示,当文本 token 数量在视觉 token 的 10 倍以内(即压缩率小于10倍)时,模型的解码(OCR)精度可达 97%;即使在压缩率达到 20倍的情况下,OCR 准确率仍保持在约60%。

DeepSeek 团队在论文里还提出了具有想象力的未来——用光学压缩模拟人类的遗忘机制。人类的记忆会随时间衰退,越久远的事情记得越模糊,那是否AI也能这样?于是,团队设计将更久远的上下文,逐步缩小渲染图像的大小,以进一步减少token消耗。随着图像越来越小,内容也越来越模糊,最终达到“文本遗忘”的效果,就像人类记忆的衰退曲线一样。

论文中提到,这还是个需要进一步调查的早期研究方向,但这对于平衡理论上无限的上下文信息是一个很好的方法,如果真能实现,对于处理超长上下文将是个巨大突破。因此,这次发布的DeepSeek-OCR 表面上是个 OCR 模型,但从另一个角度来看,其研究代表了一个有前景的新方向。

有网友认为,这是一步好棋,人类就是阅读视觉文字,同时理解物理世界的时空概念,如果能统一语言和视觉,可能通向超级智能。

这一OCR模型发布不久就在GitHub获得超过1400颗星星。从论文署名来看,这一项目由 DeepSeek 三位研究员 Haoran Wei、Yaofeng Sun、Yukun Li 共同完成。行业消息显示,其中一作 Haoran Wei 曾在阶跃星辰工作过,曾主导开发了旨在实现“第二代 OCR”的 GOT-OCR2.0 系统,因此由其主导 DeepSeek 的 OCR 项目也在情理之中。

不过,DeepSeek迟迟不发R2这样的新模型,市场已经有一些声音认为其落后了,也有观点认为,DeepSeek目前只是在修炼“内功”,为下一代模型蓄力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗大阿亚图拉宣布圣战,他的地位如何?其发言会引发什么结果?

伊朗大阿亚图拉宣布圣战,他的地位如何?其发言会引发什么结果?

之乎者也小鱼儿
2026-03-02 09:13:10
伊朗,曾经是中东最发达的国家,如今为何沦落成“烂泥扶不上墙”

伊朗,曾经是中东最发达的国家,如今为何沦落成“烂泥扶不上墙”

文史达观
2025-06-24 06:45:04
理想汽车高管回应大众增程器下线:恭喜量产“过时的”技术

理想汽车高管回应大众增程器下线:恭喜量产“过时的”技术

识礁Farsight
2026-03-03 20:04:38
道指深夜重挫1200点,黄金跌破5000美元,白银狂泻10%,国际油价大涨8%

道指深夜重挫1200点,黄金跌破5000美元,白银狂泻10%,国际油价大涨8%

21世纪经济报道
2026-03-03 23:32:42
特朗普妻子安理会上遭怒斥:你丈夫下令轰炸小学

特朗普妻子安理会上遭怒斥:你丈夫下令轰炸小学

大风新闻
2026-03-03 11:24:13
四川再次发布橙色预警!这些地方高度危险

四川再次发布橙色预警!这些地方高度危险

四川省教育厅
2026-03-03 20:50:15
前女友发千字长文,刚刚张杰回应

前女友发千字长文,刚刚张杰回应

都市快报橙柿互动
2026-03-03 20:20:54
奉劝所有40到50岁后的中年人,只要不被开除,干到退休就是成功

奉劝所有40到50岁后的中年人,只要不被开除,干到退休就是成功

岁月有情1314
2026-03-03 14:49:44
王毅外长:今后世上再无“中国台湾省”之外的任何模糊称谓。

王毅外长:今后世上再无“中国台湾省”之外的任何模糊称谓。

南权先生
2026-02-02 15:59:44
人在多少岁会“断崖式衰老”?斯坦福研究:这两个年龄是转折点

人在多少岁会“断崖式衰老”?斯坦福研究:这两个年龄是转折点

华庭讲美食
2026-02-24 08:44:44
薛之谦好友曝张杰谢娜双胞胎真相?孩子落户上海是薛之谦帮忙搞定

薛之谦好友曝张杰谢娜双胞胎真相?孩子落户上海是薛之谦帮忙搞定

离离言几许
2026-03-03 13:29:54
王钊已履新浙江省领导!此前担任自然资源部党组成员,国家自然资源副总督察(专职)

王钊已履新浙江省领导!此前担任自然资源部党组成员,国家自然资源副总督察(专职)

海洋知圈
2026-03-03 20:58:12
1-2!范戴克送礼,萨拉赫难救主,遭94分钟绝杀,利物浦爆大冷

1-2!范戴克送礼,萨拉赫难救主,遭94分钟绝杀,利物浦爆大冷

我的护球最独特
2026-03-04 06:15:21
伊朗555人遇难,美军3架F15被打爆,特朗普要阻止中国主导全球?

伊朗555人遇难,美军3架F15被打爆,特朗普要阻止中国主导全球?

薛小荣
2026-03-03 17:29:35
乌军单月收复领土逾500平方公里,首超俄军推进速度

乌军单月收复领土逾500平方公里,首超俄军推进速度

史政先锋
2026-03-03 21:01:44
一场战争把中国打醒!美军最毒的不是装备,中国用30年才真正看清

一场战争把中国打醒!美军最毒的不是装备,中国用30年才真正看清

达文西看世界
2026-03-02 14:25:12
滞留迪拜母女为回国,花36万元买12张机票:担心航班取消,连续3天的票都买了!中欧航线票价也“狂飙”:几千元涨到两三万

滞留迪拜母女为回国,花36万元买12张机票:担心航班取消,连续3天的票都买了!中欧航线票价也“狂飙”:几千元涨到两三万

每日经济新闻
2026-03-03 19:17:58
美国终于明白,当年他们“误炸”中国大使馆,中国为什么不反击

美国终于明白,当年他们“误炸”中国大使馆,中国为什么不反击

蜉蝣说
2025-10-07 16:08:53
零跑悬赏500万打击网络黑公关

零跑悬赏500万打击网络黑公关

大象新闻
2026-03-03 17:07:03
手机,正在毁掉中国老人

手机,正在毁掉中国老人

LULU生活家
2026-02-23 18:02:03
2026-03-04 07:08:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
245664文章数 621666关注度
往期回顾 全部

科技要闻

拥抱AI的"牛马":边提效边自嘲"自费"上班

头条要闻

美国突发史无前例撤离令引外界担忧:终极空袭或来临

头条要闻

美国突发史无前例撤离令引外界担忧:终极空袭或来临

体育要闻

35轮后积分-7,他们遭遇史上最早的降级

娱乐要闻

谢娜霸气护夫:喊话薛之谦给张杰道歉

财经要闻

特朗普“不惜一切”!全球股债齐崩

汽车要闻

第一梯队辅助驾驶加持 iCAR V27定档3月13日上市

态度原创

游戏
艺术
本地
公开课
军事航空

猎魂世界:盘点拿什么才能拯救这三位?即使上了神赐也没救了?

艺术要闻

明朝皇帝怎么过元宵

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗:击中美空军基地大楼

无障碍浏览 进入关怀版