网易首页 > 网易号 > 正文 申请入驻

DeepSeek开源新模型!单张A100日处理可超20万页数据

0
分享至

DeepSeek又发新模型了,这次是一个OCR 模型。10月20日,DeepSeek在Github开源了这一新模型,并发布《DeepSeek-OCR:Contexts Optical Compression》(《DeepSeek OCR:上下文光学压缩》)论文,解释了这一成果。

论文提到,当前的大语言模型在处理过程中面临着重大的计算挑战,文本内容过长,因此团队探索了一种具有潜力的解决方案:利用视觉模态作为文本信息的高效压缩介质。

具体来说,这一OCR模型可以将文本压缩成视觉模态,所谓“一图胜千言”,这样可以消耗更少的Token,测试显示,通过文本到图像的方法可以实现近 10 倍无损上下文压缩,OCR 准确率还能保持在 97% 以上。

论文提到,在实际应用中,单张A100-40G显卡,可支持每日20万页以上的大语言模型/视觉语言模型训练数据生成。

简单来看,团队的思路是,既然一张图就能包含大量文字信息,同时用的 Token 更少,那就可以将文本转成图像,这就是题目中提到的“光学压缩”,用视觉模态压缩文本信息。这一结果显示出该方法在长上下文压缩和大模型的记忆遗忘机制等研究方向上具有相当潜力。

DeepSeek-OCR由两个核心组件组成,其中DeepEncoder(编码器)负责图像特征提取和压缩,DeepSeek3B-MoE(解码器)负责从压缩后的视觉 Token 中重建文本。

解码器用的是 DeepSeek-3B-MoE 架构。虽然只有 3B 参数,但采用了 MoE(混合专家)设计,64 个专家中激活 6 个,再加 2 个共享专家,实际激活参数约 5.7 亿。这也让模型既有 30 亿参数模型的表达能力,又保持了5亿参数模型的推理效率。

实验数据显示,当文本 token 数量在视觉 token 的 10 倍以内(即压缩率小于10倍)时,模型的解码(OCR)精度可达 97%;即使在压缩率达到 20倍的情况下,OCR 准确率仍保持在约60%。

DeepSeek 团队在论文里还提出了具有想象力的未来——用光学压缩模拟人类的遗忘机制。人类的记忆会随时间衰退,越久远的事情记得越模糊,那是否AI也能这样?于是,团队设计将更久远的上下文,逐步缩小渲染图像的大小,以进一步减少token消耗。随着图像越来越小,内容也越来越模糊,最终达到“文本遗忘”的效果,就像人类记忆的衰退曲线一样。

论文中提到,这还是个需要进一步调查的早期研究方向,但这对于平衡理论上无限的上下文信息是一个很好的方法,如果真能实现,对于处理超长上下文将是个巨大突破。因此,这次发布的DeepSeek-OCR 表面上是个 OCR 模型,但从另一个角度来看,其研究代表了一个有前景的新方向。

有网友认为,这是一步好棋,人类就是阅读视觉文字,同时理解物理世界的时空概念,如果能统一语言和视觉,可能通向超级智能。

这一OCR模型发布不久就在GitHub获得超过1400颗星星。从论文署名来看,这一项目由 DeepSeek 三位研究员 Haoran Wei、Yaofeng Sun、Yukun Li 共同完成。行业消息显示,其中一作 Haoran Wei 曾在阶跃星辰工作过,曾主导开发了旨在实现“第二代 OCR”的 GOT-OCR2.0 系统,因此由其主导 DeepSeek 的 OCR 项目也在情理之中。

不过,DeepSeek迟迟不发R2这样的新模型,市场已经有一些声音认为其落后了,也有观点认为,DeepSeek目前只是在修炼“内功”,为下一代模型蓄力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
深夜直播情绪崩溃,工作室强行掐断信号!蔡文静这是要步鹿晗后尘

深夜直播情绪崩溃,工作室强行掐断信号!蔡文静这是要步鹿晗后尘

橙星文娱
2026-05-10 10:48:29
巴基斯坦准备用40架歼-35,给中国争取十年战略窗口期

巴基斯坦准备用40架歼-35,给中国争取十年战略窗口期

无心小姐姐
2026-05-10 09:18:12
“平价米其林”招牌卤肉饭用预制料包?自称6小时慢煮…北京有店被评“不如路边摊”

“平价米其林”招牌卤肉饭用预制料包?自称6小时慢煮…北京有店被评“不如路边摊”

北京商报
2026-05-10 16:15:37
上海小区高层突然着火,现场浓烟滚滚,知情人爆料,事件情况披露

上海小区高层突然着火,现场浓烟滚滚,知情人爆料,事件情况披露

眼光很亮
2026-05-10 07:18:28
41:0压倒性优势,欧盟成员国通过重大草案,中国外交部:赞赏

41:0压倒性优势,欧盟成员国通过重大草案,中国外交部:赞赏

靓仔情感
2026-05-11 10:15:03
乘联分会:特斯拉中国4月批发销量79478辆

乘联分会:特斯拉中国4月批发销量79478辆

界面新闻
2026-05-11 10:47:30
果然出事了!特朗普访华遇重大分歧,中方提的要求被美方一口否决

果然出事了!特朗普访华遇重大分歧,中方提的要求被美方一口否决

精彩启程
2026-05-09 23:51:47
三十年的友谊小船翻了,是创维黄宏生蹭流量还是段永平人设崩塌?

三十年的友谊小船翻了,是创维黄宏生蹭流量还是段永平人设崩塌?

电科技网
2026-05-07 14:56:16
58岁大姐每天吃一把南瓜子,半年后去体检,医生问吃了啥?

58岁大姐每天吃一把南瓜子,半年后去体检,医生问吃了啥?

健康之光
2026-05-07 17:45:07
邓超发文祝孙俪母亲节快乐:“母亲节快乐!带三个辛苦了!”

邓超发文祝孙俪母亲节快乐:“母亲节快乐!带三个辛苦了!”

韩小娱
2026-05-10 19:43:00
难以置信!上海雇主怒斥保姆打开全屋灯光“费电”,背后真相扎心

难以置信!上海雇主怒斥保姆打开全屋灯光“费电”,背后真相扎心

火山詩话
2026-05-11 06:42:40
上官云珠女儿姚姚,活到31岁,校方的悼词:她是个没贡献的人

上官云珠女儿姚姚,活到31岁,校方的悼词:她是个没贡献的人

品点历史
2026-05-09 08:10:21
不满判罚,多伦多主帅:我不知道裁判是不是害怕得罪超级球星

不满判罚,多伦多主帅:我不知道裁判是不是害怕得罪超级球星

懂球帝
2026-05-10 16:25:20
8连胜蓉城终结中超夺冠悬念?新目标:一直赢下去

8连胜蓉城终结中超夺冠悬念?新目标:一直赢下去

体坛周报
2026-05-11 10:41:18
龙赛罗:姆巴佩的所作所为在拿皇马开涮;皇马得买七个人重建

龙赛罗:姆巴佩的所作所为在拿皇马开涮;皇马得买七个人重建

懂球帝
2026-05-11 06:09:12
泪崩!刘国梁卸任后吐真言:亲手毁掉天才?我脑子没病!

泪崩!刘国梁卸任后吐真言:亲手毁掉天才?我脑子没病!

子芫伴你成长
2026-03-17 22:25:40
胖过一次,免疫系统竟“铭记”5-10年?最新研究:体重反弹的根源藏在T细胞的DNA中,减重后促炎状态长期不退,运动和用药都救不了

胖过一次,免疫系统竟“铭记”5-10年?最新研究:体重反弹的根源藏在T细胞的DNA中,减重后促炎状态长期不退,运动和用药都救不了

梅斯医学
2026-05-10 07:54:40
中国3大长寿食物,鸡蛋排第3,第1很多人想不到,中老年要常吃

中国3大长寿食物,鸡蛋排第3,第1很多人想不到,中老年要常吃

小胡军事爱好
2026-05-10 22:12:06
从“傅妈”到清冷姐姐,傅首尔减肥后大变,她的面相讨论重新定义

从“傅妈”到清冷姐姐,傅首尔减肥后大变,她的面相讨论重新定义

枫尘余往逝
2026-05-10 11:27:13
广州七中:关于广播站全面停止播放外文歌曲的通知

广州七中:关于广播站全面停止播放外文歌曲的通知

必记本
2026-05-10 17:54:30
2026-05-11 11:27:00
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
252801文章数 622256关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

牛弹琴:美伊又谈崩了 特朗普发飙美军出动数十艘军舰

头条要闻

牛弹琴:美伊又谈崩了 特朗普发飙美军出动数十艘军舰

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

谢霆锋没想到,王菲靠张艺谋重返巅峰

财经要闻

"手搓汽车"曝光:伪造证件、电池以旧代新

汽车要闻

全球化成国内车企未来胜负手,谁是出海最强"水手"?

态度原创

家居
教育
数码
本地
公开课

家居要闻

菁英人居 全能豪宅

教育要闻

家长的基本修养是“不拖后腿”

数码要闻

网传小米NAS项目暂缓 存储芯片涨价或为主要原因

本地新闻

用苏绣的方式,打开江西婺源

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版