网易首页 > 网易号 > 正文 申请入驻

DeepSeek开源新模型!单张A100日处理可超20万页数据

0
分享至

DeepSeek又发新模型了,这次是一个OCR 模型。10月20日,DeepSeek在Github开源了这一新模型,并发布《DeepSeek-OCR:Contexts Optical Compression》(《DeepSeek OCR:上下文光学压缩》)论文,解释了这一成果。


论文提到,当前的大语言模型在处理过程中面临着重大的计算挑战,文本内容过长,因此团队探索了一种具有潜力的解决方案:利用视觉模态作为文本信息的高效压缩介质。

具体来说,这一OCR模型可以将文本压缩成视觉模态,所谓“一图胜千言”,这样可以消耗更少的Token,测试显示,通过文本到图像的方法可以实现近 10 倍无损上下文压缩,OCR 准确率还能保持在 97% 以上。

论文提到,在实际应用中,单张A100-40G显卡,可支持每日20万页以上的大语言模型/视觉语言模型训练数据生成。

简单来看,团队的思路是,既然一张图就能包含大量文字信息,同时用的 Token 更少,那就可以将文本转成图像,这就是题目中提到的“光学压缩”,用视觉模态压缩文本信息。这一结果显示出该方法在长上下文压缩和大模型的记忆遗忘机制等研究方向上具有相当潜力。

DeepSeek-OCR由两个核心组件组成,其中DeepEncoder(编码器)负责图像特征提取和压缩,DeepSeek3B-MoE(解码器)负责从压缩后的视觉 Token 中重建文本。

解码器用的是 DeepSeek-3B-MoE 架构。虽然只有 3B 参数,但采用了 MoE(混合专家)设计,64 个专家中激活 6 个,再加 2 个共享专家,实际激活参数约 5.7 亿。这也让模型既有 30 亿参数模型的表达能力,又保持了5亿参数模型的推理效率。

实验数据显示,当文本 token 数量在视觉 token 的 10 倍以内(即压缩率小于10倍)时,模型的解码(OCR)精度可达 97%;即使在压缩率达到 20倍的情况下,OCR 准确率仍保持在约60%。

DeepSeek 团队在论文里还提出了具有想象力的未来——用光学压缩模拟人类的遗忘机制。人类的记忆会随时间衰退,越久远的事情记得越模糊,那是否AI也能这样?于是,团队设计将更久远的上下文,逐步缩小渲染图像的大小,以进一步减少token消耗。随着图像越来越小,内容也越来越模糊,最终达到“文本遗忘”的效果,就像人类记忆的衰退曲线一样。

论文中提到,这还是个需要进一步调查的早期研究方向,但这对于平衡理论上无限的上下文信息是一个很好的方法,如果真能实现,对于处理超长上下文将是个巨大突破。因此,这次发布的DeepSeek-OCR 表面上是个 OCR 模型,但从另一个角度来看,其研究代表了一个有前景的新方向。

有网友认为,这是一步好棋,人类就是阅读视觉文字,同时理解物理世界的时空概念,如果能统一语言和视觉,可能通向超级智能。

这一OCR模型发布不久就在GitHub获得超过1400颗星星。从论文署名来看,这一项目由 DeepSeek 三位研究员 Haoran Wei、Yaofeng Sun、Yukun Li 共同完成。行业消息显示,其中一作 Haoran Wei 曾在阶跃星辰工作过,曾主导开发了旨在实现“第二代 OCR”的 GOT-OCR2.0 系统,因此由其主导 DeepSeek 的 OCR 项目也在情理之中。

不过,DeepSeek迟迟不发R2这样的新模型,市场已经有一些声音认为其落后了,也有观点认为,DeepSeek目前只是在修炼“内功”,为下一代模型蓄力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
王凯已任江苏无锡市委常委、常务副市长

王凯已任江苏无锡市委常委、常务副市长

澎湃新闻
2025-11-03 10:14:29
中国与朝鲜关于长白山归属问题的争议,历经多年,尘埃落定了吗

中国与朝鲜关于长白山归属问题的争议,历经多年,尘埃落定了吗

抽象派大师
2025-11-02 21:40:37
难挽败局,拉塞尔17中10砍31分7板3助,三分13中7正负值-1

难挽败局,拉塞尔17中10砍31分7板3助,三分13中7正负值-1

懂球帝
2025-11-02 13:38:03
和章泽天出席会议被抓拍,刘强东“卖萌”:从此在老婆面前没了自信!如今东哥还“不知妻美”吗?

和章泽天出席会议被抓拍,刘强东“卖萌”:从此在老婆面前没了自信!如今东哥还“不知妻美”吗?

新民周刊
2025-11-02 16:21:24
有人账户余额全没了!警方紧急提醒:卸载!卸载!内江人注意!

有人账户余额全没了!警方紧急提醒:卸载!卸载!内江人注意!

创作者_1479191106636
2025-11-02 20:13:51
京东001号快递员退休1年多,勤恳工作16年,刘强东承诺的房给了吗

京东001号快递员退休1年多,勤恳工作16年,刘强东承诺的房给了吗

揽星河的笔记
2025-10-30 21:38:08
活久见!苏州一男子征婚曝光,把体制内家庭的优越感写得明明白白

活久见!苏州一男子征婚曝光,把体制内家庭的优越感写得明明白白

火山诗话
2025-10-31 13:29:31
佟丽娅现身深圳罗湖水贝买珠宝!打扮朴素眼袋重,毫无明星气质

佟丽娅现身深圳罗湖水贝买珠宝!打扮朴素眼袋重,毫无明星气质

柠檬有娱乐
2025-11-03 10:38:49
打疯了!湖人火力全开一度领先18分:东契奇16+6,詹姆斯乐开花

打疯了!湖人火力全开一度领先18分:东契奇16+6,詹姆斯乐开花

体坛小李
2025-11-03 11:53:17
美军南海坠毁原因已明确,解放军已做好应对,静待特朗普表态

美军南海坠毁原因已明确,解放军已做好应对,静待特朗普表态

文雅笔墨
2025-11-03 08:37:54
陈震再杠小米!10℃也配叫“冬测”?米粉贴图科普秋冬也是无语

陈震再杠小米!10℃也配叫“冬测”?米粉贴图科普秋冬也是无语

小柱解说游戏
2025-11-03 04:41:47
国际奥委会:东大你再办一届奥运会!东大:2036年在台北办?

国际奥委会:东大你再办一届奥运会!东大:2036年在台北办?

议纪史
2025-11-01 22:15:03
李兰娟院士:天气渐冷,吃完他汀药后,请务必注意这6个隐患

李兰娟院士:天气渐冷,吃完他汀药后,请务必注意这6个隐患

白宸侃片
2025-11-02 06:02:22
西部排名又乱了:勇士爆冷连败,火箭高歌猛进,12队排名互换

西部排名又乱了:勇士爆冷连败,火箭高歌猛进,12队排名互换

篮球大视野
2025-11-02 15:03:27
印度航天刚射4.4吨“最重卫星”,印度直接把亚洲航天卷到新高

印度航天刚射4.4吨“最重卫星”,印度直接把亚洲航天卷到新高

Thurman在昆明
2025-11-03 00:00:59
白酒最怕的解药,不是浓茶!家家都有,酒前吃一点,咋喝都不醉!

白酒最怕的解药,不是浓茶!家家都有,酒前吃一点,咋喝都不醉!

徐云流浪中国
2025-11-02 08:53:38
乱套了!大雨+大暴雨+降温!浙江人做好准备:马上突袭!这波冲击30℃

乱套了!大雨+大暴雨+降温!浙江人做好准备:马上突袭!这波冲击30℃

FM93浙江交通之声
2025-11-02 16:31:54
尊界S800拆车:排行榜最高分,这就是国产车的顶级水平!

尊界S800拆车:排行榜最高分,这就是国产车的顶级水平!

大飙车
2025-11-01 20:55:56
48岁曾黎回老家种地!满脸褶头发花白断崖衰老,徒手摘黄瓜像农妇

48岁曾黎回老家种地!满脸褶头发花白断崖衰老,徒手摘黄瓜像农妇

金风说
2025-11-01 15:41:57
上海警方:全市严查!6种行为已被盯上,一周内多人被罚

上海警方:全市严查!6种行为已被盯上,一周内多人被罚

鲁中晨报
2025-11-02 21:51:24
2025-11-03 12:31:00
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
234694文章数 620497关注度
往期回顾 全部

科技要闻

马斯克为这事开骂:“他们什么都不懂”!

头条要闻

媒体:高市早苗发表涉台错误言行 中方直接"亮剑"

头条要闻

媒体:高市早苗发表涉台错误言行 中方直接"亮剑"

体育要闻

开拓者官宣召回杨瀚森 队记解析核心原因

娱乐要闻

录音彻底揭露知名导演王家卫的体面

财经要闻

马斯克:未来5-6年传统手机与App将消失

汽车要闻

超跑同款磁流变减振 深蓝L06包你开得爽

态度原创

健康
手机
亲子
公开课
军事航空

核磁VS肌骨超声,谁更胜一筹?

手机要闻

OPPO ColorOS16 正式版 11 月升级机型公布

亲子要闻

专注力的真相,这3点比“不打断”更重要

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美总统威胁对尼日利亚动武 尼方回应

无障碍浏览 进入关怀版