网易首页 > 网易号 > 正文 申请入驻

DeepSeek 突发OCR 2,采用基于Qwen的新架构

0
分享至

阿里半夜刚发完旗舰模型,这边 DeepSeek坐不住了,突然发布更新了。

刚刚,DeepSeek 发布了 新模型 DeepSeek-OCR 2,采用创新的DeepEncoder V2方法,让AI能够根据图像的含义动态重排图像的各个部分,更接近人类的视觉编码逻辑。在具体实现上,DeepSeek 团队在论文中称采用了Qwen2-0.5B来实例化这一架构。

如果说去年 10 月 DeepSeek-OCR 的发布,让行业第一次意识到“视觉压缩”可能是一条被严重低估的技术路线,那么现在,DeepSeek 显然决定把这条路走得更激进一些。

DeepSeek-OCR 2 有何不同?

在传统 OCR 体系中,无论是经典的字符检测—识别流水线,还是近年来多模态模型中的视觉编码模块,本质上都遵循同一种思路:对图像进行均匀、规则的扫描和编码,再将结果交给语言模型或后续模块处理。

这种方式的问题在于,它并不关心“哪些视觉区域真正重要”。

DeepSeek-OCR 1 之所以在当时引发讨论,正是因为它将 OCR 看作一种 视觉压缩问题:不是尽可能多地保留像素信息,而是将视觉内容压缩成更有利于语言模型理解的中间表示。

而在 DeepSeek-OCR 2 中,这一思路被进一步推进。

根据技术报告,DeepEncoder V2 不再将视觉编码视为一次静态的、固定策略的扫描过程,而是引入了语义驱动的动态编码机制。模型会在编码阶段就开始判断哪些区域更可能承载关键信息,并据此调整视觉 token 的分配与表达方式。

换句话说,视觉编码不再只是“预处理”,而是已经提前进入了“理解阶段”。

和 DeepSeek 过往几乎所有重要发布一样,这一次依然选择了模型、代码与技术报告同时开源。项目、论文和模型权重已同步上线:

项目地址:https://github.com/deepseek-ai/DeepSeek-OCR-2

论文地址:https://github.com/deepseek-ai/DeepSeek-OCR-2/blob/main/DeepSeek_OCR2_paper.pdf

模型地址:https://huggingface.co/deepseek-ai/DeepSeek-OCR-2





特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国成功研制出一款星链干扰器

中国成功研制出一款星链干扰器

跟着老李看世界
2026-02-03 00:02:33
突然跳水,寒武纪大跌超12%,市值蒸发超700亿元,公司回应:不清楚具体原因,市场很多传闻都是假的!去年营收预计暴增超400%,已扭亏为盈

突然跳水,寒武纪大跌超12%,市值蒸发超700亿元,公司回应:不清楚具体原因,市场很多传闻都是假的!去年营收预计暴增超400%,已扭亏为盈

每日经济新闻
2026-02-03 12:18:05
突发!哈登缺席原因揭晓!快船酝酿重磅交易:哈登换骑士加兰

突发!哈登缺席原因揭晓!快船酝酿重磅交易:哈登换骑士加兰

体坛小李
2026-02-03 12:44:14
爱泼斯坦档案重现失踪模特控诉:他们吃了人类,派对细节令人不适

爱泼斯坦档案重现失踪模特控诉:他们吃了人类,派对细节令人不适

译言
2026-02-03 05:09:42
重返休城?曝火箭有意交易回哈登 有望第三次联手杜兰特冲冠

重返休城?曝火箭有意交易回哈登 有望第三次联手杜兰特冲冠

醉卧浮生
2026-02-03 12:53:01
最新公布爱泼斯坦萝莉岛文件完整梳理:婴儿被肢解、案板有人腿太骇人

最新公布爱泼斯坦萝莉岛文件完整梳理:婴儿被肢解、案板有人腿太骇人

不二表姐
2026-02-02 23:32:35
恶心!爱泼斯坦吃人真相越来越可怕!竟然被曝吃肠道粪便!

恶心!爱泼斯坦吃人真相越来越可怕!竟然被曝吃肠道粪便!

魔都囡
2026-02-03 09:41:25
谁来救救我女儿?扬州一父亲哭诉女儿刚上班办卡太多,授信近13万

谁来救救我女儿?扬州一父亲哭诉女儿刚上班办卡太多,授信近13万

火山诗话
2026-02-03 07:11:18
12306回应“每天都用前任的身份证订票不付款取消3次让他买不了过年回家的票”:锁的是订票账户

12306回应“每天都用前任的身份证订票不付款取消3次让他买不了过年回家的票”:锁的是订票账户

新浪财经
2026-02-02 23:00:39
吃瓜蒙主和牢A都将载入史册,它们可真敢说

吃瓜蒙主和牢A都将载入史册,它们可真敢说

林中木白
2026-02-01 13:57:15
哈登接连缺阵快船比赛,泰伦卢居然如此回应,不外乎三点原因

哈登接连缺阵快船比赛,泰伦卢居然如此回应,不外乎三点原因

姜大叔侃球
2026-02-03 11:09:16
8.7万亿!史上最贵独角兽诞生

8.7万亿!史上最贵独角兽诞生

智东西
2026-02-03 08:50:21
闫学晶凉了!儿子新疆班再实锤,疑被顶替考生发声,舆论反扑中戏

闫学晶凉了!儿子新疆班再实锤,疑被顶替考生发声,舆论反扑中戏

北纬的咖啡豆
2026-02-02 19:24:45
小卡无缘全明星真因?教练投票受阴阳合同影响 被调侃更愿待家中

小卡无缘全明星真因?教练投票受阴阳合同影响 被调侃更愿待家中

罗说NBA
2026-02-03 06:17:49
台贵客抵达北京!岛内变天信号出现,关键时刻,美日态度惊人一致

台贵客抵达北京!岛内变天信号出现,关键时刻,美日态度惊人一致

书纪文谭
2026-02-02 23:17:16
塔利班宣布女性不得互相说话:女性连与女性说话都成违法

塔利班宣布女性不得互相说话:女性连与女性说话都成违法

桂系007
2026-02-02 23:39:18
周生生足金挂坠被检测出含铁、银、钯!监管部门介入

周生生足金挂坠被检测出含铁、银、钯!监管部门介入

黄河新闻网吕梁频道
2026-02-03 08:59:21
退货误寄奔驰钥匙后续,平台介入调查,奔驰车主:该女子绝对说谎

退货误寄奔驰钥匙后续,平台介入调查,奔驰车主:该女子绝对说谎

削桐作琴
2026-02-02 17:10:29
电诈290亿,白家执行死刑,中国仍在全球追捕,白家一个也别想跑

电诈290亿,白家执行死刑,中国仍在全球追捕,白家一个也别想跑

甜柠聊史
2026-02-03 11:04:44
2026春晚第三次联排落幕,小品演员大换血,赵本山的担心恐成真

2026春晚第三次联排落幕,小品演员大换血,赵本山的担心恐成真

素衣读史
2026-02-02 19:24:56
2026-02-03 13:19:00
InfoQ incentive-icons
InfoQ
有内容的技术社区媒体
12016文章数 51732关注度
往期回顾 全部

科技要闻

1.25万亿美元!xAI员工赢麻了

头条要闻

男子投200万做租赁业务起步即爆单 每周收租金超百万

头条要闻

男子投200万做租赁业务起步即爆单 每周收租金超百万

体育要闻

“也许我的一小步,会成为中国足球的一大步”

娱乐要闻

小S致词:感谢具俊晔陪伴大S的最后3年

财经要闻

精神病医院骗保内幕调查:住院相当于坐牢

汽车要闻

问界M6官图首发 以年轻化设计叩击25-30万级市场

态度原创

数码
亲子
游戏
家居
公开课

数码要闻

捡便宜买2TB三星990 PRO被骗:速度仅20MB/s!Windows竟还显示正品

亲子要闻

高敏感儿童是有病吗? 用这样的运动处方:家长从此告别内耗与焦虑

T2财报即将公布!《GTA6》会再次宣布跳票吗?

家居要闻

极简木艺术 典雅自在

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版