网易首页 > 网易号 > 正文 申请入驻

DeepSeek发布多模态论文又连夜删除,主要透露了啥?

0
分享至


DeepSeek终于能“看见”了。前两天,DeepSeek偷偷开启了多模态能力的灰度测试,部分用户打开DeepSeek首页会发现,界面多了一个“识图模式”的入口。上传图片后,DeepSeek能像人一样理解画面了。


DeepSeek多模态团队负责人陈小康在4月29日发文称,“现在,我们能看见你了。”这是DeepSeek的聊天产品第一次接入多模态。

就在4月30日,DeepSeek又发布了一篇关于多模态技术报告《Thinking with Visaul Primitives》(《用视觉原语思考》),阐释了这次上新的多模态技术背后的细节。

在五一节假日前一天发布重磅论文,“这很DeepSeek”。但很快大家发现,官方连夜删除了多模态仓库和论文原文,5月1日打开Github界面已经是“404”状态。


关于删除原因官方并没有特别说明,不过有猜测不是内容问题,而是信息透露太多。

这次的论文说了些啥?从行业反馈来看,论文符合DeepSeek扎实且务实的风格,同样在通过工程能力降低成本,采用了新的范式,也意味着,DeepSeek开始在视觉模型上发力了。

具体来看,DeepSeek的论文指出,目前的多模态模型在复杂任务上崩溃,不是因为看不见(感知鸿沟),而在于“指不准”(引用鸿沟)。

自然语言天然具有模糊性。当用户要求模型处理复杂的空间布局时,仅靠文字描述很容易产生歧义。就像数一堆散落的硬币,如果不用手指逐个按着确认,人类也很容易数错或数重。

DeepSeek的解法是给模型配上一只“手指”。通过引入“视觉原语”(Visual Primitives)框架,模型将点、边界框等空间标记提升为最小思维单元。这意味着模型在推理时,能够一边“想”一边“指”,将抽象的语言逻辑指向到具体空间坐标。

这一灵感借鉴了人类的认知。论文提及,人类走迷宫或数密集物体时,会用手指这类指示性指向来降低认知负荷、维持逻辑一致性。通过将视觉原语嵌入思考,模型可以模拟人类这种“指向-推理”的协同。

这一模型基于DeepSeek-V4-Flash(总参数2840亿)构建。DeepSeek的大量实验表明,该方法在推理精度上实现显著突破,在空间推理、视觉问答等挑战性任务上,性能持平或超越 GPT、Claude、Gemini 最新版本。

DeepSeek的研究证明:多模态智能的未来,不只是 “看见更多像素”,而是构建语言与视觉之间精准、无歧义的指代桥梁。

值得一提的是,DeepSeek在4月24日发布了V4系列旗舰模型,这次发布并没有涉及传言已久的多模态。官方当时对V4的定义是:支持百万字超长上下文,在 Agent(智能体)能力、世界知识和推理性能上均实现国内与开源领域的领先。

多模态已经成为当前大模型更新的一个重要方向,而DeepSeek在这一方面却迟迟未跟上,这也被认为是DeepSeek能力上的一大短板。也有传言称,DeepSeek暂缓多模态生成的训练策略,主要源于算力和现金的掣肘,在融资后,或许这一方向的训练会更加顺利。

(本文来自第一财经)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
广东大胜,一主力最失意!杜锋只让他打7分钟0分,下季铁定走人了

广东大胜,一主力最失意!杜锋只让他打7分钟0分,下季铁定走人了

南海浪花
2026-05-02 07:44:42
葡萄牙就“加沙船队”事件召见以色列大使

葡萄牙就“加沙船队”事件召见以色列大使

参考消息
2026-05-01 13:44:04
万万没想到!落马张军妻子来头不小,同是冠军,实力不容小觑

万万没想到!落马张军妻子来头不小,同是冠军,实力不容小觑

人间烟火记事本
2026-05-01 06:47:32
两个事实证明,我国实际已经控制了面积80平方公里的南沙五方礁

两个事实证明,我国实际已经控制了面积80平方公里的南沙五方礁

老谢谈史
2026-04-10 17:30:50
机器人交警在断桥边给游客比心,网友:杭州已经进化到这种程度了吗!

机器人交警在断桥边给游客比心,网友:杭州已经进化到这种程度了吗!

都市快报橙柿互动
2026-05-01 19:09:46
解放军直说了,美国已经出局,郑丽文也通知民进党,死了这条心

解放军直说了,美国已经出局,郑丽文也通知民进党,死了这条心

董董历史烩
2026-05-02 05:30:32
一次电梯偶遇让广东千万身家老板一夜之间倾家荡产,每月靠借钱维生,不敢把真相告诉女儿

一次电梯偶遇让广东千万身家老板一夜之间倾家荡产,每月靠借钱维生,不敢把真相告诉女儿

环球网资讯
2026-04-19 07:47:19
必须狠刹舆论“连坐”歪风

必须狠刹舆论“连坐”歪风

上游新闻
2026-04-20 09:46:05
注意!五一假期首日多景区紧急发布限流通知,有景区已暂停线上线下售票,部分游客需及时调整行程

注意!五一假期首日多景区紧急发布限流通知,有景区已暂停线上线下售票,部分游客需及时调整行程

极目新闻
2026-05-01 16:12:53
大结局要来,美国伊朗不打了?最后竟然是因为…

大结局要来,美国伊朗不打了?最后竟然是因为…

喀秋莎大世界
2026-04-30 22:26:44
珠海市一套一线海景房713万起拍卖,被一家贸易公司1291万竞得

珠海市一套一线海景房713万起拍卖,被一家贸易公司1291万竞得

天天话事
2026-05-01 09:39:46
卫星照曝光!岸上储油罐接近满载,伊朗动用退役油轮存石油!联合国秘书长警告:霍尔木兹海峡如果关闭到年中,全球贫困人口将新增3200万

卫星照曝光!岸上储油罐接近满载,伊朗动用退役油轮存石油!联合国秘书长警告:霍尔木兹海峡如果关闭到年中,全球贫困人口将新增3200万

每日经济新闻
2026-05-01 09:20:08
大理苍山通告发现黑熊,一条道路临时禁行,景区工作人员回应

大理苍山通告发现黑熊,一条道路临时禁行,景区工作人员回应

极目新闻
2026-04-30 17:37:19
西安交通大学今年疯了吗

西安交通大学今年疯了吗

娱乐的宅急便
2026-05-01 20:23:14
合肥武汉芯片赌局:180亿投资终成破局利刃

合肥武汉芯片赌局:180亿投资终成破局利刃

众生的世界观
2026-04-30 08:51:00
裁判快憋不住了 吴宜泽与艾伦一局鏖战100分钟破纪录 1小时未进球

裁判快憋不住了 吴宜泽与艾伦一局鏖战100分钟破纪录 1小时未进球

风过乡
2026-05-02 05:07:59
再创历史!张雪机车匈牙利排位赛双车“惊艳”,53号64号进前10位

再创历史!张雪机车匈牙利排位赛双车“惊艳”,53号64号进前10位

火山詩话
2026-05-02 06:40:58
李湘和前夫王岳伦北京同框吃饭!穿大花裙瘦好多,网友吐槽假离婚

李湘和前夫王岳伦北京同框吃饭!穿大花裙瘦好多,网友吐槽假离婚

无处不风景love
2026-05-01 15:20:18
郑丽文6月访美刚官宣,国台办两句话就让行程“冻在机票上”

郑丽文6月访美刚官宣,国台办两句话就让行程“冻在机票上”

爱下厨的阿酾
2026-05-02 00:42:43
她是“陕北一枝花”,18岁嫁元帅生下一女,为何36岁改嫁将军

她是“陕北一枝花”,18岁嫁元帅生下一女,为何36岁改嫁将军

探源历史
2026-05-02 02:30:42
2026-05-02 08:47:00
侃故事的阿庆
侃故事的阿庆
几分钟看完一部影视剧,诙谐幽默的娓娓道来
578文章数 8347关注度
往期回顾 全部

科技要闻

AI热潮耗尽库存,Mac Mini起售调高200美元

头条要闻

男子因健身设备锁扣崩断被弹飞致瘫痪 监控无法调取

头条要闻

男子因健身设备锁扣崩断被弹飞致瘫痪 监控无法调取

体育要闻

无奈!约基奇:这要在塞尔维亚 全队早被炒了

娱乐要闻

马筱梅产后身材恢复超好 现身户外直播

财经要闻

雷军很努力 小米还是跌破了30港元大关

汽车要闻

限时9.67万起 吉利星越L/星瑞i-HEV智擎混动上市

态度原创

艺术
本地
教育
家居
手机

艺术要闻

画画的你绝不能错过!色块与笔触的激情之旅!

本地新闻

用青花瓷的方式,打开西溪湿地

教育要闻

高考地理中的机制问题

家居要闻

灵动实用 生活艺术场

手机要闻

Anbernic RG Rotate更多信息:3.5英寸720×720旋屏,87.99美元起

无障碍浏览 进入关怀版