网易首页 > 网易号 > 正文 申请入驻

DeepSeek发布多模态论文又连夜删除

0
分享至

2026.05.01


本文字数:1351,阅读时长大约2分钟

作者 |第一财经 刘晓洁

DeepSeek终于能“看见”了。前两天,DeepSeek偷偷开启了多模态能力的灰度测试,部分用户打开DeepSeek首页会发现,界面多了一个“识图模式”的入口。上传图片后,DeepSeek能像人一样理解画面了。


DeepSeek多模态团队负责人陈小康在4月29日发文称,“现在,我们能看见你了。”这是DeepSeek的聊天产品第一次接入多模态。

就在4月30日,DeepSeek又发布了一篇关于多模态技术报告《Thinking with Visaul Primitives》(《用视觉原语思考》),阐释了这次上新的多模态技术背后的细节。

在五一节假日前一天发布重磅论文,“这很DeepSeek”。但很快大家发现,官方连夜删除了多模态仓库和论文原文,5月1日打开Github界面已经是“404”状态。


关于删除原因官方并没有特别说明,不过有猜测不是内容问题,而是信息透露太多。

这次的论文说了些啥?从行业反馈来看,论文符合DeepSeek扎实且务实的风格,同样在通过工程能力降低成本,采用了新的范式,也意味着,DeepSeek开始在视觉模型上发力了。

具体来看,DeepSeek的论文指出,目前的多模态模型在复杂任务上崩溃,不是因为看不见(感知鸿沟),而在于“指不准”(引用鸿沟)。

自然语言天然具有模糊性。当用户要求模型处理复杂的空间布局时,仅靠文字描述很容易产生歧义。就像数一堆散落的硬币,如果不用手指逐个按着确认,人类也很容易数错或数重。

DeepSeek的解法是给模型配上一只“手指”。通过引入“视觉原语”(Visual Primitives)框架,模型将点、边界框等空间标记提升为最小思维单元。这意味着模型在推理时,能够一边“想”一边“指”,将抽象的语言逻辑指向到具体空间坐标。

这一灵感借鉴了人类的认知。论文提及,人类走迷宫或数密集物体时,会用手指这类指示性指向来降低认知负荷、维持逻辑一致性。通过将视觉原语嵌入思考,模型可以模拟人类这种“指向-推理”的协同。

这一模型基于DeepSeek-V4-Flash(总参数2840亿)构建。DeepSeek的大量实验表明,该方法在推理精度上实现显著突破,在空间推理、视觉问答等挑战性任务上,性能持平或超越 GPT、Claude、Gemini 最新版本。

DeepSeek的研究证明:多模态智能的未来,不只是 “看见更多像素”,而是构建语言与视觉之间精准、无歧义的指代桥梁。

值得一提的是,DeepSeek在4月24日发布了V4系列旗舰模型,这次发布并没有涉及传言已久的多模态。官方当时对V4的定义是:支持百万字超长上下文,在 Agent(智能体)能力、世界知识和推理性能上均实现国内与开源领域的领先。

多模态已经成为当前大模型更新的一个重要方向,而DeepSeek在这一方面却迟迟未跟上,这也被认为是DeepSeek能力上的一大短板。也有传言称,DeepSeek暂缓多模态生成的训练策略,主要源于算力和现金的掣肘,在融资后,或许这一方向的训练会更加顺利。

微信编辑| 苏小

:bianjibu@yicai.com

:business@yicai.com

声明:包含AI生成内容

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
又一国产车要复活了

又一国产车要复活了

放毒
2026-05-01 12:16:09
报道称自二战结束以来 美国债首次超过经济总量

报道称自二战结束以来 美国债首次超过经济总量

财联社
2026-05-01 22:12:15
赵薇黄晓明出席北电96级同学聚会,美女帅哥一堆,班主任气质不俗

赵薇黄晓明出席北电96级同学聚会,美女帅哥一堆,班主任气质不俗

娱乐团长
2026-05-01 13:31:21
34岁男子娶“少女感”新娘,女方怀孕5月,网友:老牛吃嫩草

34岁男子娶“少女感”新娘,女方怀孕5月,网友:老牛吃嫩草

辣媒专栏记录
2026-04-29 08:34:28
马宁连掏两黄!茹萨踩人染黄,韦世豪不满,媒体人:撞枪口上了

马宁连掏两黄!茹萨踩人染黄,韦世豪不满,媒体人:撞枪口上了

奥拜尔
2026-05-01 20:42:45
300663,立案!影响6万股民

300663,立案!影响6万股民

中国基金报
2026-05-01 19:55:51
津门虎2-2十人三镇,季胜攀绝平,哈达斯点射,亚姆卡姆染红

津门虎2-2十人三镇,季胜攀绝平,哈达斯点射,亚姆卡姆染红

懂球帝
2026-05-01 22:02:41
59岁歌手张宇患罕见病20年,妻子十一郎首度公开内情:无法彻底根治,严重到不唱歌连说话都可能出问题

59岁歌手张宇患罕见病20年,妻子十一郎首度公开内情:无法彻底根治,严重到不唱歌连说话都可能出问题

芒果都市
2026-05-01 17:45:29
大连英博1-0重庆铜梁龙,赛后评分出炉:大连英博8号排第一

大连英博1-0重庆铜梁龙,赛后评分出炉:大连英博8号排第一

侧身凌空斩
2026-05-01 20:59:01
东莞"萝卜快跑"消失了?官方回复来了!

东莞"萝卜快跑"消失了?官方回复来了!

东莞好生活
2026-05-01 20:53:19
同为清朝割让的领土,为什么香港能收回,海参崴却没有动静?

同为清朝割让的领土,为什么香港能收回,海参崴却没有动静?

抽象派大师
2026-04-29 00:14:58
广东狂胜21分!山东大胜16分,进G3决战,明轩诗岩爆发,主场稳了

广东狂胜21分!山东大胜16分,进G3决战,明轩诗岩爆发,主场稳了

老吴说体育
2026-05-01 21:44:05
知名男星朴东彬骤逝!在餐厅断气被发现「留下一女儿」 享年56岁

知名男星朴东彬骤逝!在餐厅断气被发现「留下一女儿」 享年56岁

ETtoday星光云
2026-04-30 12:04:05
一朝9帝,全员精神病

一朝9帝,全员精神病

我是历史其实挺有趣
2026-05-01 15:58:48
目前的中国股市,如果想赚钱,就买这两种股票,赚到盆满钵满!

目前的中国股市,如果想赚钱,就买这两种股票,赚到盆满钵满!

股经纵横谈
2026-05-01 20:39:27
最新官宣!山东5月起统一调整,60周岁以上老人出游不用再买门票

最新官宣!山东5月起统一调整,60周岁以上老人出游不用再买门票

林子说事
2026-05-01 19:55:14
打仗大家也要正常上班

打仗大家也要正常上班

周显香港
2026-04-30 09:49:59
“五一”首日黄山山顶观景房价格飙升至2000元一晚,单个床位价超400元,多个房型“一房难求”

“五一”首日黄山山顶观景房价格飙升至2000元一晚,单个床位价超400元,多个房型“一房难求”

极目新闻
2026-05-01 16:24:30
“观音回到了故乡”,82岁演员左大玢现身河南香山寺,该寺被称为“观音祖庭”,大批游客偶遇合影,景区回应

“观音回到了故乡”,82岁演员左大玢现身河南香山寺,该寺被称为“观音祖庭”,大批游客偶遇合影,景区回应

极目新闻
2026-05-01 16:12:53
建议反复观看!为什么说“躺平”是境外势力给咱们下的毒

建议反复观看!为什么说“躺平”是境外势力给咱们下的毒

吃瓜局
2026-04-30 15:12:13
2026-05-01 23:03:00
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
252175文章数 622194关注度
往期回顾 全部

科技要闻

DeepSeek发布多模态论文又连夜删除

头条要闻

8岁女孩跟随邻居长江游泳溺亡 邻居曾抓住她又脱手

头条要闻

8岁女孩跟随邻居长江游泳溺亡 邻居曾抓住她又脱手

体育要闻

无奈!约基奇:这要在塞尔维亚 全队早被炒了

娱乐要闻

马筱梅产后身材恢复超好 现身户外直播

财经要闻

GPU神话松动,AI真正的战场变了

汽车要闻

限时9.67万起 吉利星越L/星瑞i-HEV智擎混动上市

态度原创

旅游
健康
本地
时尚
公开课

旅游要闻

60秒看雄安|乘着巴士看城市风景线

干细胞治烧烫伤面临这些“瓶颈”

本地新闻

用青花瓷的方式,打开西溪湿地

这个夏天,彩色裤子又火了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版