网易首页 > 网易号 > 正文 申请入驻

DeepSeek重磅发布多模态论文,怎么又连夜删除了?

0
分享至

五一放假前一天,大家都准备躺平了。DeepSeek反手就是一个大招。多模态能力灰度测试开启。部分用户打开首页,发现多了一个"识图模式"的入口。


上传图片,DeepSeek能像人一样理解画面了。

多模态团队负责人陈小康发了句话:"现在,我们能看见你了。"

听起来像情话。但这是DeepSeek的聊天产品,第一次接入多模态。

然后论文就没了

更魔幻的来了。


4月30日,DeepSeek发了一篇技术报告《Thinking with Visual Primitives》(用视觉原语思考)。五一节前一天发重磅论文,这很DeepSeek。

但很快,官方连夜删除了多模态仓库和论文原文。5月1日打开Github,已经是404状态。

删除原因?官方没说。

有人猜不是内容问题,而是信息透露太多。DeepSeek这波操作,我只能说:懂的都懂。

这篇论文说了啥?

先别管删没删,内容才是重点。

这篇论文,符合DeepSeek一贯的风格:扎实,务实,用工程能力降成本。

核心就一句话:多模态模型在复杂任务上崩溃,不是因为看不见,而是因为"指不准"。

什么意思?

自然语言天然有模糊性。你让模型处理复杂空间布局,光靠文字描述,很容易产生歧义。

就像数一堆散落的硬币。你不用手指逐个按着确认,人类也会数错或数重。

DeepSeek的解法是:给模型配一只"手指"。

通过引入"视觉原语"框架,模型把点、边界框这些空间标记,提升为最小思维单元。模型在推理时,能一边"想"一边"指",把抽象的语言逻辑指向具体空间坐标。

这灵感来自人类认知。你走迷宫或数密集物体时,会用手指这类指示性指向,来降低认知负荷、维持逻辑一致性。

DeepSeek把这套逻辑,教给了模型。

性能怎么样?

这模型基于DeepSeek-V4-Flash构建,总参数2840亿。

大量实验表明,在推理精度上实现显著突破。空间推理、视觉问答这些挑战性任务上,性能持平或超越GPT、Claude、Gemini最新版本。

DeepSeek的研究证明了一件事:多模态智能的未来,不只是"看见更多像素",而是构建语言与视觉之间精准、无歧义的指代桥梁。

这句话,值得读三遍。

为什么之前不做多模态?

其实DeepSeek在4月24日发布了V4系列旗舰模型,但当时并没有涉及多模态。官方对V4的定义是:支持百万字超长上下文,在Agent能力、世界知识和推理性能上实现国内与开源领域领先。

多模态已经是当前大模型更新的重要方向。DeepSeek迟迟没跟上,被认为是能力上的一大短板。

有传言说,DeepSeek暂缓多模态生成的训练策略,主要源于算力和现金的掣肘。融资后,这一方向的训练会更顺利。

是不是真的?我不知道。但我知道一件事:技术路线的选择,永远比我们想象的更复杂。

一个比喻

DeepSeek这次的创新,让我想起一个场景。

你让一个盲人描述房间里的东西。他能听见你的描述,能摸到家具的轮廓,但就是没法精准指向某个具体位置。

现在,你给了他一根手杖。

他可以一边走,一边敲,一边确认。语言和空间,终于对上了。

这就是视觉原语的意义。不是让模型看得更清楚,而是让模型指得更准确。

DeepSeek这波操作,让我想起一句话:

技术进步的本质,是把人类的认知方式,翻译成机器能理解的语言。

视觉原语框架,就是这样一个翻译器。它把人类"边指边想"的认知习惯,变成了模型推理的基本单元。

论文删了,但思路留下了。

DeepSeek的多模态时代,才刚刚开始。。。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
郭涛带19岁儿子云南摆摊义卖!石头颜值飙升,不嫌脏累超有礼貌

郭涛带19岁儿子云南摆摊义卖!石头颜值飙升,不嫌脏累超有礼貌

观鱼听雨
2026-05-01 23:35:00
五种废品价格暴涨!提醒老人千万别乱扔,扔了就是白扔钱!

五种废品价格暴涨!提醒老人千万别乱扔,扔了就是白扔钱!

爱下厨的阿酾
2026-05-02 14:11:39
80后家长发明“防早恋”发型,女儿面如死灰,网友都看不下去了

80后家长发明“防早恋”发型,女儿面如死灰,网友都看不下去了

妍妍教育日记
2026-04-27 09:20:13
伦敦世乒赛:男团爆大冷!雨果横扫,非洲名将出局,国乒迎来强敌

伦敦世乒赛:男团爆大冷!雨果横扫,非洲名将出局,国乒迎来强敌

宝哥精彩赛事
2026-05-02 10:51:35
骑士还给4年2.7亿续约吗?场均23+5,球星气质顶级,但天赋太差了

骑士还给4年2.7亿续约吗?场均23+5,球星气质顶级,但天赋太差了

你的篮球频道
2026-05-02 11:09:48
官方:西班牙籍教练伊萨克出任上海赛更达新帅

官方:西班牙籍教练伊萨克出任上海赛更达新帅

懂球帝
2026-05-02 10:45:14
心理学有个残忍发现:让别人对你产生敬畏感的,不是你的强势,不是你的反击,而是你骨子里的这两种“人性破绽”操控术

心理学有个残忍发现:让别人对你产生敬畏感的,不是你的强势,不是你的反击,而是你骨子里的这两种“人性破绽”操控术

心理观察局
2026-05-02 06:39:34
当口哨吹响,它们便以流氓无赖的语气叫嚷着!

当口哨吹响,它们便以流氓无赖的语气叫嚷着!

胖胖说他不胖
2026-05-02 10:00:33
52 岁张震岳湘江边夜跑!黝黑络腮胡像外国人,男人味拉满

52 岁张震岳湘江边夜跑!黝黑络腮胡像外国人,男人味拉满

南万说娱26
2026-04-12 15:22:37
一个男人你左右可以没有女人
但一定不能被女人左右

一个男人你左右可以没有女人 但一定不能被女人左右

青苹果sht
2026-04-28 05:15:49
惊天内幕!1984年中美黑鹰交易只交付24架,真相竟是战略失误!

惊天内幕!1984年中美黑鹰交易只交付24架,真相竟是战略失误!

人生录
2026-04-25 15:13:17
赴港一晚筹436万救患儿,李亚鹏全程弯腰致谢,背巨债干公益20年

赴港一晚筹436万救患儿,李亚鹏全程弯腰致谢,背巨债干公益20年

以茶带书
2026-05-01 18:12:05
微软开源DOS 1.0!当年用不到10万美元拿下的代码,改写了整个操作系统史

微软开源DOS 1.0!当年用不到10万美元拿下的代码,改写了整个操作系统史

CSDN
2026-05-01 13:06:22
文莱最帅王子带女儿见国王,混血王妃稍显圆润,但是依旧很美

文莱最帅王子带女儿见国王,混血王妃稍显圆润,但是依旧很美

小书生吃瓜
2026-04-30 21:42:40
醪糟再次被关注!医生发现:高血脂患者喝醪糟,不用多久4大变化

醪糟再次被关注!医生发现:高血脂患者喝醪糟,不用多久4大变化

芹姐说生活
2026-04-19 15:52:53
尤杯战报:竞逐决赛,世锦赛3冠王被逆转,国羽1-0!印尼一单5-21

尤杯战报:竞逐决赛,世锦赛3冠王被逆转,国羽1-0!印尼一单5-21

求球不落谛
2026-05-02 17:31:01
伊朗高级军事官员:伊美间再次爆发军事冲突可能性很大

伊朗高级军事官员:伊美间再次爆发军事冲突可能性很大

界面新闻
2026-05-02 14:34:33
千年难遇的美人,太漂亮了,没有一点毛病,太完美了

千年难遇的美人,太漂亮了,没有一点毛病,太完美了

情感大头说说
2026-04-24 12:46:24
连院子里的树都被贴了封条,山东临沂纳税状元变“黑老大”

连院子里的树都被贴了封条,山东临沂纳税状元变“黑老大”

有戏
2026-04-16 18:23:20
超350亿重磅投资密集落地辽宁!

超350亿重磅投资密集落地辽宁!

一口娱乐
2026-05-02 13:35:03
2026-05-02 18:07:00
前沿科技学习分享圈 incentive-icons
前沿科技学习分享圈
朝看花开满树红,暮看花落树还空。若将花比人间事,花与人间事一同。
1674文章数 370关注度
往期回顾 全部

科技要闻

AI热潮耗尽库存,Mac Mini起售调高200美元

头条要闻

伊朗高级官员:伊美间再次爆发军事冲突可能性很大

头条要闻

伊朗高级官员:伊美间再次爆发军事冲突可能性很大

体育要闻

休赛期总冠军,轮到休斯顿火箭

娱乐要闻

白百何罕晒大儿子 18岁元宝越来越帅

财经要闻

雷军很努力 小米还是跌破了30港元大关

汽车要闻

新纪录!零跑汽车4月交付达71387台

态度原创

时尚
游戏
艺术
手机
公开课

流汗不流“汤”!五一假期底妆指南请收好~

《红沙》卷上天!劳动节疯狂劳动 6月的更新现在完成

艺术要闻

色块与笔触的激情之旅!

手机要闻

俞浩再放狠话:追觅手机要与苹果、三星三分天下

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版