网易首页 > 网易号 > 正文 申请入驻

从“看见”到“看懂”:DeepSeek正式跨入图文交互时代

DeepSeek正式跨入图文交互时代

0
分享至

2026年5月9日,DeepSeek的识图模式今日正式全面开放,所有用户均可在网页端以及App上使用“识图模式”,这款广受好评的语言类大模型,终于也是进入多模态时代了。

原有OCR识别的弊端

这可不是原先右下角塞进去的图像识别,那本质上只是个OCR模块,单纯的把图像中的文字读取出来后再输入到文字框中。所以模型最终读到的,还是文字内容。



这样“曲线救国”的形式在以文字为主的图片时还堪能用,但当图片中有复杂的构图、排版,甚至是完全没有文字的艺术图,它基本上就抓瞎了。

全新识图模型上线

而在4月29日,Deep-Seek-V4上线仅5天的时候,DeepSeek网页端便悄然的上线了视觉理解的功能,在“快速模式”和“专家模式”之外,新增了“识图模式”的入口可供使用。当时仍然在灰度测试中,但根据获得测试资格的用户的反馈和网上交流,此次的进步堪称革命性的:它真正的给予了DeepSeek原生识别、理解图片的能力,不仅拥有常规的文字识别,更有高级的图像内容、结构甚至是空间推理的信息能力。



在全面放开视图模式后,我们也对这一模型进行了测试:我们在测试中上传了一张上海美术电影制片厂经典动画《大闹天宫》的孙悟空造型图。



DeepSeek的识图模式不仅准确的识别出角色是“孙悟空”,指出造型来源于《大闹天宫》,还能给出清晰的判断依据:虎皮裙的造型、京剧脸谱的猴脸、抬腿独立的姿态。

最后,模型还给出了对这张图的评价“充满中国传统戏曲的韵味”。这已经充分说明了其的识别能力。



我们也试着使用了传统的图片识别,模型根本无法识别内容,官方也会推荐切换到识图模式。

DeepSeek的一大步

作为全球顶尖的大模型之一,尤其是作为开源模型的中流砥柱,DeepSeek最大的遗憾就是仅支持文字输入。

而如今随着识图模式全面开放,DeepSeek已经成为头部国产大模型中完成多模态能力布局的关键一员,开始正式对标OpenAI、Anthropic等国际平台。



虽说DeepSeek目前仍不具备图像生成能力,识图的API接口也尚未开放,但这一切都只是时间问题,从图像识别到图像生成的路径,已经远比从文字到图像识别的路径短上许多。

更重要的是,DeepSeek 始终坚持廉价、亲民、高效的路线。基于V4协议的视觉识别能力,在识别效率上明显优于GPT等同类产品,而使用成本却远低于行业平均水平:识别一张800×800图像仅消耗约90 tokens。

这意味着,无论是学生、职场人还是设计师,都能以一个极低的门槛,享受到顶级的图文理解能力。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一位日本老兵的自述:南京城沦陷后,城内妇女都有着怎样的遭遇

一位日本老兵的自述:南京城沦陷后,城内妇女都有着怎样的遭遇

云霄纪史观
2026-05-11 17:41:21
这才是真正的高人(非常经典)

这才是真正的高人(非常经典)

尚曦读史
2026-04-13 08:30:06
603052,获知名牛散夫妇举牌!

603052,获知名牛散夫妇举牌!

中国基金报
2026-05-12 00:01:18
沉睡3000年的西周女王开棺震惊:裸体下葬,浑身珠宝藏着文明密码

沉睡3000年的西周女王开棺震惊:裸体下葬,浑身珠宝藏着文明密码

历史人文2
2026-05-11 15:30:05
委内瑞拉的转身:当反美口号输给了石油工人的饭碗

委内瑞拉的转身:当反美口号输给了石油工人的饭碗

民间胡扯老哥
2026-05-05 06:15:03
经党中央、国务院同意,国务院办公厅发布重要计划

经党中央、国务院同意,国务院办公厅发布重要计划

中国乡村振兴
2026-05-11 18:56:07
官僚主义最阴狠的套路:把所有风险,砸向最底层

官僚主义最阴狠的套路:把所有风险,砸向最底层

职场资深秘书
2026-05-08 20:44:41
高市早苗好狠:赶在特朗普访华前,给了他一刀,连中国都没想到!

高市早苗好狠:赶在特朗普访华前,给了他一刀,连中国都没想到!

老范谈史
2026-05-11 11:29:39
韩国股市,危险正在聚集……

韩国股市,危险正在聚集……

包不同
2026-05-12 00:48:13
马龙夏露晒伦敦情侣照,发文:世乒赛艰难但完美收官

马龙夏露晒伦敦情侣照,发文:世乒赛艰难但完美收官

小椰的奶奶
2026-05-12 02:11:51
张柏芝母亲节晒仨儿子,8岁三胎儿子出镜,眼睛小小自带沉稳气场

张柏芝母亲节晒仨儿子,8岁三胎儿子出镜,眼睛小小自带沉稳气场

一盅情怀
2026-05-11 09:25:01
一文看懂《主角》忆秦娥的一生!

一文看懂《主角》忆秦娥的一生!

容妃
2026-05-11 15:50:22
纯电750km+增程430km!小鹏新车官宣5月20日上市,友商压力山大?

纯电750km+增程430km!小鹏新车官宣5月20日上市,友商压力山大?

蓝色海边
2026-05-11 15:51:56
快修8年了!四川这家医院何时投用?老院区会整体搬么?答案来了

快修8年了!四川这家医院何时投用?老院区会整体搬么?答案来了

天府观察
2026-05-11 12:11:23
布雷迪母亲节晒两任前任,网友:这格局我服了

布雷迪母亲节晒两任前任,网友:这格局我服了

追星雷达站
2026-05-11 20:31:24
咖啡再次被关注!医生发现:高血脂患者常喝咖啡,或出现这些变化

咖啡再次被关注!医生发现:高血脂患者常喝咖啡,或出现这些变化

岐黄传人孙大夫
2026-04-16 16:30:03
《主角》女演员:秦海璐脸不僵了,王晓晨变嫩了,王丽坤赢麻了

《主角》女演员:秦海璐脸不僵了,王晓晨变嫩了,王丽坤赢麻了

喵喵娱乐团
2026-05-11 16:47:23
我哥的饭店被人砸了,嫂子没报警,只给她在部队的哥哥打了个电话

我哥的饭店被人砸了,嫂子没报警,只给她在部队的哥哥打了个电话

千秋文化
2026-05-10 19:53:13
释永信被一女子爆料:她们姐妹住少林寺3天,争着往释永信房间跑

释永信被一女子爆料:她们姐妹住少林寺3天,争着往释永信房间跑

江山挥笔
2026-03-23 15:40:31
杜月笙晚年找道士算命,道士写下8个字,他看后瞬间瘫软在地

杜月笙晚年找道士算命,道士写下8个字,他看后瞬间瘫软在地

千秋文化
2026-03-31 20:56:16
2026-05-12 04:03:00
机锋网 incentive-icons
机锋网
机锋网,有趣的科技媒体
908文章数 859关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

母女二人一年用水量高达400多吨 警方发现背后隐情

头条要闻

母女二人一年用水量高达400多吨 警方发现背后隐情

体育要闻

梁靖崑:可能是最后一届了,想让大家记住这个我

娱乐要闻

“孕妇坠崖案”王暖暖称被霸凌协商解约

财经要闻

宗馥莉罢免销售负责人 部分业务将外包

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

本地
家居
手机
教育
公开课

本地新闻

用苏绣的方式,打开江西婺源

家居要闻

多元生活 此处无声

手机要闻

苹果iOS/iPadOS 15.8.8正式版发布

教育要闻

特朗普访华对美国留学市场是利好吗?中国留美学生规模如何变化?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版