网易首页 > 网易号 > 正文 申请入驻

DeepSeek开放识图模式 AI装上了“赛博手指”

0
分享至

来源:科技日报

近日,DeepSeek开始灰度测试识图模式,并大范围开放给用户体验。

在具体的实测体验中,开启该模式后,用户可以直接上传图片让DeepSeek“看”世界,其能力边界远超简单的文字提取。比如,网友上传在博物馆拍摄的不明文物并开启“深度思考”后,模型不仅详细描述该文物纹理材质,还准确推断出其年代风格;面对时下流行的表情包或梗图,它也能准确理解。

DeepSeek“开眼”,与其他主流大模型有何能力差异?有哪些优势和不足?科技日报记者就此采访了有关专家。

第一问:DeepSeek识图模式与豆包等其他大模型有何区别?

“与其他大模型相比,DeepSeek识图模式的核心区别集中在技术路径、算力消耗和交互逻辑上。”赛迪顾问人工智能与大数据研究中心分析师白润轩说。

他解释道,DeepSeek识图模式以“视觉原语思考”为核心。这一核心框架主打精准空间推理和复杂场景解析,而非单纯的文字OCR(光学字符识别)或基础识别。而豆包等模型更侧重结合联网搜索提升识别时效性,多依赖传统图像编码后进行文本理解,空间推理精度稍弱。

同时,这一框架在实际运行中“算力友好”。白润轩介绍,DeepSeek处理800×800分辨率图片仅消耗约90个tokens(词元),远低于GPT等主流模型,响应速度更快。

此外,DeepSeek识图模式为独立入口,专注纯视觉理解,不额外启用联网功能,而豆包等大模型会自动联动搜索。

第二问:“视觉原语思考”的核心创新点在哪?

伴随识图模式的上线,DeepSeek还公开了其背后的多模态模型技术细节,并公布了“视觉原语思考”核心框架。

“这一框架的核心创新点在于跳出主流模型‘堆分辨率’的思路,聚焦解决传统多模态模型的‘指代鸿沟’困境。”白润轩解释。

传统多模态大模型在面对密集场景时存在一种名为“指代鸿沟”的困境,模型虽然能看见图片,但在推理过程中用“左边那个大的”等模糊的自然语言构建逻辑链时,很容易因描述不准导致注意力漂移。

而“视觉原语思考”框架将点、边界框等空间视觉元素作为“思维”基本单元,融入模型推理全过程,这就像给模型装上了一根“赛博手指”,让AI在推理时能在“脑海”中精确指出目标物,边想边指,大幅提升复杂空间布局、密集计数等场景的推理精度。

第三问:目前存在的不足及改进方向是什么?

在白润轩看来,DeepSeek识图模式目前主要存在三项不足。

一是知识库更新偏滞后。其模型训练数据截至2025年,识别2025年底后发布的新型产品易出现型号误判。

二是高难度场景表现还不稳定。面对视错觉图片、复杂物体计数等反直觉任务时,模型给出的答案稳定性不足,偶发逻辑崩溃。

三是功能边界较窄。目前仅支持纯视觉理解,暂不具备图像生成、视频理解及跨模态创作能力,且高并发时段偶有解析失败、响应延迟的情况。

“建议后续加快知识库迭代、优化反直觉场景算法;同时拓展多模态功能,进一步提升系统稳定性以适配更多用户的需求。”白润轩说。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
回顾:缅北女魔头魏榕嗜好!经常“活剥驴耳”,3个闺蜜喜欢观刑

回顾:缅北女魔头魏榕嗜好!经常“活剥驴耳”,3个闺蜜喜欢观刑

飞云如水
2024-11-13 06:54:13
张本智和致敬马龙樊振东:世乒赛决赛太经典 刘国梁:教科书对决

张本智和致敬马龙樊振东:世乒赛决赛太经典 刘国梁:教科书对决

念洲
2026-05-14 14:31:29
昨日深夜上海内环发生单车事故 双向通行受阻

昨日深夜上海内环发生单车事故 双向通行受阻

看看新闻Knews
2026-05-14 12:28:07
申真谞不香了,海力士全员分钱,沉重打击了韩国围棋

申真谞不香了,海力士全员分钱,沉重打击了韩国围棋

月满大江流
2026-05-14 08:59:16
51岁尹子维携妻街头被偶遇,小15岁徐冬冬身形臃肿孕味十足

51岁尹子维携妻街头被偶遇,小15岁徐冬冬身形臃肿孕味十足

枫尘余往逝
2026-05-14 14:16:37
骑士3-2!哈登30+8+6,赛后米切尔快步走过去,一把抱住哈登

骑士3-2!哈登30+8+6,赛后米切尔快步走过去,一把抱住哈登

担酒
2026-05-14 11:14:36
突发新政!事关南京全体小区业主!

突发新政!事关南京全体小区业主!

住在南京
2026-05-14 12:34:23
64岁陈秀雯近况曝光,“消失”6年变了模样,那么美却被婚姻毁了

64岁陈秀雯近况曝光,“消失”6年变了模样,那么美却被婚姻毁了

文刀贰
2026-05-13 23:25:20
比亚迪固态电池正式首发,纯电续航1218km,电车市场要变天了!

比亚迪固态电池正式首发,纯电续航1218km,电车市场要变天了!

沙雕小琳琳
2026-05-12 03:23:16
美国人评论亚洲街道:日本干净,印度脏乱,而中国只用4个字形容

美国人评论亚洲街道:日本干净,印度脏乱,而中国只用4个字形容

解锁世界风云
2026-03-15 20:51:56
冲击决赛!U17女足亚洲杯半决赛:中国战朝鲜 马晓旭率队复仇?

冲击决赛!U17女足亚洲杯半决赛:中国战朝鲜 马晓旭率队复仇?

爱奇艺体育
2026-05-14 15:10:07
中美两个大国说好了,霍尔木兹海峡不准收费,革命卫队能听懂吗?

中美两个大国说好了,霍尔木兹海峡不准收费,革命卫队能听懂吗?

临云史策
2026-05-14 11:24:13
绝了!孙兴慜被勒索3亿!梁某获刑4年!网友:贪得无厌终翻车!

绝了!孙兴慜被勒索3亿!梁某获刑4年!网友:贪得无厌终翻车!

罗氏八卦
2026-05-08 18:00:03
白嫖礼服女生的“严正声明”,真是令人叹为观止!

白嫖礼服女生的“严正声明”,真是令人叹为观止!

葱哥说
2026-05-13 16:57:18
马斯克收心了?官宣了39岁印度裔伴侣:相貌普通为他生了4个孩子

马斯克收心了?官宣了39岁印度裔伴侣:相貌普通为他生了4个孩子

丰谭笔录
2025-12-12 11:16:23
CBA最新:广州男篮主帅遭多队争抢,四强无爆冷

CBA最新:广州男篮主帅遭多队争抢,四强无爆冷

谭颞爱搞笑
2026-05-14 16:54:49
中国未来最大的敌人不是特朗普,而是手握杀招、重构科技规则的他

中国未来最大的敌人不是特朗普,而是手握杀招、重构科技规则的他

妙知
2026-04-06 12:12:54
90岁谢贤被Coco爆料,分手原因:他身体跟不上我,现已坐轮椅出行

90岁谢贤被Coco爆料,分手原因:他身体跟不上我,现已坐轮椅出行

老吴教育课堂
2026-05-14 16:04:53
残疾哥哥养大妹妹,妹妹考上博士后就没回过家,哥哥去看望傻眼了

残疾哥哥养大妹妹,妹妹考上博士后就没回过家,哥哥去看望傻眼了

磊子讲史
2025-07-14 14:53:33
你以为麻豆传媒是卖片的,其实它是卖人的

你以为麻豆传媒是卖片的,其实它是卖人的

创始人笔记
2026-04-23 21:44:50
2026-05-14 18:31:00
中国能源网 incentive-icons
中国能源网
《中国能源报》社有限公司官网官方账号,专注能源行业报道的垂直媒体,是能源专业产经传媒平台。
85099文章数 1350关注度
往期回顾 全部

科技要闻

马斯克说会谈很顺利 黄仁勋点赞 库克比耶

头条要闻

媒体:中美元首会谈超2小时15分钟 两国关系有新定位

头条要闻

媒体:中美元首会谈超2小时15分钟 两国关系有新定位

体育要闻

争议抽象天王山,和季后赛最稳定中锋

娱乐要闻

何九华官宣当爸!全程不提孩子妈

财经要闻

习近平同美国总统特朗普会谈

汽车要闻

新时代传统豪华是什么样? 上汽奥迪E7X给出了自己的答案

态度原创

旅游
房产
手机
公开课
军事航空

旅游要闻

2026年静安文旅消费季来了,首轮文旅消费券将于5月18日开抢

房产要闻

海南楼市新政要出!拟调公积金贷款额度,最高可贷168万!

手机要闻

华为Pura 90 Pro系列首周7日销量曝光:超20万台,同比增70%

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美以伊战争期间以总理密访阿联酋

无障碍浏览 进入关怀版