网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

研究称大模型视觉能力不如6岁小孩 Gemini仅胜3岁小孩

2026-01-23 14:22:05　来源: CNMO科技

北京举报

0

分享至

【CNMO科技消息】近日，UniPat AI、xbench、阿里、月之暗面、阶跃星辰等多家研究机构的发布的最新研究显示，在BabyVision视觉推理benchmark上，Gemini 3 Pro Preview仅小胜三岁儿童，跟六岁儿童仍有20%的差距。

据CNMO了解，Gemini 3 Pro Preview在benchmark上得分仅为49.7%，虽然略微领先于其他模型（如GPT-5.2、Claude 4.5 Opus、Grok-4），但其在“找不同”、路径追踪和空间想象等任务中频频失误。例如，在找拼图任务中，它错误地将两个几乎相同的形状选为匹配，完全忽略了细微的几何差异。

研究指出，这种现象并非偶然。当前的大多数多模态大模型在处理视觉信息时，都会先将图像转换为语言描述，再利用强大的语言模型进行推理。然而，这种“语言化”的处理方式导致了致命的视觉信息丢失：语言无法精确描述像素级的精细差异。当面临细微的边界曲线或空间关系时，模型往往无法像人类幼儿那样直接在视觉空间中进行几何匹配，而是受限于语言表达的模糊性。

面对这一挑战，研究团队提出了两种潜在的突破方向：一种是通过强化学习（RLVR）微调模型，在语言推理中引入更显式的中间视觉步骤；另一种是探索基于生成式建模的视觉推理方法，试图让模型直接在像素空间内绘制轨迹或补全图案，以绕过语言描述的瓶颈。尽管目前效果尚不理想，但这一方向被视为未来AI具身智能的关键突破口。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

欧盟发布涉华文件措辞被指系针对中方最激烈官方批评

澎湃新闻 2026-07-16 21:33:19
31242 跟贴 31242
收评：沪指跌3.05% 创业板指跌7.15%

财联社 2026-07-17 15:07:57
26544 跟贴 26544

上海宣布：启用重大活动模式，连续4天！黄浦江两岸，上演专属光影展演

上观新闻 2026-07-17 17:25:00
3 跟贴 3

王濛跨界解说英阿大战，被质疑偏向英格兰不专业；本人回应：是为衬托氛围，更多的是球员踢得好坏

三湘都市报 2026-07-16 22:23:42
669 跟贴 669
15分钟免费，还有……上海拟出台新规，“道路短时停车收费”将明明白白

上观新闻 2026-07-16 22:12:34
134 跟贴 134

曾经的“快乐水”卖不动了？超市老板：往年夏天卖断货的碳酸饮料今年送都送不出去

闪电新闻 2026-07-16 22:38:12
2643 跟贴 2643

“蓝色薯片”来源，乐事向发帖者确认了

南方都市报 2026-07-17 09:52:58
145 跟贴 145
韩国股市今日休市

每日经济新闻 2026-07-17 08:06:05
723 跟贴 723

俄外长：俄中友好久经时间考验

环球网资讯 2026-07-17 07:04:27
25 跟贴 25
巴黎多处知名景点：缩短开放时间；有中国游客透露：高温影响行程，改成瞎溜达

南方都市报 2026-07-14 20:05:15
1872 跟贴 1872
全国首创！一地外卖骑手等红灯，不计入配送时间

南方都市报 2026-07-17 16:52:37
5 跟贴 5
游客吐槽秦皇岛沙滩上“扫码冲脚3元30秒” 运营方回应：明码标价限时为防浪费

闪电新闻 2026-07-17 19:14:05
22 跟贴 22
点评丨当下调整越明显，未来反弹或越高——算力大跌点评

每日经济新闻 2026-07-17 14:58:05
6 跟贴 6
多家公司宣布：下周一，放假

南方都市报 2026-07-16 21:41:47
473 跟贴 473
市场监管总局：加强"拼豆"产品质量安全管控

央视新闻客户端 2026-07-17 17:04:54
28 跟贴 28
决定将至？詹姆斯：我不会让你们等太久

北青网-北京青年报 2026-07-17 10:04:03
219 跟贴 219
京沪高铁7月20日起新增预约购票，可提前60天预约

南方都市报 2026-07-17 14:54:11
68 跟贴 68
机场高速一司机突然昏迷！北京交警紧急行动

家住大兴 2026-07-17 21:12:44
0 跟贴 0

重庆彭水网格员立大功，及时带领60余人撤离，知情人称没有烟花厂

重庆彭水网格员立大功，及时带领60余人撤离，知情人称没有烟花厂

映射生活的身影

2026-07-17 21:00:43

张元英又“正面刚”了！抱臂争议后直接晒抱臂照，这操作太飒了

张元英又“正面刚”了！抱臂争议后直接晒抱臂照，这操作太飒了

奋斗在韩国

2026-07-17 16:37:09

今天大盘精准跌到3882点,无论你是空仓是满仓,明天开盘前听我一句

今天大盘精准跌到3882点,无论你是空仓是满仓,明天开盘前听我一句

风风顺

2026-07-17 02:35:03

多家公司宣布：下周一，放假！

江西工人报

2026-07-17 11:42:43

湖南任免汤吉鸿、王建球、贺辉、韩智广、王先民、毛朝晖等职务

湖南任免汤吉鸿、王建球、贺辉、韩智广、王先民、毛朝晖等职务

中国经济网

2026-07-17 20:39:02

2003年，傅作义之子痛骂亲姐傅冬菊几十年，病榻前吐露遗言:我对她刻骨仇恨无关党派，背后真相首次曝光

2003年，傅作义之子痛骂亲姐傅冬菊几十年，病榻前吐露遗言:我对她刻骨仇恨无关党派，背后真相首次曝光

磊子讲史

2026-07-15 15:06:17

请大家提前做好准备，2026年下半年开始，中国或将出现4大变化

请大家提前做好准备，2026年下半年开始，中国或将出现4大变化

北纬的咖啡豆

2026-06-28 09:53:59

冉莹颖哭穷风波反转？知情人爆破产另有原因，她曾和老总紧密互动

冉莹颖哭穷风波反转？知情人爆破产另有原因，她曾和老总紧密互动

翰飞观事

2026-07-16 22:04:16

34岁！为了回NBA，奥拉迪波哭了！

34岁！为了回NBA，奥拉迪波哭了！

篮球实录

2026-07-16 23:38:31

顺位打脸！6大首轮集体拉胯，火箭堪称本届夏联超级捡漏

顺位打脸！6大首轮集体拉胯，火箭堪称本届夏联超级捡漏

章民解说体育

2026-07-17 12:51:08

酒窝韩国比赛现场曝光！穿蓬蓬裙像公主，唱跳零失误气场不输巨星

酒窝韩国比赛现场曝光！穿蓬蓬裙像公主，唱跳零失误气场不输巨星

星星没有你亮

2026-07-17 19:26:19

今年高考首个捡漏王：487分上985，专业还是临床医学！这运气绝了

今年高考首个捡漏王：487分上985，专业还是临床医学！这运气绝了

杨老师深圳升学指南

2026-07-16 14:00:07

阿那亚偶遇何穗，本人好瘦好高白到发光，她跟保姆带娃不见陈伟霆

阿那亚偶遇何穗，本人好瘦好高白到发光，她跟保姆带娃不见陈伟霆

手工制作阿歼

2026-07-17 02:12:46

250亿砸向海外，券商集体“豪赌”为哪般？

250亿砸向海外，券商集体“豪赌”为哪般？

Daily每日财报

2026-07-17 21:17:12

英法大战比赛时间有变，姆巴佩争金靴，世界杯三四名决赛该取消吗

英法大战比赛时间有变，姆巴佩争金靴，世界杯三四名决赛该取消吗

体育大学僧

2026-07-17 10:03:06

张仲景晚年悟出养生真谛，重在疏通经络而非补气，三处部位尤为关键

张仲景晚年悟出养生真谛，重在疏通经络而非补气，三处部位尤为关键

磊子讲史

2026-07-15 17:38:44

阳气最旺的40天来了！中老年人记得常喝这3汤，排出寒湿一身轻松

阳气最旺的40天来了！中老年人记得常喝这3汤，排出寒湿一身轻松

江江食研社

2026-07-15 23:30:04

华发股份巨亏

地产微资讯

2026-07-17 08:59:32

没有他，中国历史或被改写，他被判死刑，毛主席大怒：立即放人

没有他，中国历史或被改写，他被判死刑，毛主席大怒：立即放人

元哥说历史

2026-07-16 09:30:07

跨越二十年世界杯同框！贝克汉姆一家 2006 与 2026 对比回忆杀

跨越二十年世界杯同框！贝克汉姆一家 2006 与 2026 对比回忆杀

墨薷桃桃

2026-07-17 08:55:54

专业、有态度的手机门户

120110文章数 316340关注度

往期回顾全部

科技要闻

Kimi K3突然登顶！价格也涨到了美国档

头条要闻

西班牙首相将出席世界杯决赛阿根廷总统因为迷信不去

头条要闻

西班牙首相将出席世界杯决赛阿根廷总统因为迷信不去

体育要闻

30亿欧对决，世界杯季军战毫无意义？

娱乐要闻

曲婉婷自爆患癌！全网喊“苍天绕过谁”

财经要闻

多只宽基ETF显著放量！大资金再度出手？

汽车要闻

把中国超跑卖到英国，比亚迪正在被世界看见

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戏

教育

手机

数码

公开课

《轮回之兽》流程曝光：主线约40小时全成就翻倍

教育要闻

限填1所民办初中，成都家长后悔没看这3个关键点

手机要闻

一加海外社区8月17日关闭，用户需自行备份内容

数码要闻

亮源新创姜旭：世界模型的最终目标是让机器人理解并参与物理世界

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版