网易首页 > 网易号 > 正文 申请入驻

豆包、ChatGPT、Gemini 同台 PK,谁才是博物馆最强逛展搭子?

0
分享至

最近,浦东美术馆突然闯进了个 AI 「显眼包」。

豆包正式「入职」上海浦东美术馆,成了卢浮宫、毕加索双展的「官方 AI 讲解员」,甚至能陪知名主持人陈鲁豫在线看展。


有一说一现场的效果是真不错,但作为一个喜欢看展的编辑,我也怀疑,如果在全世界任何一个其他没有和豆包有合作的博物馆或美术馆,它还能有这么强吗?


为了探出目前 AI 看展的真正实力,APPSO 决定拉来 ChatGPT 和 Gemini 和豆包同台竞技,而且咱就不测浦东美术馆的展品,从全球艺术文化作品中随机挑选对象,看看究竟谁才是逛展的最强 AI 向导。

AI 看展哪家强?三大模型 battle

我先祭出《唐朝诡事录三》同款素材,剧中喜君赠送了老费一款以「唐代鎏金舞马衔杯纹银壶」为原型的酒壶。于是,我也将我的问题交给了这三名 AI 向导。

1.

我在《唐朝诡事录》里好像看过类似的道具。你帮我看看这个银壶上的马在干什么?

2.

既然是盛酒的壶,为什么要设计成马咬着杯子的造型?

豆包和 Gemini 表现尚可,准确识别了马的造型,但让我没想到的是,豆包直接关联到了唐玄宗祝寿的历史背景,反观 ChatGPT 看似一本正经,实则在那儿水字数,主打一个已读乱回。

点击观看横评完整视频,依次展示豆包、ChatGPT、Gemini 的回答,同下文

在本土语境理解上,这一局豆包可以说是赢麻了。

此前,彩绘陶牵手女俑走红网络,让无数闺蜜团排队打卡。只是,我也难免好奇,这两人牵手是否有啥特殊含义,以及从这个陶俑中我们是否能一窥当时的穿搭风格。

好家伙,Gemini 上来就翻车,非说是唐朝的,把朝代搞混可是大忌。豆包则是一针见血指出这是北魏的陶俑,历史背景检索能力简直是降维打击。至于分析陶俑穿搭风格这一块,三者的视觉分析还是挺在线的,基本做到了所见即所得。

我知道你想说什么,中国模型测中国文物这不妥妥有主场优势吗?

好,我这就拿出荷兰肖像画黄金时代的代表作《夜巡》,这是画家伦勃朗·范·莱因(Rembrandt van Rijn)于 1642 年创作的一幅布面油画。

这幅画自然没有那么简单,我提问道:「这幅画叫《夜巡》,但看光影感觉不像是在晚上画的。伦勃朗当时到底是画的白天还是晚上?为什么后来名字搞错了」

ChatGPT 和 Gemini 表现得像个乖巧的学生,老老实实点出了「夜巡」这个名字是因为后期灰尘掩盖以及清漆氧化变黑导致的误解。

唯独豆包除了犀利地指出了画作的核心误区,更进一步点出了画作描绘的真实场景——民兵连队在白天整装出发。这种基于视觉细节的深度推理,确实有点超出我的预期了。

跨越 2000年的「啤酒套装」,能骗过 AI 吗?

前面这些测试只能算热身题,现在 APPSO 开始上强度了。

你可能也在网上看过很现代物品疯狂「撞脸」的文物,我们当然知道这世上并没有穿越这么一回事,但 AI 能不能识破这种情况呢?

就比如「唐代紫檀木画槽琵琶」,如果不是对历史有了解,我想大部分人第一反应应该会觉得像 LV 的花纹,我同样把问题甩给了 AI :

「这个琵琶是不是 LV 的哪个限定款?如果我穿越回唐朝,带着这把琵琶去参加宫廷宴会,应该搭配什么样的服装」

有趣的是,Gemini 严肃分析了半天,显得很没底气,最终得出的结论也仅仅是「不太像」,而豆包和 ChatGPT 的语气则更肯定,果断否认了其中的联系。


为了让测试更严谨,我们对同一个问题进行了重复测试

不过,三者在「穿越穿搭」建议上倒是出奇一致,清一色推荐了朱红或大气风格的服装,审美在线。

更有趣的是「古代啤酒套装」测试。战国水晶杯、元代琉璃酒瓶和明代银香盒,这三件跨越 2300 年的文物拼在一起号真的太像啤酒了,搞了个「钓鱼执法」,问 AI 们是不是有人穿越了。

面对这个陷阱,Gemini 居然漏看了杯子和盖子,只盯着瓶子聊工艺;ChatGPT 依然在做老学究式的科普,回答略显宽泛;只有豆包一眼识破了我的诡计,精准指出了这三件看似一套的文物,其实分别来自战国、元代和明代。

最后还有那架酷似现代战斗机的金巴亚黄金飞机,我对着 AI 们好奇发问:「这看起来完全就是一架现代战斗机,你看那尾翼和机翼的设计。这到底是哥伦比亚古人的艺术品,还是证明了远古外星人的存在」。

对此,ChatGPT 给了一句万金油评价,并感叹古代精湛的工艺和想象力。Gemini 援引了考古学家的说法,指出这是一种饰品。

而豆包则在科普的基础上,进一步点出了这种垂饰的设计原型可能是当代的蜂鸟或神鸟,体现了古印第安人对自然和神灵的崇拜,直接给「外星人说」来了一波祛魅。


为了让测试更严谨,我们对同一个问题进行了重复测试

玩归玩,最后还得测点硬核的。这轮测试的是 AI 鉴宝的能力,也就是分辨真伪。

我找了一张地摊上 5 块钱批发、号称「价值百万」的明成化斗彩鸡缸杯仿品图,假装好奇是不是捡漏了:「这个同款鸡缸杯之前拍卖了 2 个多亿。古玩城老板说是明代成化年的老货,只要 9800 块卖给我。你看这画工,我是不是捡大漏了?」

很快,Gemini 和 ChatGPT 开启了经典的「端水模式」,建议找专家、找机构,主打一个免责声明。只有豆包直接开启「毒舌鉴宝」模式,直言这大概率是仿品,一针见血指出釉面过亮、鸡冠轮廓模糊等破绽,甚至调侃千万别当真品收藏。

AI 成了发现艺术美的好搭子,背后是 VLM 的进化

三轮实测下来,豆包的表现确实出乎了我的意料。

要问它为啥让人瑞思拜,翻看豆包的技术文档后我发现,核心就在于其背后的 Seed-1.8 模型,是一个点满了天赋的 VLM(Vision-Language Model,视觉语言模型)。

给不了解技术的朋友简单科普下,啥叫 VLM?

VLM 是一种能够同时「看懂」图像和「读懂」文字的 AI 模型。如果说传统的 LLM(大语言模型)是只有「大脑」但没有「眼睛」的学者,那么 VLM 就是为这个大脑装上了高性能摄像头。它不再只是处理单一的文本,而是能直接理解图片、视频甚至网页截屏。

基准测试结果显示,Seed1.8 在多个视觉语言基准测试中表现突出,不仅在多模态推理任务中超越了前代模型 Seed1.5-VL,在大部分任务上的表现甚至已经开始「贴脸开大」,直逼目前最顶尖的 Gemini-3-Pro。


尤其是在难度极高的视觉推理考试 ZeroBench 里,Seed-1.8-Thinking 拿到了 11.0 的全场最高分,成功解答问题的数量也是大幅增加。

在通用视觉问答任务中,Seed1.8 的 VLMsAreBiased 基准测试成绩反手就是一个 62.0,把一众同行甩开了一大截。


而且不管是 2D 还是 3D 的空间感,Seed-1.8 也都拿捏得死死的,哪怕是面对复杂得像迷宫一样的动态数据集,适应性也极强。


也正是有了这些硬核技术做支撑,豆包才能在刚才的几轮「刁难」中脱颖而出。

这也让我回想起以前我逛博物馆,逛展的情况——基本就是走马观花,一圈逛下来,印象最深刻的往往只有展厅空调的温度以及文创店周边的价格,知识属实是一点都没进脑子。

以前我们总觉得,把博物馆、美术馆建到更多人的家门口,这就是艺术普惠了。但实际上,物理上的距离消除了,认知的门槛依然高耸。金牌讲解员要么太贵,要么根本约不到;专家讲座又太深奥,不适合所有人。

绝大多数时候,普通观众只能隔着玻璃柜,看着那些冷冰冰的文物发呆。


豆包「视频通话」功能使用方式参考

认知门槛才是艺术欣赏的最后一公里,也是最难打通的一公里。通过这次体验我发现,豆包还真能充当那个「打破次元壁」的讲解员,把那些晦涩的文物知识,翻译成咱们普通人能听懂的大白话。

而且,这也是一种全新的看展姿势。以前逛博物馆,基本是单向输出,但现在有了豆包,你可以随时提问、随时找茬、随时互动,这种「把麦克风交给观众」的体验,确实和以前不一样了。


目前豆包已经和国家博物馆、河南博物院、成都博物馆等大馆合作,上线了「豆包带你逛懂博物馆」项目。

当然,换个视角来看,这也是 Seed-1.8 模型在复杂真实世界里,进行的一次大规模众测。它用通俗的解答拉近了文物和观众的距离,也算是用另一种数字化方式,把几千年前的古代工匠和拿着智能手机的我们,真正连接在了一起。

以后再去刷展时,别光顾着在那儿拍照,比剪刀手了,不妨把那些看不懂的文物、字画涂鸦都丢给豆包试试。没准你会发现,当艺术不再高冷,逛博物馆也同样轻松有趣。

欢迎加入 APPSO AI 社群,一起畅聊 AI 产品,获取,解锁更多 AI 新知

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
亚洲多国开启健康筛查模式,防止尼帕病毒入境

亚洲多国开启健康筛查模式,防止尼帕病毒入境

红星新闻
2026-01-28 13:55:07
美媒预警:中国飓风3000列装,美军无人机蜂群战术再无胜算!

美媒预警:中国飓风3000列装,美军无人机蜂群战术再无胜算!

杨风
2026-01-26 22:12:23
2-0!亚洲一姐掀翻斯瓦泰克重返澳网4强,近2次交手连送“早餐”

2-0!亚洲一姐掀翻斯瓦泰克重返澳网4强,近2次交手连送“早餐”

大秦壁虎白话体育
2026-01-28 11:44:16
窦靖童:我妈钱多到用不完,但穷苦潦倒的爸爸,成了我如今的心病

窦靖童:我妈钱多到用不完,但穷苦潦倒的爸爸,成了我如今的心病

璀璨幻行者
2026-01-20 04:29:30
郎平也没想到,当年留给前夫在美国长大的女儿,如今成了她的骄傲

郎平也没想到,当年留给前夫在美国长大的女儿,如今成了她的骄傲

削桐作琴
2026-01-28 12:39:59
巴西总统卢拉向安切洛蒂开玩笑:赢下世界杯,然后执教科林蒂安

巴西总统卢拉向安切洛蒂开玩笑:赢下世界杯,然后执教科林蒂安

懂球帝
2026-01-28 11:37:05
什么是牢A的“三通一达”?解释清楚了!

什么是牢A的“三通一达”?解释清楚了!

雪中风车
2026-01-27 19:50:37
一个要求,震动东京:中国要求日本尽快归还,清算终于开始了

一个要求,震动东京:中国要求日本尽快归还,清算终于开始了

铁锤简科
2026-01-27 20:42:44
阚清子发文:在荆棘中寻找出路,在脆弱中生长力量

阚清子发文:在荆棘中寻找出路,在脆弱中生长力量

红星新闻
2026-01-28 12:57:30
曾多次站中国对立面!乌克兰宝妈进澳网4强:翘起二郎腿 挑衅一切

曾多次站中国对立面!乌克兰宝妈进澳网4强:翘起二郎腿 挑衅一切

风过乡
2026-01-28 08:20:06
美方内部行动设想曝光:对伊朗实施“快速、突然且干净”的打击 以色列进入最高警戒

美方内部行动设想曝光:对伊朗实施“快速、突然且干净”的打击 以色列进入最高警戒

红星新闻
2026-01-28 13:15:09
不论炖什么肉,都要记得加这2种料,肉烂鲜香,特入味,连吃一碗都不腻

不论炖什么肉,都要记得加这2种料,肉烂鲜香,特入味,连吃一碗都不腻

美食格物
2026-01-27 00:42:18
1956年,江青赴苏联治病,向接诊的医生坦言:我和毛泽东同志是政治夫妻

1956年,江青赴苏联治病,向接诊的医生坦言:我和毛泽东同志是政治夫妻

寄史言志
2026-01-27 10:57:11
与富商海外产子真相大白8个月,江疏影官宣喜讯,王传君没说错

与富商海外产子真相大白8个月,江疏影官宣喜讯,王传君没说错

阿纂看事
2026-01-27 16:11:35
不装了:美国掏出“广场协议”的刀,却发现中国脖子比刀还硬

不装了:美国掏出“广场协议”的刀,却发现中国脖子比刀还硬

妙知
2026-01-28 13:42:51
乔治轰32+5+5仍无缘今日最佳!对不起,你碰到不讲理的小卡了

乔治轰32+5+5仍无缘今日最佳!对不起,你碰到不讲理的小卡了

世界体育圈
2026-01-28 13:40:36
同事刚入职七天就向我借2万,我摇头拒绝,第二天领导:你真冷血

同事刚入职七天就向我借2万,我摇头拒绝,第二天领导:你真冷血

船长与船1
2026-01-28 10:47:51
“和平委员会”名单公布,19国已签署,让中方意外的是普京和巴铁

“和平委员会”名单公布,19国已签署,让中方意外的是普京和巴铁

议纪史
2026-01-27 12:30:03
别再尬演情妇了,脸肿嘴歪,强行装嫩,这是迷倒男人该有的皮囊?

别再尬演情妇了,脸肿嘴歪,强行装嫩,这是迷倒男人该有的皮囊?

查尔菲的笔记
2026-01-28 13:09:51
退伍军人来面试,我问他:你以前开什么车的?退伍军人说:军车

退伍军人来面试,我问他:你以前开什么车的?退伍军人说:军车

千秋文化
2026-01-25 20:55:00
2026-01-28 14:27:01
AppSo incentive-icons
AppSo
让智能手机更好用的秘密
6044文章数 26745关注度
往期回顾 全部

科技要闻

它是神也是毒!Clawdbot改名卷入千万诈骗

头条要闻

高市早苗拉票时哭了:这三个月我咬紧牙关、全力以赴

头条要闻

高市早苗拉票时哭了:这三个月我咬紧牙关、全力以赴

体育要闻

冒充职业球员,比赛规则还和对手现学?

娱乐要闻

王祖贤入驻某音:一条7秒视频吸粉55万

财经要闻

40倍杠杆断裂!水贝一黄金平台兑付困难

汽车要闻

中国豪华车老大之争:奥迪凭啥干掉奔驰宝马?

态度原创

本地
时尚
教育
健康
公开课

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

被章若楠、舒淇带火的毛衣,这样穿太时髦了!

教育要闻

开门红!22人冲进全省前100名!南京九中喜报!

耳石症分类型,症状大不同

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版