网易首页 > 网易号 > 正文 申请入驻

VaseVQA:考古领域实现专家级,诊断+补弱RL框架

0
分享至


新智元报道

编辑:LRST

【新智元导读】在文化遗产与人工智能的交叉处,有一类问题既美也难:如何让机器「看懂」古希腊的陶器——不仅能识别它的形状或图案,还能推断年代、产地、工坊甚至艺术归属?有研究人员给出了一条实用且富有启发性的答案:把大型多模态模型(MLLM)放在「诊断—补弱—精细化评估」的闭环中训练,并配套一个结构化的评测基准,从而让模型在高度专业化的文化遗产领域表现得更接近专家级能力。

古希腊陶器是考古学和艺术史的重要实物证据。

研究者需要从单件陶器中提取多层信息:材质与工艺、形制类别、装饰主题、出土地与时间、甚至可能的作坊或画师。

不过传统计算机视觉和通用多模态模型在这类高度专业化任务上常陷入两类困境:

一是缺乏领域知识(模型在通用语料里几乎没接触过「雅典黑釉杯」或「红绘风格」这样的概念);

二是仅靠监督微调(SFT)容易学到「表层捷径」,在遇到组合性、推理性或少样本问题时就失效。

基于此,AI Geeks、澳大利亚人工智能研究所等机构的研究人员提出:既要有专门的数据与任务划分,也要有针对性的训练策略来补弱提升。


论文链接: https://doi.org/10.48550/arXiv.2509.17191

项目地址:https://github.com/AIGeeksGroup/VaseVQA

论文的技术主线可以用一句话概括:先把模型训练到有基础能力(SFT),再通过诊断找出各类问题的薄弱环节,用类型条件化的强化学习(RL)和精细化奖励去有针对性地补弱。

图1:现有视觉语言模型在古希腊陶瓶理解上的局限性与所提出的VaseVL框架

关键步骤如下:

  • 任务分层与问题类型化:作者把陶器理解任务划分为若干类(例如材质、工艺、形制、产地/归属、年代、装饰描述等),为后续诊断与差异化训练提供维度。

  • 诊断评估:对SFT后的模型在每一类问题上分别评测,识别哪些类型表现弱(例如归属推理与装饰描述通常比简单事实类问题更难)。

  • 类型条件化强化学习:针对弱项设计加权奖励,奖励由「关键词命中率 + 语义相似度」组成;同时采用带KL正则的策略更新手段避免模型过度偏离原有SFT行为。作者还引入一种稳定化的策略优化方法(论文提出的变体)来保证训练稳定。

  • 按类型细化评估指标:不同问题类型采用更合适的评价方式(比如对描述类用生成质量指标,对事实类用字符/关键词相似度),避免单一指标一刀切。


图2:VaseVL的整体框架。该方法将有监督微调(SFT)与基于组相对策略优化(GRPO)的强化学习相结合。给定陶瓶图像x、问题q 和参考答案a^*,模型通过在词汇奖励与语义奖励之间取得平衡,并限制策略偏离参考策略 ,从而提升其推理能力。

数据与基准(VaseVQA)

让评测更具信服力

为了能系统评估上述方法,研究人员同时构建了一个面向古希腊陶器的多模态问答基准(VaseVQA)。

该基准覆盖大量陶器图片与多类型问答对,且在标注上引入专家审校,力求兼顾规模与专业性。更重要的是,基准把任务按问题类型拆分,使得模型的薄弱处能被明确定位并针对性优化。


表1:VaseVQA基准测试上的性能比较。RL代表推理注入。

关键发现与实证价值

论文的实验显示:

仅做SFT能显著提升模型的基础识别能力,但在归属推理和复杂描述上仍有限;

在诊断基础上做类型条件化RL优化后,模型在那些先前薄弱的类型上有可观提升——这说明「补弱导向」的训练策略在专业垂直任务上很有效;

细粒度的评价(按问题类型)对于判断模型真实能力与设计针对性改进尤为重要。


表2:消融实验结果说明。RI表示Reasoning Injection(推理注入)Qwen2.5-VL-SFT表示前述模型经过有监督微调(SFT)的版本,而最后一行展示的是提出的VaseVL 模型的性能表现。

意义、局限与可推广方向

这项工作最有价值的,不只是把一个模型调好,而是提出了一套「如何让通用多模态模型在高度专业领域变得可靠」的方法论:任务分层 → 定位薄弱 → 有针对性地微调与评估。

它对文化遗产、医学影像、材料科学等其他垂直领域都有启发意义。

但需谨慎的一点是:强化学习阶段高度依赖奖励设计,若奖励不当或数据偏倚,模型可能学习到新的偏差。

此外,许多考古归属问题本身具有主观性与学术争议,模型输出仍需专家把关作为辅助工具而非最终裁决。

VaseVQA展示了把「领域诊断」嵌入多模态训练流程的可行路径。

文化遗产与AI的结合,不应仅止于表层识别,而应追求「可解释、可校验、有专家协同」的工具化落地。

未来,当这类方法被更广泛采纳,不同学科的专家与工程师协作,就能把AI打造成真正有助于保护与理解人类文化记忆的可靠伙伴。

参考资料:

https://doi.org/10.48550/arXiv.2509.17191

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
菲防长语出惊人:不管美国总统是谁?中国都不太可能对菲律宾动武

菲防长语出惊人:不管美国总统是谁?中国都不太可能对菲律宾动武

清欢百味
2026-01-09 14:33:00
亚洲杯4-2,韩国逆转西亚劲旅,2轮不败,反超伊朗升至小组第一

亚洲杯4-2,韩国逆转西亚劲旅,2轮不败,反超伊朗升至小组第一

侧身凌空斩
2026-01-10 21:23:11
​核动力航母心脏: 反应堆小型化技术到底有多难攻克?

​核动力航母心脏: 反应堆小型化技术到底有多难攻克?

深度报
2026-01-04 23:00:08
韩莹击败陈熠王曼昱,揭秘83年鞍山姑娘

韩莹击败陈熠王曼昱,揭秘83年鞍山姑娘

晨光苏醒a
2026-01-10 23:43:21
接管帅位后8战6胜!浙江男篮外教:我们需要保持住这种求胜欲

接管帅位后8战6胜!浙江男篮外教:我们需要保持住这种求胜欲

狼叔评论
2026-01-10 22:34:02
伊朗总检察长警告:任何参与抗议的人都可能面临死刑

伊朗总检察长警告:任何参与抗议的人都可能面临死刑

桂系007
2026-01-10 23:48:54
统一在望,民进党忽然公开蒋介石日记,舆论哗然!

统一在望,民进党忽然公开蒋介石日记,舆论哗然!

中国艺术家
2025-10-25 05:25:05
71岁成龙坦言不停拍戏的真实原因:家中冷清,儿子一年仅通话一次

71岁成龙坦言不停拍戏的真实原因:家中冷清,儿子一年仅通话一次

草莓解说体育
2026-01-04 01:27:35
他是道德上的小人,却是政治上的巨人

他是道德上的小人,却是政治上的巨人

小豫讲故事
2026-01-10 06:00:08
阿联酋叫停学生去英国留学:怕校园被激进伊斯兰组织洗脑

阿联酋叫停学生去英国留学:怕校园被激进伊斯兰组织洗脑

桂系007
2026-01-09 14:28:16
航天卫星王炸!美国联邦通信批准SpaceX再部署7500颗星链 名单更新

航天卫星王炸!美国联邦通信批准SpaceX再部署7500颗星链 名单更新

林子说事
2026-01-10 09:16:23
1948年,王耀武吃了宋美龄亲自做的一顿饭,转头告诫妻子:去香港,千万别去台湾!

1948年,王耀武吃了宋美龄亲自做的一顿饭,转头告诫妻子:去香港,千万别去台湾!

源溯历史
2026-01-07 20:20:13
雷军抛出55万辆的小目标,流量反噬教小米做人?

雷军抛出55万辆的小目标,流量反噬教小米做人?

DearAuto
2026-01-09 09:59:32
马英九之女:全台湾男人的梦中情人,被日媒称“全球第四美千金”

马英九之女:全台湾男人的梦中情人,被日媒称“全球第四美千金”

章媸解说体育
2026-01-09 18:36:41
勇记:国王总经理想借助库明加的交易,清理德罗赞这样的高薪老将

勇记:国王总经理想借助库明加的交易,清理德罗赞这样的高薪老将

移动挡拆
2026-01-10 04:58:21
深圳中轴线上的深南大道将“下沉” 梅林关变身立体交通枢纽

深圳中轴线上的深南大道将“下沉” 梅林关变身立体交通枢纽

匹夫来搞笑
2026-01-09 12:08:01
临危受命!曼联暂缓选帅,弗莱彻或率队迎战曼城

临危受命!曼联暂缓选帅,弗莱彻或率队迎战曼城

星耀国际足坛
2026-01-10 23:26:14
官方通报“亚运冠军遭索要奖金”调查结果

官方通报“亚运冠军遭索要奖金”调查结果

第一财经资讯
2026-01-10 23:46:34
中国最狠禁令砸向日本!这次结局,一定比广场协议还惨

中国最狠禁令砸向日本!这次结局,一定比广场协议还惨

一个坏土豆
2026-01-08 20:50:28
上海一女子肩膀疼以为是肩周炎,1周后离世,医生怒斥:太无知

上海一女子肩膀疼以为是肩周炎,1周后离世,医生怒斥:太无知

刘哥谈体育
2026-01-10 13:40:30
2026-01-11 00:32:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14304文章数 66452关注度
往期回顾 全部

科技要闻

传DeepSeek准备第二次震惊全世界

头条要闻

男子带父母去四川"纯玩" 不料消费7万连上厕所都收费

头条要闻

男子带父母去四川"纯玩" 不料消费7万连上厕所都收费

体育要闻

怒摔水瓶!杜兰特30+12 难阻火箭遭双杀

娱乐要闻

吴速玲曝儿子Joe是恋爱脑

财经要闻

这不算诈骗吗?水滴保诱导扣款惹众怒

汽车要闻

宝马25年全球销量246.3万台 中国仍是第一大市场

态度原创

艺术
教育
家居
公开课
军事航空

艺术要闻

投资百亿,对标世界杯!杭州“玉璧”封顶!

教育要闻

多地取消高一高二期末统考后,家长焦虑“开盲盒”,专家:需破除唯分数论

家居要闻

木色留白 演绎现代自由

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

海空英雄高翔逝世 曾驾驶歼-6打爆美军机

无障碍浏览 进入关怀版