网易首页 > 网易号 > 正文 申请入驻

MIT团队开源图表理解数据集,小模型竟完爆商业大模型?

0
分享至

跑数据的同学都有过这种经历:市场报告里一堆柱状图、折线图,领导让火速总结出几条关键趋势。丢给某个收费高昂的商业视觉大模型,换回来的却是把“营收增长42%”读成“约四成”,甚至把两家竞品的市场份额柱状图完全搞混。你盯着屏幕上的错误,血压上来了。

这不是个例。视觉语言模型在看图说话上已经相当能打,但只要图里同时挤着数字、文字和视觉元素,它们就开始胡言乱语。MIT和MIT-IBM计算实验室的研究人员直接捅破了这层窗户纸:哪怕你砸钱上了最先进的模型,从图表里抓出来的信息也可能是错的,或者压根不完整。


这群研究者没打算陪着厂商慢慢迭代。他们动手造了一个叫ChartNet的“一站式图表理解训练场”,专门教视觉语言模型怎么把图表给看明白。拆开这套工具,里面有五件狠货。

第一件狠货,是一个超过一百万张多样化图表的超大规模数据集。请注意,这不是从网上随便爬下来的零碎图片,而是用一种全新的数据生成方法构建出来的。这意味着每一张图都是带着“教学目的”被造出来的,不是把现实世界里模糊不清的扫描件直接塞给模型死记硬背。数据集里的图表类型、颜色、布局、数据分布都经过了刻意变化,避免模型只认得某一种风格的柱状图,换个配色就智障。

第二件狠货,是每张图表都被编码了多层信息:视觉层面的图形结构、语言层面的标题和图例、数字层面的精确坐标和数值。这相当于给每张图同时配了三种“说明书”,模型在训练时可以交叉验证,而不是只盯着像素猜数字。比如一张销售额季度对比图,模型既能看懂柱子的高低,又能关联到坐标轴上的“Q3 42.1”这个具体读数,还会结合标题“北美市场三季度表现”去理解上下文。三种信号对齐之后,图表解读就不再是看图说话,而是接近于人类分析师读图时的多步推理。

第三件狠货,是模型阵容的选择。团队没有拿着这个天量数据集去伺候那些大到没朋友的商业闭源模型,而是用它训练了一系列开源的小体量视觉语言模型。结果相当打脸:很多参数量小得多的开源模型,在数据提取和图表总结这类具体任务上,直接把那些体积大几个数量级的商业模型按在地上摩擦。

第四件狠货,是开源铁律。ChartNet本身完全开放,训练出来的模型权重也开源。这就意味着,预算有限的创业公司、独立开发者和学术机构,不用再给商业API供应商交高昂的“智商税”,自己拿数据集微调一个轻量模型,就能在业务趋势分析或者科研论文图表解读场景里跑出足够靠谱的结果。报告里的折线、论文里的实验对比图,再也不是大厂专属的能力了。

第五件狠货,藏在数据集的设计野心里面。它不是为某一个单一任务准备的,而是覆盖了图表理解里几乎所有的子能力:数据提取、图表类型识别、数值推理、趋势总结、异常值检测等等。Jovana Kondic——这个项目的核心研究员、MIT电子工程与计算机科学系的研究生,在论文里把话说得很直白:“我们做ChartNet,就是要让它成为一个全面覆盖图表理解的资源库,基本上一个AI模型和训练这个模型的从业者可能需要的所有东西,都在里面了。我们希望这个工作能激励研究者们用这些不需要无限算力的小模型去达到顶尖水平。”

从公开信息看,联合署名作者里有一长串来自MIT、MIT-IBM计算实验室和IBM研究院的名字,包括IBM的研究员Pengyuan Li、资深科学家Dhiraj Joshi、软件工程师Isaac Sanchez,以及MIT-IBM实验室的负责人之一、CSAIL资深科学家Aude Oliva和首席科学家Rogerio Feris。这项研究将在IEEE计算机视觉与模式识别大会上发表。

数据集层面的“瓶颈”,在这次发布里反而被摊开来变成了突破点。过去几年,生成式AI在自然语言处理和自然图像推理上狂飙突进,但图表这类同时需要视觉、数字和语言三重理解的结构化图像,一直卡在一个尴尬的位置。研究者们并非没有尝试,而是能用来系统训练模型的高质量图表数据集始终缺位。随便在网上收集的图表数据噪声极大,标注粗糙,根本无法支撑模型学到精确的数值映射关系。ChartNet的价值就在于把这条路给修通了——不是简单堆数量,而是用生成方法保证质量,再用多模态编码保证信息密度。

还有一个细节值得留意:团队并没有宣称小模型在“所有场景”里都赢了商业大模型,而是聚焦在数据提取和图表总结这两项具体任务上。这恰好戳中了现实痛处:大部分公司的图表需求恰恰就是这两件事,而不是让模型看图写散文。当你让一个商业模型去读一份财报表里的瀑布图,它可能洋洋洒洒写了一堆修辞优美的废话,却把“毛利率下降了3.2个百分点”漏掉。ChartNet训练出来的小模型没有那么多花活,但该抓的数字一个不落,该给的趋势一句到位。对于每天要和图表打交道的分析师、记者、产品经理来说,这种“不废话”的精度远比花哨的文案实用。

另外,论文的去向也能说明问题。CVPR在计算机视觉领域的严苛程度业内皆知,这次能够入选,意味着ChartNet在图表结构理解、多模态融合和数据生成方法上的创新通过了同行评议的层层拷问。对于还在观望“图表AI是否靠谱”的技术团队来说,这多少算是一颗定心丸——至少,有人已经踩出了一条能走通的路,而且相关代码和数据集全部公开。

回到一开始那个场景:下次当你再把市场报告里的图表丢给AI时,或许跑在你自己服务器上的一个轻量开源模型,会比那个按调用次数收费的云端巨头更懂那根柱子的真实高度。这背后不是玄学,是有人在数据集上做了足够扎实的脏活。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
卡里克上任第二签来了!2150万捡漏,拿下西甲防守悍将

卡里克上任第二签来了!2150万捡漏,拿下西甲防守悍将

夜白侃球
2026-06-03 09:34:52
回顾:女儿多次被虐待浑身淤青,父亲冲进教室,怒砍校霸13刀致死

回顾:女儿多次被虐待浑身淤青,父亲冲进教室,怒砍校霸13刀致死

就一点
2026-06-02 10:42:14
马上扔掉家里这1种调料,不仅有毒还致癌!很多人还天天吃

马上扔掉家里这1种调料,不仅有毒还致癌!很多人还天天吃

39健康网
2026-06-01 08:31:23
江苏养老金调整或将开始,历年调整方案,养老金3600元能涨120吗

江苏养老金调整或将开始,历年调整方案,养老金3600元能涨120吗

小彬说事
2026-06-03 11:38:36
多人“跪”在街头紧急报警!重要提醒

多人“跪”在街头紧急报警!重要提醒

日照日报
2026-06-01 13:00:19
非必要不做CT?医生强调:只要做过CT,患者一定多加关注这4点!

非必要不做CT?医生强调:只要做过CT,患者一定多加关注这4点!

任医生聊健康
2026-05-30 08:40:18
“办案人员篡改伪造证人笔录,没被追责还升职了”,云南镇雄公安局原副局长刑满出狱后公开举报

“办案人员篡改伪造证人笔录,没被追责还升职了”,云南镇雄公安局原副局长刑满出狱后公开举报

大风新闻
2026-06-02 19:35:11
Lisa带球逼宫驴老三失败,独自“抓娃娃”!

Lisa带球逼宫驴老三失败,独自“抓娃娃”!

八卦疯叔
2026-06-03 11:17:00
美国女子去世75年,癌细胞却活了下来,如今已分裂超过5000万吨!

美国女子去世75年,癌细胞却活了下来,如今已分裂超过5000万吨!

探谜未知世界
2026-06-03 12:58:55
印尼以为镍矿是自己的,赶走中国人后才发现:原来自己是打工的

印尼以为镍矿是自己的,赶走中国人后才发现:原来自己是打工的

有牙的兔纸
2026-06-03 05:24:01
明明隔18公里就是江苏,河南骑车过不去,一脚踩进安徽砀山太憋屈

明明隔18公里就是江苏,河南骑车过不去,一脚踩进安徽砀山太憋屈

奇思妙想生活家
2026-06-03 12:57:48
油价调整:注意,预计下调520元/吨,明晚油价要跌!

油价调整:注意,预计下调520元/吨,明晚油价要跌!

金投网
2026-06-03 11:37:23
乌称遭俄大规模空袭至少10人死亡、约100人受伤!普京:这是他们自己的选择;泽连斯基曾多次警告称可能遭大规模袭击

乌称遭俄大规模空袭至少10人死亡、约100人受伤!普京:这是他们自己的选择;泽连斯基曾多次警告称可能遭大规模袭击

每日经济新闻
2026-06-03 09:49:32
20年前所有人都讨厌他,如今他成了最让人意外的黑马

20年前所有人都讨厌他,如今他成了最让人意外的黑马

一隅安稳
2026-06-02 01:08:20
国家开发银行原行务委员蒋志刚接受审查调查

国家开发银行原行务委员蒋志刚接受审查调查

政知新媒体
2026-06-02 19:34:16
蒋中正亲笔书写的任命状冲上热议!书法的好坏,永远意见不一?

蒋中正亲笔书写的任命状冲上热议!书法的好坏,永远意见不一?

书画相约
2026-06-01 07:23:51
中方收到投名状!印尼砸下31亿,抢购中方退役导弹艇,西方不解

中方收到投名状!印尼砸下31亿,抢购中方退役导弹艇,西方不解

安之若憟
2026-06-03 12:48:24
美军证实先空袭后拦截 否认第五舰队总部遇袭

美军证实先空袭后拦截 否认第五舰队总部遇袭

新华社
2026-06-03 08:10:03
唐艺昕 喜欢嫂子的嘴

唐艺昕 喜欢嫂子的嘴

乡野小珥
2026-06-03 01:03:04
妹妹找我借80万,我正准备转账,8岁儿子的一句话,让我瞬间僵住

妹妹找我借80万,我正准备转账,8岁儿子的一句话,让我瞬间僵住

千秋文化
2026-06-01 20:30:38
2026-06-03 15:39:00
码上闲叙
码上闲叙
有态度网友ytd
5825文章数 58关注度
往期回顾 全部

科技要闻

员工抗议键鼠追踪,Meta让步:可暂停30分钟

头条要闻

被出轨丈夫家暴10年 女子起诉离婚发现1400万已被转走

头条要闻

被出轨丈夫家暴10年 女子起诉离婚发现1400万已被转走

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

著名演员魏宗万去世!曾演活司马懿

财经要闻

左手通胀右手衰退,欧美当下的困局

汽车要闻

依托全域辅助驾驶布局 千里浩瀚助推吉利5月市场大热

态度原创

教育
房产
游戏
家居
军事航空

教育要闻

2026年全国高考报名人数为1290万人

房产要闻

突发!254亩调规,海口江东的超级学校真的快来了!

爆款真人泳装美女游戏手机版来了!多款新作即将发售

家居要闻

江畔轻奢 观云大宅

军事要闻

美伊互袭波及多国 过去一夜中东局势骤然升级

无障碍浏览 进入关怀版