网易首页 > 网易号 > 正文 申请入驻

【五号雷达-数据快讯】GITQA - 多模态图推理问答数据集

0
分享至

GITQA是香港科技大学和南方科技大学,通过将图结构绘制为不同风格的视觉图像,构建的首个包含视觉图的推理问答数据集,该数据集包含超过423K个问答实例,每个实例包含相互对应的图结构-文本-视觉信息及其相应的问答对。数据集包含两个版本:GITQA-Base和GITQA-Aug,其中GITQA-Base只包含单一风格的视觉图。GITQA-Aug则更加丰富,它对视觉图进行了多种数据增强处理,包括改变布局、点的形状、边的宽度和点的风格等,从而提供了更多样化的视觉图表现。该数据集可用于评估基于文字描述的LLM和基于多模态的MLLM在图推理任务上的性能,并研究视觉信息对图推理的影响。

详情请参见五号雷达:https://www.5radar.com/

数据集地址:

https://v-graph.github.io/

https://huggingface.co/collections/Yanbin99/gitqa-datasets-65c705c9488606617e246bd3



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2024-05-29 13:36:49
五号雷达
五号雷达
探测数据要素市场,把握数字经济机遇。
154文章数 2关注度
往期回顾 全部

科技要闻

王传福再放狠话,燃油车要成“非主流”

头条要闻

以色列拟将联合国近东救济工程处列为"恐怖组织"

头条要闻

以色列拟将联合国近东救济工程处列为"恐怖组织"

体育要闻

阿根廷一代神锋,击碎了沙特的金元足球梦

娱乐要闻

张若昀怎么剧外比剧内更惨兮兮…

财经要闻

东方通收购藏雷 花6亿买来"业绩变脸"

汽车要闻

新哈弗H6苦练内功 向燃油车绝缘智能SAY NO

态度原创

时尚
本地
数码
亲子
公开课

50岁女人的搭配技巧解析,配饰精致大方,穿浅色更年轻有活力

本地新闻

食味印象|歙县限定!枇杷味儿的清甜初夏

数码要闻

OPPO Pad 3详细配置爆料:配12.1英寸屏幕+骁龙8G3

亲子要闻

陪宝宝体验火星车,一家三口体验生活在火星的一天,太刺激了!

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版