CaLM Dataset是上海人工智能实验室、同济大学、上海交通大学、北京大学及商汤科技联合构建的一套全新的评测数据集,旨在使因果推理能力评估有“考题”可循。该数据集包含超过12万条中英文数据,基于四个层级的因果任务设置,涵盖了丰富的因果概念。同时,研究人员还细致地将文本模态划分为日常表达(Natural)、抽象表达(Symbolic)和数学表达(Mathematical)三种子态,以考察模型在不同类型模态下的理解能力。该数据集约90%的内容为全新构建,10%来自于现有公开数据集,既能与已有公开结果进行对比,反映评估的有效性,又能避免训练集数据污染问题。
详情请参见五号雷达:https://www.5radar.com/result?key=CaLM+Dataset
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.