MiraData(Mini-Sora Data)是腾讯公司针对长视频生成任务构建的一个大规模视频数据集。该数据集的特点是拥有较长的视频时长和精心设计的字幕,每个视频片段时长介于1至2分钟之间,均配有结构化字幕。当前版本的MiraData包含57,803个视频片段,累积时长达1,754小时,覆盖了游戏体验和城市/景观探索两种情景。为了收集MiraData,研究人员首先手动筛选了不同情景下的YouTube频道,然后下载并使用PySceneDetect工具对频道中的视频进行分割,最后利用GPT-4V为视频片段添加了结构化字幕。该数据集不仅为长视频生成任务提供了宝贵的资源,也为视频内容理解与生成领域的研究者提供了新的挑战与机遇。
详情请参见五号雷达:https://www.5radar.com/result?key=MiraData
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.