Open-Sora-Plan项目,由北大-兔展AIGC联合实验室共同发起,旨在复现Sora,而Open-Sora-Dataset作为Open-Sora-Plan项目的一部分,旨在为开源世界构建一个高质量的视频数据集,并详细阐述其收集和处理过程。该数据集包含40258个视频资源,总时长约274小时。视频数据主要来源于 Mixkit、Pexels 和 Pixabay 三个平台,研究人员遵循CC0许可爬取,这些视频都是高质量、无水印的,其中风景类视频占比 60%。该数据集为训练Open-Sora以及其它文生视频大模型提供了一个高质量的数据集。
详情请参见五号雷达:https://www.5radar.com/result?key=Open-Sora-Dataset
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.