MiraData(Mini-Sora Data)是腾讯公司针对长视频生成任务构建的一个大规模视频数据集。该数据集的特点是拥有较长的视频时长和精心设计的字幕,每个视频片段时长介于1至2分钟之间,均配有结构化字幕。当前版本的MiraData包含57,803个视频片段,累积时长达1,754小时,覆盖了游戏体验和城市/景观探索两种情景。为了收集MiraData,研究人员首先手动筛选了不同情景下的YouTube频道,然后下载并使用PySceneDetect工具对频道中的视频进行分割,最后利用GPT-4V为视频片段添加了结构化字幕。该数据集不仅为长视频生成任务提供了宝贵的资源,也为视频内容理解与生成领域的研究者提供了新的挑战与机遇。
详情请参见五号雷达:https://www.5radar.com/result?key=MiraData
领取专属 10元无门槛券
私享最新 技术干货