【五号雷达-数据快讯】OpenDV-2K - 多模态自动驾驶视频数据集

文章来源：企鹅号 - 五号雷达

OpenDV-2K是由OpenDriveLab、上海人工智能实验室等机构联合打造的一个大规模多模态自动驾驶视频数据集。该数据集包含了2059小时的驾驶视频及丰富的文本信息，覆盖全球40多个国家和244个城市，展现了极为丰富的地理分布、交通场景、天气条件和传感器配置。数据集不仅包括YouTube上收集的高质量驾驶视频，还整合了7个公开许可的数据集，以增强其在传感器配置和语言表达上的多样性。该数据经过了严格的视频采集、筛选和语言注释。通过先进的视觉-语言模型和视频分类器，为每帧视频生成了描述性和指令性文本，从而使得数据集不仅能够反映驾驶场景的视觉信息，还能够理解并预测驾驶行为。OpenDV-2K在自动驾驶视频预测、模拟与规划等领域的应用潜力巨大，能有效提升系统泛化性，应对真实世界驾驶的多元挑战。

详情请参见五号雷达：https://www.5radar.com/