
随着工业智能化与安全生产要求的不断提升,粉尘检测逐渐成为环境监测与安全防护领域的重要研究方向。在矿山、工厂、建筑工地等高粉尘场景中,粉尘浓度过高不仅影响生产效率,更会对人体健康和设备安全造成严重威胁。
传统的粉尘检测方式通常依赖物理传感器,如激光粉尘仪、光散射式传感器等,但这些设备成本高、布设复杂、实时性不足。近年来,基于计算机视觉的粉尘识别与检测技术逐渐崛起,通过图像识别模型(如YOLO、EfficientNet、Vision Transformer等),可以实现对粉尘状态的实时检测与自动判断。
为推动粉尘检测的智能化研究,我们构建并公开了一个标准化、结构清晰、标注完备的 粉尘检测数据集(Dust Detection Dataset),为研究者与开发者提供高质量的训练与验证样本。
链接:https://pan.baidu.com/s/1LHce_fyo7slzQHtXGIBhZA?pwd=2nmk 提取码:2nmk 复制这段内容后打开百度网盘手机App,操作更方便哦
数据集说明
样本分类输出(中文):粉尘
样本分类输出(英文):dust
样本分类输出数量:1
训练集train: 2910个样本
验证集valid: 923个样本
训练集和验证集样本比例:约3:1
该数据集包含 4000 张高质量粉尘图像样本,并按照 3:1 比例划分为训练集与验证集,适用于目标检测、图像分类及环境监测等多种计算机视觉任务。
数据集组成 | 数量(张) | 占比 |
|---|---|---|
训练集(train) | 2910 | 约 72.8% |
验证集(valid) | 923 | 约 23.1% |
合计(total) | 4000 | 100% |
该数据集经过人工精确标注,标注格式兼容 YOLO 格式(.txt) 与 COCO 格式(.json),用户可根据自身训练框架(如Ultralytics YOLOv8、MMDetection、Detectron2)直接加载。

数据样本主要采集自以下几类典型场景:
图像采集设备覆盖:
所有图像经过去噪、尺寸统一(640×640)、曝光补偿与颜色标准化处理,确保模型训练的稳定性与通用性。

采用半自动标注 + 人工复核方式完成。标注工具使用 LabelImg 与 Roboflow Annotator,标注格式如下:
class_id x_center y_center width height例如(YOLO 格式):
0 0.531 0.478 0.612 0.532其中 class_id = 0 对应 “dust” 类别。
所有标注文件与图片文件同名,方便直接载入模型训练框架。
Dust_Dataset/
│
├── train/
│ ├── images/
│ │ ├── 0001.jpg
│ │ ├── 0002.jpg
│ │ └── ...
│ └── labels/
│ ├── 0001.txt
│ ├── 0002.txt
│ └── ...
│
├── valid/
│ ├── images/
│ └── labels/
│
└── data.yaml其中 data.yaml 文件包含以下内容:
train: ./train/images
val: ./valid/images
nc: 1
names: ['dust']该数据集可广泛应用于以下研究与工程场景:


粉尘检测不仅关乎工业安全,更代表着AI 环境智能感知的重要方向。通过本数据集,研究者可以快速开展从数据预处理、模型训练到实际部署的全流程实验,推动智能监测系统的发展。
未来,我们计划在此基础上扩展更多类别(如烟雾、蒸汽、雾气等),构建多环境融合感知数据集,为智能视觉检测提供更全面的支持。

✅ 推荐使用框架:
📦 数据格式兼容:YOLO、COCO、VOC
📘 关键词:粉尘检测 / 目标检测 / YOLO / 计算机视觉 / 数据集构建
在本文中,我们详细介绍了一个粉尘检测数据集,该数据集包含4000张图像,已按3:1比例划分为训练集与验证集,专门用于粉尘识别与检测任务。数据集具有以下几个特点:
通过该数据集,研究者可以在粉尘检测领域进行更为深入的探索,不仅提高了粉尘监测的效率,还促进了相关领域算法的不断优化与突破。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。