一、Medical Segmentation Decathlon2018介绍
随着机器学习的最新进展,语义分割算法变得越来越通用,并且可以转化为看不见的任务。医学成像领域的许多关键算法通常在少数任务上得到验证,限制了我们对所提出贡献的普遍性的理解。本着AutoML的精神,一个在许多任务上开箱即用的模型将对医疗保健产生巨大影响。医学成像领域也缺少一个完全开源和全面的通用算法验证和测试基准,涵盖大范围的挑战,例如:小数据、不平衡标签、大范围对象尺度、多类标签,以及多模态成像等。这个挑战和数据集旨在通过针对几个高度不同的任务的大型医学成像数据集的开源,以及通过标准化分析和验证过程来提供此类资源。
二、Medical Segmentation Decathlon2018任务
MSD 挑战测试了机器学习算法在应用于 10 种不同的语义分割任务时的普遍性。目的是开发一种算法或学习系统,可以单独解决每项任务,无需人工干预。这可以通过使用单个学习器、多个学习器、体系结构搜索、课程学习或任何其他技术来实现,只要任务特定的模型参数不是人类定义的。
参与者需要下载数据,开发通用学习算法,在每个任务训练数据上独立训练算法,无需人工交互(没有任务特定的手动参数设置),在测试数据上运行学习模型,并提交分割结果。
三、Medical Segmentation Decathlon2018数据集

目标:结肠癌原发性
方式:CT
大小:190 个 3D 体积(126 个训练 + 64 个测试)
来源:Memorial Sloan Kettering 癌症中心
挑战:异质外观
四、技术路线
1、根据固定阈值和形态学操作得到人体ROI区域,然后提取原始图像和标注图像的ROI,由于结肠癌差异性很大,为了增加对其检出率,对标注Mask进行形态学膨胀操作,核大小为5。
2、分析图像信息,得到图像平均大小是495x360x108,因此将图像缩放到固定大小512x320x128。图像预处理,对步骤1的原始图像进行(-500,500)范围截断,然后采用均值为0,方差为1的方式进行归一化处理。然后将数据分成训练集和验证集,并对训练集做5倍数据增强操作。
3、搭建VNet3d网络,使用AdamW优化器,学习率是0.001,batchsize是1,epoch是300,损失函数采用二分类的dice和交叉熵。
4、训练结果和验证结果


5、验证集分割结果
左图是金标准结果,右图是预测结果。













6、测试集分割结果










