编译:chux
出品:ATYUN订阅号
AI系统的一个挑战性问题是数据集。大样本量通常是准确性的必然结果,但有些数据集比其他数据集更难找到。
来自Nvidia,梅奥诊所,以及MGH和BWH临床数据科学中心的研究人员相信他们已经提出了解决问题的方法:一个本身产生训练数据的神经网络,特别是大脑癌性肿瘤的合成的三维磁共振图像(MRI),在论文“Medical Image Synthesis for Data Augmentation and Anonymization using Generative Adversarial Networks”中进行了描述。
“我们首次表明,我们可以生成可用于训练神经网络的大脑图像,”Nvidia的高级研究科学家,该论文的第一作者Hu Chang表示。
AI系统是使用Facebook的PyTorch深度学习框架开发并在Nvidia DGX平台上训练的,它利用了生成对抗网络(GAN),试图区分生成的样本和现实样本,创建令人信服的脑异常核磁共振成像。
该团队采购了两个公开可用的数据集:阿尔茨海默氏病神经影像学计划(ADNI)和多模式脑肿瘤图像分割基准(BRATS),用来训练GAN,并将20%的BRATS 264研究用于性能测试。内存和计算限制迫使团队将扫描的分辨率从256 x 256 x 108降至128 x 128 x 54,但他们使用原始图像进行比较。
来自ADNI的生成器,通过ADNI获得图像,学习了合成脑部扫描(包括白质,灰质和脑脊髓液)。接下来,当在BRATS数据集上松散时,它会生成带有肿瘤的完整分割。
GAN对扫描进行了注释,这项任务可以让人类专家团队工作数小时。并且因为它将大脑和肿瘤解剖学视为两个不同的标签,它允许研究人员改变肿瘤的大小和位置,或者将其“移植”到健康大脑的扫描中。
“有条件的GAN非常适合这种情况,”Chang表示,“它可以消除患者的隐私问题,因为生成的图像是匿名的。”
当团队使用由GAN产生的真实脑部扫描和合成脑部扫描的组合训练机器学习模型时,实现了80%的准确性,比仅在实际数据上训练的模型好14%。
“许多放射科医生对这个系统很看好,”Chang说,“他们想用它来产生更多罕见疾病的例子。”
Chang表示,未来的研究将调查在不同患者群体中使用更高分辨率的训练图像和更大的数据集。模型的改进版本可能会缩小肿瘤周围的边界,使它们看起来不会“叠加”。
领取专属 10元无门槛券
私享最新 技术干货