《Ophthalmology》最近刊登的一篇文章为检测糖尿病眼病自动化检验系统奠定了重要基础。
人工智能(artificial intelligence,AI)代替专科医生诊断糖尿病眼病?
Lily Peng博士和Google AI同事利用擅长视网膜疾病的专家医师提供的一组会诊图像子集,改进了一款疾病诊断软件,再用专家输入来提高计算机表现,最终使这款软件的诊断能力大致等同于视网膜专家。
世界卫生组织宣布,全球糖尿病患者已超4亿,这些患者具有很高的视网膜病变风险。疾病早期,患者往往不容易注意到自身的视力变化,随着病情发展,糖尿病视网膜病变一般会发展为无法逆转的视力丧失。这就是为什么糖尿病患者每年都要进行眼部疾病筛查的重要原因。
Peng博士和她的团队使用神经网络(neural networks)来识别糖尿病视网膜病变。研究早期,他们将成千上的视网膜扫描输入神经网络,训练数学系统“看到”微小的出血等其他早期预警信号。
然而,面对错综复杂的疾病,只依靠机器学习还不够可靠。本着为祖母开发一款更准确的软件的心思,Peng博士进一步参考了专攻视网膜疾病的眼科专家提供的真实诊断数据。
“我想为祖母聘请一组由专家医师组成的治疗团队,能坐下来讨论她的病情,并给出他们的建议,”Peng博士说。“但那样不仅费用昂贵而且很难办到。于是,我开始思考‘才能构建出一个接近于此的算法?’”
Peng博士通过比较原始算法和3位普通眼科医生的投票手动图像分级或3位视网膜专家的共识分级,来测试算法开发的可能性。
糖尿病视网膜病变分级是一个复杂的过程,需要识别和量化许多细微特征,如小动脉瘤和出血。因此,普通医生在检查图像筛查疾病时存在相当大的可变性。
视网膜专家分别对图像进行分级,然后统一整合并解决所有分歧,给出的共识诊断具有一定的洞察力,分级过程有助于纠正因灰尘斑点和出血类型差异导致的错误,为通常难以下诊断结论的“灰色地带”创建更精准的定义。最终,视网膜专家给出的决策精确度高于典型的临床实践。
在这些专家分级图像的帮助下,Peng博士对软件进行了微调,从而提高了原始模型的性能,改善了疾病检测精度。
“我们相信,这项工作为其他眼科疾病诊断研究提供了基础,并为机器学习在医学领域的应用提供了参考标准,”Peng博士说。
原文标题
Grader Variability and the Importance of Reference Standards for Evaluating Machine Learning Models for Diabetic Retinopathy
领取专属 10元无门槛券
私享最新 技术干货