编辑 | sunlei
发布 | ATYUN订阅号
人工智能已经在医疗行业的诸多领域开始发挥作用,比如眼科,内科等,并且取得了巨大成果。自2016年以来,已经有不少关于AI在皮肤科学的应用研究开展。
实际上,皮肤问题已经成为继感冒、疲劳和头痛之后全球最常见的疾病之一。全球约有 19 亿人都在某些特定时间会患上皮肤病。仅在美国,去诊所中就诊的患者中,就有高达 37% 的人至少有一种皮肤问题。在中国,也超过2亿皮肤病患者。但是,这些患者中,有一半以上都是由非皮肤科医生诊治的。(想想你自己有没有亲手挤过痘…)
带状疱疹、牛皮癣、痤疮、脚癣、疣、白癜风等各类皮肤疾病困扰着很多人
由于全球皮肤科医生的短缺,许多患者得不到专业的建议和治疗,而全科医生在确定病情方面也没有专科医生准确。于是,谷歌开发的Deep Learning System(深度学习系统)AI皮肤科医生横空出世。
这个来自谷歌的人工智能系统能够对26种皮肤疾病,提供与皮肤科医生同准确度的诊断。
人工智能,越来越能
之前关于皮肤疾病的机器学习研究,通常集中于皮肤癌的早期筛检,特别关注皮肤的病变,判断其为恶性抑或是良性的皮肤癌,但Google也指出,超过90%的皮肤疾病并非恶性,而解决这些常见的疾病,对于减轻全球皮肤疾病有极大的帮助。
Google 软件工程师 Yuan Liu,和 Google Health 技术计划经理 Peggy Bui 博士表示:我们开发了深度学习系统(DLS),以解决初级护理中最常见的皮肤问题。这项研究凸显了 DLS 潜在的潜力,它能够增强那些没经过额外专业培训的全科医生的诊断能力。
AI 系统架构的示意图,输入皮肤照片、性别、年龄等元数据深度学习系统分析后,给出诊断参考诊断结果
Google指出,通常临床案例的判定,并非一开始就能获得绝对的答案,医生会给出鉴别诊断(Differential Diagnosis),以一个列表排序可能的情况,鉴别诊断可以用来对病患进行额外的检查,直到病情确诊为止。而DLS就是模仿临床医生开鉴别诊断的想法,给出患者可能拥有的皮肤疾病排序列表,帮助分类患者以及后续的诊断和治疗。
DLS的训练资料包括了一张或多张皮肤异常的临床图像,还有45种像是年龄、性别和症状等元资料,Google总共使用了17,777个去识别化的病例,分别把2010年到2017年的病例当作训练资料,将2017年到2018年的病例则用在评估系统上,在训练DLS的过程,也使用了超过40位皮肤科医生提供的五万多个鉴别诊断。
Google为了评估DLS的准确性,将其结果与三名皮肤科医生的诊断进行比较,在3,756个病例中,把DLS的皮肤状况排序列表和皮肤科医生提供的鉴别诊断相比,DLS列表第一项就正确诊断的概率达71%,而前三项诊断的准确度更高达93%。
DLS 的表现与三类临床医生对比,AI 系统与皮肤科医生表现相当,甚至优于医生
DLS的诊断准确度与皮肤科医生平均75%相当,且远高过初级医疗人员(Primary Care Physicians)的60%,以及执业护士(Nurse Practitioners)的55%,前三诊断的准确度甚至可以帮助皮肤科医生判断病情。
DLS 训练过程中,元数据与图像都是十分重要的训练元素
一视同仁的问题诊断
由于皮肤病也与皮肤类型有极大的相关性,皮肤本身的视觉评估对于诊断至关重要。因此,最后为了评估对皮肤类型的潜在偏见,团队基于 Fitzpatrick 皮肤分型,测试了 AI 系统的性能。该皮肤分型的范围包括 I 型(苍白,经常灼伤,永不晒黑)到 VI 型(最深棕色,永不晒黑)。
病例原图(左);以绿色突出显示 DLS 需要识别的重要区域(右);中间图像为组合图像,指示系统集中对脱发区域进行诊断而非针对前额皮肤
他们集中研究了至少占数据 5% 的皮肤类型 Fitzpatrick II 型-IV 型的皮肤上,发现在这些类别上,DLS 的准确性相近,前 1 项诊断的精度在 69% 到 72% 之间,前 3 项的精度在 91% 到 94% 之间。
研究人员将这套系统的整体准确性,归功于训练语料库中元数据的存在,并表示,研究结果表明,他们的方法可能“帮助提示临床医生考虑可能的因素”,这些可能性因素并不是他们最初进行鉴别诊断的依据。
但是,他们还指出,他们的训练语料库仅取自一家远程皮肤病学服务机构。某些 Fitzpatrick 皮肤分型在其数据集中过于罕见,无法进行有意义的训练或分析;并且由于缺乏可用的数据样本,他们的数据集无法准确检测出某些皮肤状况,例如黑色素瘤。
Liu 和 Bui 写道:我们认为,在培训和验证中,加入更多经活检证实的皮肤癌病例,可以解决这些局限性。
其实,探索的脚步从未停止
在国外,人工智能辅助诊断皮肤病也早有先例。以色列公司曾开发的DermaCompare就是一款通过图片检测黑色素瘤的应用。用户利用手机摄像头进行“全身摄影(Total Body Photography)”,上传到App后,系统可诊断某种痣是否为黑色素瘤征兆。
2017年,美国斯坦福大学研究人员领衔的团队使用13万张与皮肤病变相关的图像来“训练”人工智能程序,利用深度学习技术训练谷歌公司开发的一项人工智能程序,让它利用图像去分类并识别皮肤病变处属于良性还是恶性。该模型与21名皮肤科医生进行皮肤癌识别结果对比,两者的表现基本处在同一水平上。
2018年,来自德国、美国和法国的一个研究小组用超过10万张图片对一个人工智能(AI)系统进行了训练,使它能够区分出危险的皮肤病变和良性的皮肤损伤。
这台机器——一个深度学习卷积神经网络,即CNN——后来在区分恶性黑素瘤和良性痣的照片的测试中,打败了来自17个国家的58名皮肤科医生。其中超过一半的皮肤科医生是“专家”级别,有5年以上的经验,19%的人有2到5年的工作经验,29%的人在不到两年的时间里是初学者。
“CNN的表现优于大多数皮肤科医生,”研究小组在发表于肿瘤学年报的一篇论文中写道。平均而言,人类皮肤科医生准确地检测出了86.6%的皮肤癌,而CNN的这一比例为95%。
这项研究的第一作者,海德堡大学的Holger Haenssle在一份声明中说:“CNN检测出了更多的黑色素瘤,这意味着它比皮肤科医生的敏感度更高。”但是它还“误诊了一少部分恶性黑素瘤,这将导致不必要的手术。”
当它们得到更多的病人和他们的皮肤损伤的信息时,这些“皮肤科医生”的表现有所改善。研究小组称,人工智能可能是一种有用的工具,可以更快、更容易地诊断皮肤癌,并在扩散之前进行手术切除。他们补充说,每年世界上大约有232,000新发黑素瘤病例,其中有55,500人因此死亡。
在国内的皮肤科 AI 应用上,最近也有很多的进步。如湘雅大学第二医院与丁香园、大拿科技合作,实现了首个皮肤病的人工智能诊断的辅助系统,并举办了新闻发布会。该系统目前主要针对红斑狼疮和皮炎等一系列疾病,识别准确性高达 85% 以上。
除此之外,国内其他医院皮肤科也逐渐开始应用 AI 诊断工具,如北京协和医院与北京航空航天大学合作,已经开始使用皮肤镜图片的自动识别, 在近期的皮肤影像继续教育班上进行了展示;武汉协和医院也与中国香港一家公司合作,应用该公司研发的皮肤智能检测系统(Dr.Skin),已经可以有效地进行常见皮肤病的图像智能诊断。中日友好医院崔勇教授发起的中国人群皮肤影像资源库(CSID)项目, 目标是建立可用于建立辅助诊断模式的、中国人群特异性的皮肤影像资源,它也是人工智能用于皮肤病智能诊断可利用的重要学习资源。
从医生端走向患者端,并不简单
从大的层面来讲,皮肤病的人工智能诊断系统,主要有两个应用方向:一是医生,二是患者。对医生来说,人工智能诊断系统会是极好的诊断助手,有利于提高效率,减小误诊率。而对患者来说,可以通过傻瓜式的操作,很快对自己的病情有初步了解,面向医生端,作为辅助诊断的工具,是目前人工智能应用到皮肤科的主要场景。尤其对于诊断能力偏弱的基层医生来说,人工智能的辅助无疑是大有帮助的。不过,人工智能辅助诊断走向患者端,实现患者自查,似乎也是必然趋势。