导读
目前AI做得最好的是语音识别、影像识别,而以决策诊断为主的AI在国内几乎是空白。造成这一空白的最核心原因,就是缺乏知识库。
“这次论坛明显不一样,说到大家感兴趣的关键点了,越来越接近医学所关心的问题。”拥有影像诊断与核医学博士学位的复旦大学副校长张志勇,全程听完所有专题发言后应邀发表感想。12月23日,充满学院气息的复旦大学人工智能医学影像论坛在上海举办。论坛主办为复旦大学大数据研究院,协办为复旦大学上海医学院、上海市公共卫生临床中心。
全天论坛围绕当下人工智能(AI)在医学领域的突破口和热点话题展开,包括AI在肺结节、乳腺癌、肝癌、病理、脑等医学影像的辅助诊断,影像组学与基因组学数据的多模态融合,机器可读的知识库等,同时前瞻了人工智能对于医生未来职业发展的影响。
复旦大学大数据研究院于2017年5月成立了医学影像智能诊断研究所。复旦大学十三五精准医学项目首席、医学影像智能诊断研究所所长刘雷教授主持开幕式和圆桌讨论。
人工智能离不开医生的专业“知识”
身为影像科专家,张志勇副校长坦言,自己看过不少人工智能医学影像的产品,但是总体感觉“也没有解决什么大的问题”。张志勇由衷期待,AI真的能够替代放射科医生的部分工作,特别是那些让放射科医生很吃力的部分,比如成百上千幅图像如何在有限的时间内快速看完。
上海市公共卫生临床中心主任、兼任上海申康医院发展中心副主任、复旦大学附属中山医院副院长朱同玉说:“AI培养成后,瞬间就是老医生。医生下岗是早晚的事情。但这其中非常大的挑战是各家医院的电子病历和数据共享问题,算法再厉害也无法发挥作用。”
长征医院影像科主任刘士远教授说:“人工智能现在还是喊口号、插旗子阶段,还需要踏实的积累,特别是病历的积累和数据的共享。反倒是我们医生的心态很开放,因为我们的饭碗你们抢不掉。只有和医生充分地沟通,才能基于临床思维、专业知识做数据,才能接近临床场景,才能解决临床问题。”
复旦大学大数据研究院医学影像智能诊断研究所所长 刘雷教授
刘雷教授认为,认知智能时代医学诊断辅助系统涵盖三大核心技术体系:知识库(知识应用)、人工智能(数据挖掘)、统计建模(辅助决策)。有美国学者提出,医学正在经历从循证医学(EBM)到模型医学(MBM)的转变。即以前是基于经验的,未来越来越多是理性的,因为数据量有了,让医疗更加客观、理性、个性化。大量的医疗数据为真实世界的研究提供了可能。
中国不少医学影像专家们对AI的认知或许令IT业界感到“惊讶”。广东省人民医院医学影像部主任兼放射科主任梁长虹旁征博引了多位国内外信息界专家对 AI的论断:医学是人与人的社会学活动,是有温度的,AI难以体现温度。只有打了标签的数据,才有价值。“目前,我们是基于有限的病历,做医学影像的特征提取,结合各种算法、融合模型来解决临床评价与预测。对影像打上标签,找到病灶,需要大量的临床经验积累,要设法把特征泛化。”梁长虹说。
复旦大学附属肿瘤医院放射诊断科主任彭卫军说:“计算机不会负责任,医生要负责任。将来住院医生一定是要失业的,因为语音识别技术日益成熟,将来就不需要住院医生了,副高直接读报告。”
中国科学院苏州医工所研究员高欣介绍了他们的一项研究工作:将肝癌影像组学和基因组学数据进行关联分析。肿瘤诊断的挑战在于寻找肿瘤标记物。目前主要是两种方法找寻:一种是分子类方法;一种是影像学方法。二者各有优劣势,能否将两种方法有机结合起来,是高欣他们的研究目标。该研究从美国TCGA数据库抽取317个样本,包含了两万多个基因的数量,同时找到相对应的38个病例的CT影像。通过一系列分析找出了6个基因模块对通路进行解释。然后对影像进行分析,基于肿瘤体素特征。最后将肿瘤影像特征与基因特征进行关联分析。“人工智能绝对不能替代医生,医生在高层次可以获得很好感知,AI在低层次上获得很好的结果,将来应该是人机协同工作。”高欣说。
知识库欠缺是人工智能在医学影像诊断层面的瓶颈
刘雷教授也是“十三五”国家科技部重点专项“疾病研究精准医学知识库”的负责人,他表示,医学人工智能存在“智能”的瓶颈,其最大的局限是无法拥有人类的常识——而常识是生活中人类接触到的具有逻辑思维的大量“知识”。比如在肺癌CT影像学征象与EGFR基因突变的研究中,采取了知识库结合影像的新模式,补充和完善了决策所需的推理能力,不仅全面覆盖临床信息,而且能提供决策分析的重要证据。
事实上,大约90%的医疗数据来自影像。今天为止AI做得最好的是语音识别、影像识别。能以决策诊断为主的AI在国内几乎是空白。造成这一空白的最核心原因,就是缺乏知识库。因此国家重点研发项目“疾病研究精准医学知识库构建”,就是瞄准医学行业的瓶颈和难点。刘雷教授介绍:5年计划中由复旦牵头委派11家顶级科研院校分段完成,最终形成一个标准——规范标准、系统全面的精准医学本体和语义表示;一个库——面向全疾病谱、可自动更新的精准医学知识库;一个平台——可交互、可更新、医学知识的共享平台。该平台不仅能够补充和完善国内全疾病学术方面在临床转化中面临的产品化、可视化、工具应用、数据端接口、数据关联等底层技术问题。而且通过其在知识图谱本体构建、自然语义、百万级文献等方面的巨大优势,将来可以更科学严谨地辅助医生进行诊断决策,制定出个性化的诊疗方案。
AI在医学影像领域的应用和需求
当前已经开展的AI在医学影像层面的应用探索十分活跃,业界正日益认识到知识库和基础模型对AI快速成长的重要性。
刘士远教授认为,之所以人工智能有空间,是因为放射科医生往往超负荷工作,在此情况下容易出现漏诊、误诊。同时,年轻医生需要找到自己的切入点。长征医院基于胸部平片和CT开展了机器学习模型的训练。虽然刚开始模型不太靠谱,但是经过训练校正,现在假阳性率可以控制,而且假阴性率很低。“通过人机结合,检查结果可以覆盖所有的结节。这个结论可以下了。”刘士远教授说,“年轻医生更需要AI减轻负荷,但还存在优化医生工作流的问题。”他介绍,放射科医生和AI公司合作,首先要选择病例数据作为验证集,包括确定疾病的种类和数据量,还有图像要标准化。第二,医生要对病变进行标记;第三,要设定一定的金标准,比如平片需要金标准。这当中最难的是验证及分类分层,人工标记很花气力,而且标记得准不准非常关键。靠谱的老师、靠谱的方法,训练出来的模型才会靠谱。所以“请老师”很重要。
尽管市场主流肺结节影像产品都已经宣称有高达90%以上的准确率,但是无论是学界还是医院医学影像界专家都表示出“不服”。
“对于肺结节,现在人工智能不是不能标注,而是标注太多了。肿瘤病人经过化疗之后全是结节,这种情况下AI还不能发挥作用。”复旦大学附属肿瘤医院放射诊断科主任彭卫军说:“如果AI的准确率能够真正达到90%,甚至只要85%,假设在我们医院验证达到了,我愿意帮助在全国推广。”
目前放射科医生的看家本领,还是通过大小、体积、实性等判断良性恶性。“大部分医生能够做到70%-80%的准确性,人工智能产品宣称能到90%,感觉太过了。”中山大学附属第五医院医学影像部副主任及放射科副主任柳学国说。该院和GE公司开展了相关研究,第一期提取了329个特征,发现有12个特征和良性、恶性高度相关。“该模型对于回顾性应用有很好的效果,但对于前瞻性用,还有很长的路走。现在的问题是数据不够丰富,单中心要扩大。针对不同密度结节,建立不同的影像组学鉴别模型。”柳学国说。
“医疗人工智能研究一定要经过临床的检验。今年在美国做的一个测试结果表明,现在最流行的肺结节,只有一个软件真正达到了85%以上,其他都差得一塌糊涂。”北京大学健康医疗大数据中心李全政教授介绍。
事实上,AI在医学影像领域面临诸多瓶颈。据梁长虹介绍,该院也做了非小细胞肺癌生存期预测研究,他归纳了AI在医学影像领域面临的挑战:1、影像学是基于体素的运动;2、相同设备不同厂家,相同设备同一厂家的因素;3、不同设备、多模态数据的融合;4、不同的特征提取算法;5、如何将特征泛化;6、如何将模型泛化等。“AI在医学影像领域需要标准的数据采集、标准的算法、标准的应用。如果能够实现特征的泛化,就是大牛了,否则就只会在深度学习的环节转圈子,很难突破。AI在医学影像领域的道路是曲折的,前途是光明的。”梁长虹说。
梁长虹说:“计算机人员帮医生分割图像,做特征提取。分得对不对,还需要医生参与。对于影像进行分类建模,也需要放射科医生。再好的计算机技术,没有医学知识参与,也解决不了问题。”
为了克服医学影像数据标注的挑战,李全政教授通过机器学习的方式加速标注。比如,对于某个疾病10%的病人进行标注,通过机器学习来增加新的标签。对于不确定的再通过医生来人工标注。这样下来80%的病人可以由机器标注,10%交给医生标注,大大促进影像科的AI发展。李全政教授认为,未来人工智能的机器人,并不一定需要看图。看图是基于人类认知世界的行为方式。“是不是直接从原始数据开始判别?将来所有关于病理、基于图像的,都会走这条路,并不需要看图、做重建,而是重点研究怎么把人的知识传递过去。这种直接的方式,更有利于识别。”
中国医学科学院罕见病研究中心项目办公室主任弓孟春认为,当前各种组学数据都有融合交叉分析的可能,使得医学面临很大的挑战。比如,发现一些病灶容易接受,但是出一个判断就有很大争议,从知识到动作变得非常困难。临床决策支持对于信息学的挑战非常大,因为这是一个连续的管理的问题,如何利用IT架构把这个过程串起来是一个挑战。
HIT专家网∣最新鲜的医疗信息化资讯,不一样的专家视角
领取专属 10元无门槛券
私享最新 技术干货