近年来,医疗数据信息持续爆炸性增长,在治疗技术不断提升的同时也带来了新的问题——数据丰富,知识贫乏。由此,引入了新的处理方式——数据挖掘。本文讲述了医疗数据的特点、医疗数据挖掘及其在医疗质量管理中的应用。
一、数据挖掘技术概述
在上世纪80 年代的初期,数据挖掘技术基于数据统计理论以及机器学习开始逐渐形成。数据库当中的知识发现(knowledge discovery indatabase,KDD)为数据挖掘技术的另一个名称,指的是从海量的数据当中将可信、有效、新颖的数据加以提炼,并且将这些能够被人所理解的信息进行深层次高级处理的过程。
数据挖掘是一门新兴的边缘学科,涉及多个领域,包括信息科学、数据库技术、数据可视化、统计学、机器学习及其他学科等。而医疗数据挖掘,由于其数据的复杂性,除了传统的ETL技术,还需要开发出以临床诊疗业务为核心的多源异构数据汇集处理,和基于医学自然语言处理的数据智能识别技术。因此,医疗数据的挖掘,需要专业的医学+专业的技术型综合团队。
图1:数据挖掘涉及领域
二、医疗数据的特点
医疗数据挖掘和其他数据挖掘的不同,一定程度上是由于原始数据特性不同所致。表现在以下几个方面:
图2:医疗数据的特点
1. 异构性:指医疗数据类型的多样化。医疗数据的类型包括了数值型数据、类别型数据、图像、文字、信号、语音、视频等,所以结构类型众多。这种多模式特性是它区分其他领域数据的最显著特点,并且加大了知识发现的难度,使开发基于医疗数据库的通用软件系统较为复杂。
2. 海量性:由于医疗工作自身的特点,如病情观察的不可间断、各种医疗检查结果纷繁复杂以及存有大量的医学文献专著等,导致医疗数据量非常巨大,尤其现在越来越多的医疗单位使用高科技的医学检查设备(如MRI,PET等),而这些设备每天都会产生数千兆字节的数据。
3. 数学表征不显著性:物理学家收集数据后带入公式模型,可以得到较好反应数据间关系的模式,而医疗数据混合了文字、图形等非数值型数据,使得数据挖掘人员并不能很好的找到可以反应数据间联系的模型。
4. 主观性:实验和诊断都会带有主观性,也就难以发掘知识。同一个领域的顶尖专家都会对对方的诊断带有异议,这就会难以整合。
5. 标准化危机:在医学界,很多基本概念都没有规范,例如一个简单的概念,“结肠腺癌,转移到肝”都有很多的表达形式,再如有的中药有很多别名。
6. 伦理性、社会性、法律性:包括了数据归属权问题、数据安全问题、法律诉讼问题等。
三、数据挖掘技术应用于医院管理中的实施流程
由于医疗数据的复杂多样性,数据挖掘技术应用于医院管理工作当中,其实施流程也较为繁琐,但每一步都至关重要。
图3:数据挖掘技术应用于医院管理中的实施流程
1. 需求确定
按照医院管理方向、内容以及所要达到的目标进行要求的确立,对管理需求的问题进行准确描述,并将这些问题转化为需要进行数据挖掘的问题。
2. 数据的理解及准备
参照数据挖掘的相关问题,首先要将目标数据进行确定,并从医院的数据库或信息系统当中将适用于挖掘的大量数据进行筛选,并且对数据的质量问题进行初步评估,对于相关的数据进行提取,无关的数据进行清理。
3. 建模及数据挖掘
针对任务目标的类别划分,对于将要采用数据挖掘的分析方法类别进行确定,例如选择聚类分析,或者是描述,或者是关联规则等方法,随后选择一种最为直接有效的数据挖掘算法,将数学分析的模型通过数据进行建立与完善。
4. 模型评价
在进行模型评价时,需要通过有效数据对模型进行解释与结果数据的挖掘,并且要经过多次的测试与评价后,才能够对信息的可信度及有效性进行判定。在评价当中所采用的数据分析方法将按照数据挖掘的技术选择而选择,在通常情况下会使用到可视化的数据挖掘技术。在对模型进行建立、解释、评价、验证的过程当中,需要进行多次反复的验证,一个有效的数据模型并不是一次性就能够成功的,因此要在数据模型建立后,通过将其他数据进行带入后,将分析所得到的结果对模型进行评价,如果得到的结果无法令人满意,则可以通过反馈机制进行再一次的数据挖掘,重新进行上述流程,以得到有效的模型为止。
5. 结果发布
按照管理人员对于信息以及数据的管理要求,对于数据挖掘后所获得的知识进行重新组织,并采用简单易懂的方式呈现给相关人员,进而能够使其在工作当中充分利用,并能够敏锐地发现问题及原因。
四、数据挖掘技术在医疗质量管理中的应用
医疗质量管理的一项重要内容是对疾病预后进行评价,对于住院患者、出院患者、转科患者、死亡患者等,可以通过分析患者住院日、感染率、死亡率、治愈率、好转率等,分析每个过程中的预警值,解决不良影响因素,改善该病种在院内,甚至区域内的整体诊治水平。
应用数据挖掘技术和多维模型分析可以了解并分析疾病医疗质量问题。从医院排名靠前的多发病种中找出死亡率最高的几类病种,应用数据挖掘技术分析死亡率高的原因,如患者自身原因、诊断和治疗方面原因及医生原因等,从医疗行为所涉及的人、事、物等关系中找出与死亡率指标相关的,从而分析问题的根源,规范医疗行为,提高医院运转效率和经济效益。
图4:数据挖掘技术分析医疗质量相关指标
五、应用前景
目前,各医疗机构对相关数据的统计只局限于采用普通的统计学分析方法,很少应用数据挖掘技术。数据挖掘技术与传统的统计学相比,其具有较好的前沿性,可更全面、系统、准确地分析医院医疗质量问题,更快地找出存在的问题,从而帮助医院管理者找出问题,分析根源,找到相应的解决策略。此外,数据挖掘技术还可更大范围地应用于整个医疗质量管理领域,例如:各区域卫计委的医疗质控,专病专科医联体的质控管理等。以上,说明了数据挖掘相关技术在医疗质量管理问题上的解决能力较高,具有较高的理论和实践价值。
参考文献:
1. 郑娟,许建强.数据挖掘技术及其在医疗质量管理中的应用[J]医学信息系统杂志,2018,39(3):70-72.
2.戴怡妍.数据挖掘技术在医院管理中的应用[J]中国卫生产业,2014 (14) :62-65.
3. 洪弘,李玲娟.医疗数据挖掘的特点、过程及方法[J]价值工程,2011,30 (32) :166-167.
扫一扫
更多惊喜等着你
............
领取专属 10元无门槛券
私享最新 技术干货