大数据与AI的结合,会令人产生无限的遐想。但对于相对保守的医疗行业,大数据的发展又是如何?
1
2015年国务院发文《关于印发促进大数据发展行动纲要的通知》明确把大数据作为国家的发展战略,并写入十三五规划纲要,专栏中也对医疗健康服务大数据提出了确切的要求。
2
2016年国务院办公厅发布的《关于促进和规范健康医疗大数据应用发展的指导意见》是针对医疗大数据的首个顶层文件,首次提出医疗大数据是国家级的战略资源,明确医疗大数据发展目标。
3
2018年国务院办公厅《关于印发深化医药卫生体制改革2018年下半年重点工作任务的通知》文件也明确指出:促进“互联网+医疗健康”发展,推进健康医疗大数据中心与产业园建设国家试点。
近年来,国家频繁发布医疗大数据相关的政策文件,体现了对其重视程度,以及国家战略意义。那么到底什么是医疗大数据?大数据的发展、应用场景有哪些?
1
医疗大数据的定义
定义
医疗大数据是基于多平台、跨机构的数量极其庞大的医疗数据的集合。
特征
医疗数据要成为大数据,不管信息来源何方,有何价值,都应具备4个重要特征即4V特征:
大量性( Volume):数据量极大,至少达到TB、PB量级。据统计,一个患者一次普通检查基础数据为几百KB,如有影像检查,则数据量飙升为2GB左右。按照人均1GB的数据量,每年全国就诊人次近80亿,将产生800万TB的数据。
多样性(Variety):数据的种类、来源多且复杂,包括各级医疗机构的基本健康数据、可穿戴设备产生的健康数据和临床研究产生的数据,涉及文字、图像、音视频等多种形式。
快速性(Velocity):数据产生和更新的速度很快,大数据的产生是一个动态的过程。每天检查的患者人数都在快速增加,其数据也在快速更新。
价值(Value):大数据之所以有意义,正是因为其具有巨大的潜在价值!数据收集只是第一步,更为重要的是对其进行定向筛选、清洗后发掘的价值。
2
医疗大数据的从0到1
医疗数据其实早已存在。只不过早期,大部分医疗数据都是以纸质化的处方、病历等形式存在,而非电子化数据存储模式。
随着计算机技术的发展,医疗数据逐渐向数字化方向转换。从最早的单机或科室级的系统开始,到各个医疗机构普遍应用的以收费管理为中心的HIS、LIS、PACS,再到以病人为中心的全院化电子病历系统。院内信息化系统为医疗大数据的收集提供了可能性。
移动互联网、物联网、云计算等最新技术的应用,推动着区域医疗大数据的形成。区域平台可将各个医疗机构的数据进行有效整合,建立以患者为中心的数据平台。同时可穿戴、移动便携设备更是将数据的收集路径进行最大的延伸。区域平台、移动设备为医疗大数据的收集提供最佳通道。
3
医疗大数据的范围
医疗大数据以健康为中心,涉及居民健康的方方面面,主要包含以下四点:
医疗记录:主要由患者电子病历系统产生,包括:患者的基本数据、既往史、过敏史、检验数据、影像数据、用药数据、手术数据、诊疗数据、康复数据、随访数据等临床医疗数据。
公共卫生服务数据:包括卫生部门行政数据、疾控中心监测数据、出生和死亡等公共卫生数据。
可穿戴设备数据:通过各种穿戴设备(手环、衣服、鞋子、起搏器等),可收集到的人体的心率、血压、睡眠等健康数据。
临床研究数据:主要来源于实验室产生的数据,包括循证过程中研究的与患者用药相关的用药量、用药时间、用药成分、实验对象的反应时间、症状改善程度等生命制药数据以及与患者手术、诊断等相关的新技术的研究数据。
4
医疗大数据的挑战
标准不一:各医疗机构缺乏一致的医学术语标准,难以进行数据间的统一。我国于2002年开始采用国际疾病编码和国际手术编码,但在中国医疗的实际情况下,还不能覆盖医疗记录中所有相关信息,医疗机构都会根据自身的需要进行临床编码的重新制定与修改。数据标准的不统一为大数据的整合带来难度。
数据保护:医疗机构出于利益、患者隐私、数据安全等考虑,往往不愿公开自己医院的医疗数据,且医院内部的临床信息系统都运行在独立、封闭的局域网中。
隐私安全:医疗健康行业正在成为网络黑客攻击的一个热点目标。医疗数据的泄露将会导致患者隐私的暴露,医疗隐私对个人而言是最为敏感的数据,会影响工作、生活,甚至生命安全。根据“美国身份窃盗资源中心”发布的一份报告,2014年,在美国所有发生的网络攻击和数据被窃事件中,医疗和健康行业占比超过42%。曾经轰动一时的美国第二大的医疗保险服务商Anthem公司信息系统被黑客攻破事件,造成近8000万员工和客户资料被盗,包括个人基本信息、医保ID、就诊记录、疾病数据等。
5
医疗大数据的应用
区域协同:在大数据的基础上,区域医疗将催生新的业务模式。利用医疗大数据,根据患者的病情及健康数据,实现智能问诊、智能预约,远程医疗等服务。
辅助诊断:通过人工智能算法对海量数据进行机器学习和深度挖掘,一方面可协助医生获取类似疾病的治疗方案,全面把握患者的诊断和治疗,另一方面可自主进行临床诊断,减轻医生工作压力。2017年北京友谊医院举办国内首届人机读片竞赛,由AI(甲状腺结节超声图像诊断)对阵北京三甲医院组成的84名专家团队。结果人类大败,在答题过程中,准确率排名前25名的医生,平均耗时1000秒,而AI耗时仅为专家的1/5,且正确率高于所有医生。在团体赛中,AI以73%的综合正确率获胜,且100道题仅用时514秒,而有着8年“读片”经验的301医院超声诊断科主治医师张明博则用时909秒。比赛结果充分说明大数据 + AI在医疗领域的应用潜力及广阔前景。
临床研究:我国人口众多,地域广袤,疾病谱丰富,医疗资源具有领先国外的先天优势。但目前大量临床数据被浪费,没有得到充分有效的利用。医疗大数据可为临床研究提供数据基础,助力科研发展。
流行病预测:利用大数据,公共卫生研究机构可以更早地预测传染病传播途径及范围等。2008年Google推出一款预测流感的产品Google流感趋势(Google Flu Trends,GFT),主要基于对相关搜索词的大数据分析,创建地区流感图表和流感地图。在2009年,甲型H1N1流感暴发的几周前,GFT成功预测了流感在美国境内的传播,其分析结果甚至具体到特定的地区和州,令公共卫生官员备感震惊。因为传统上,相关机构需要在流感爆发一两周后才能形成这些地区病情分析。GFT对流行病的成功预测,其中社会意义不言而喻。
个性化医疗:每个人的健康状况都不相同,同一疾病在不同的人群中也会有不同的反应,因此针对患者独有特征定制治疗方案越发重要。利用大数据可将患者的全部诊疗信息、体检信息整合,并结合历史数据、当下病情等加以分析,从而针对该患者制定出个性化的医疗服务和精准治疗方案。
慢病管理:通过大数据对慢病进行智能管理。整合医疗就诊、基层卫生、家庭医生、患者等多方数据,为不同慢病患者建立精准画像,从饮食、运动、用药等全方面提供个性化管理方案。
END
90s杂谈
每周·一篇·医疗观点
领取专属 10元无门槛券
私享最新 技术干货