来源:海量大数据实践
随着低成本传感器的增长超过预期,计算机在医疗领域正在产生前所未有的数据量。这其中,有的被用于研究目的,比如儿科医生监测哮喘背后的环境诱发因素。也有的将其用于个人消费领域,比如对心率和血压的监测。而大数据医疗在其中最主要的作用是提高患者的医疗效果并压低医疗成本。
今年十月底,IEEE(电气与电子工程师协会)将在加利福尼亚州圣克拉拉市举办2015年国际大数据会议,研究大数据在医疗IT领域的潜力。大会有2个分论坛,其一标题为“从大数据在医疗保健中获得价值,”将作为跨学科论坛,数据科学家和临床研究人员交流思想和分享信息的平台。另一个被称为“挖掘大数据,以提高临床疗效”,其目标是汇集研究人员在大数据挖掘和医疗保健的交叉与合作,分享和相互学习。
基于对大数据的应用早期的成功分析,麦肯锡估计大数据帮助医疗领域节省12%至17%的医疗费用。外推至2013年用于医疗保健的费用约为2.9万亿美元,也就是说相当在3480亿到 4930亿美元的成本降低。要知道在2013年实现这些收益并不容易。在2015年2月数字成像期刊中,研究人员在美国马里兰州的巴尔的摩大学讲述了他们是如何利用全国肺癌筛查试验中获得应用于日常肺癌筛查临床决策支持工具的数据。病人的人口统计资料和NLST科目肺结节的特性转化成结构化查询语言表,并上传到Web服务器,提供用于研究人员实时查询的数据库。
其结果简直让人难以置信的。通过把试验结果转换成一个方便的参考数据库,从而使个别病人通过和数据库的匹配而得到其病情的客观评估。
以吸烟者为例,通过数据匹配,然后在患者吸烟史、年龄、和地理位置的上下文中计算结果中筛选出个体结节是良性还是恶性,通过大量的数据对比可以给出更有参考意义的结果。
去年春天,在SIIM年会上,美国马里兰大学的阿琼夏尔马博士列举了通过数据筛选实验来预测前列腺、肺、结肠直肠和卵巢癌等疾病。夏尔马描述一个基于Web的应用程序,可以从PLCO审判过程中匹配患者信息,借助病人人口统计和个人风险因素评估筛选得到结果。
成千上万的美元通常用于治疗个别癌症的医学或者放射治疗管理等。在此背景下,麦肯锡估计通过利用大数据,可以节省数千亿美元似乎不那么古怪。
慢性疾病和常见疾病的数据通常由政府和私人公司研究挖掘,目前大都可以在美国疾病控制和预防搜集的数据中得到。而大数据在医疗方面最大的潜力,是正在兴建中的电子健康档案数据。这些数据的绝大多数都没有使用超出收集他们的医疗保健企业的范围,大部分甚至没有用对其潜能进行深度挖掘。显然,对于未来的临床决策支持,它们对于改进治疗效果会起到非常大的作用。