欢迎关注数据超市微信公众号
随着新年来临,流感高发期也如期来到,而今年的这波流感尤其猛烈,各地医院都出现了人满为患的现象。在科技如此发达的今天,面对小小流感病毒的大流行,人类却感到束手无策,这多少有些让人感到讽刺。不过,你是否能想到,再过若干年,我们有可能会像预报天气一样预测流感并做出防治。而这种前景的达成,是基于眼下一种方兴未艾的理念:大数据。
看似人畜无害的“灰犀牛”
流行性感冒其实就是这样一只“灰犀牛”
灰犀牛
2017年,“灰犀牛”在中国突然火了,古米歇尔·渥克所撰写的《灰犀牛:如何应对大概率危机》一书让“灰犀牛”这个概念为世界所知。作为第二大陆上动物,灰犀牛体型笨重、反应迟缓,你能看见它在远处,却毫不在意,但一旦它狂奔而来,定会让你猝不及防,直接被扑倒在地。渥克用这个概念比喻那些人们习以为常、毫不在意,却可能引发危机的风险。
在危害人类的诸多传染病当中,流行性感冒其实就是这样一只“灰犀牛”。
不久前刚刚卸任的美国联邦疾病控制与预防中心(CDC)主任汤姆·弗里登,在卸任前最后一次受访中,被问及哪一种流行病对未来人类威胁最严重,他十分干脆地回答:“毫无疑问是流行性感冒。”
弗里登话音未落,2017年年末席卷美国36个州的新型流感病毒H3N2就似乎验证了他的说法。据CDC最新报告说,一些州已经出现了流感的死亡案例,其中加州已有10余人死于流感病毒,第11例出现在2017年12月28日。不过,由于只有部分流感症状患者会去医院接受检查,所以CDC追踪受影响人群的实际人数存在相当困难,所以该组织至今没有完成对此次美国流感事态的总体评估,只能对公众发出空泛的警告。
2017年12月13日,美国、澳大利亚、中国等国研究人员在《柳叶刀》杂志上联合发布了一份报告,研究人员选择了1999年和2015年之间至少4年的数据进行分析,然后通过统计模型估算出全世界每年的流感相关呼吸道感染死亡人数。结果发现,季节性流感每年至少致使全球29.1万至64.6万人死亡,高于此前估计的25万至50万人。
“这些发现提醒我们流感的严重性”,参与研究的CDC流感专家约瑟夫·布雷西在一份声明中说,“流感预防应成为全球优先事项。”
毫无疑问,如果人类掌握一种技术,能准确地预测出流感的流行趋势,将会为未来人类的健康帮上大忙。
用“病毒云图”预测流感
流感的爆发与规模真的可以预测吗?
那么,流感的爆发与规模真的可以预测吗?
可以!而且相关技术确实在趋于成熟。
去年11月,美国《科学·转化医学》杂志刊发过芝加哥大学研究人员的一篇文章。研究人员利用他们所开发的新工具,成功预测了当时即将到来的流感季将是甲型H3N2流感的高发季。
该论文第一作者杜向军称,他们在流行病学群体模型中加入流感病毒进化的变化信息,每年6月根据收集的流感病毒序列数据以及来自监测部门的流行病学数据,就能预测未来一年流感感染动态与人数。“整个过程类似于天气预报。”他比喻说。
2008年,谷歌公司曾推出过一款名为“谷歌流感趋势”(GoogleFluTrends)的产品。工程师们假定:一旦人们患上流感,就可能会在搜索引擎上输入特定的检索词条以获得与流感相关的信息。通过汇总和分析这些检索词条,谷歌就能预测流感将在何时何地爆发。2009年,这款产品在甲型H1N1流感爆发几周前成功预测了其在全美范围的传播,反响巨大!一时间,有关大数据开启公共卫生变革的观点接踵而来。
哈佛大学教授GaryKing的研究却指出了谷歌项目在分析上的不足。
首先,这个项目没有尽可能利用传统的统计分析手段来剔除系统误差,比如残差的自相关性和季节性;
其次,“谷歌流感趋势”忽略了其他数据的作用。
有网友讲了个笑话,有机构监测到某地在某一段短时间内突然爆发了很大的流感相关名词的搜索量,于是很紧张地通知了疾病防控中心。等疾病防控中心的人去调查,发现那里平安无事,只不过是有两个大的医学院那段时间正值期末考试。
虽是笑话,也侧面反映出大数据给出决策前,不仅要采纳数据广泛性,也要注意采纳数据的严谨性,才能提高数据结果的准确性,不至于出现大的决策偏差。
尽管类似的项目还存在缺陷,但依靠大数据把握流感的整体趋势的这一思路无疑是对的,比如芝加哥大学去年的研究成果无疑就借鉴了其思路,只不过,他们所采信的数据来源渠道更加权威。
另外必须指出的是,谷歌推出该项目的时间是在2008年,当时智能手机的普及率与今天不可同日而语,其所谓“大数据”今天看来其实并不“大”。而随着近十年来数字技术突飞猛进,如果类似的大数据公司能将这个计划重做一遍,一定会得到不一样的结果。
流行性感冒与气象的关系
流感的流行具有明显的季节性
流行性感冒(以下简称流感),是由感冒病毒所引起的急性呼吸道传染病。
从春季进入夏季, 随着气温升高, 人的上呼吸道对微生物的抵抗力逐渐增强, 高温和强光加速对流感病毒的死亡, 夏季很少有流感流行 。通过对十几个气象因子的考虑, 我们认为 ,季节转换时期的气候突变是触发流感的关键因子 , 其中起主导作用的是气温突变 。
研究人员还研究了如下天气情况和流感的关系:
初秋首次强冷空气与流感的关系
初冬首次寒潮与流感的关系
1 月气象条件对流感的影响
春季气温波动与流感的关系
综上所述, 流感发病的关键期为初秋 、初冬和初春等季节转换时期 。在日平均气温维持 17 .0 ℃以上时不利于流感的流行。初秋日平均气温一次降温幅度 >10 ℃, 对应连续3 天或以上连阴雨 ;初冬首次寒潮过境时间比历年超前 8 天或以上, 对应日平均气温降温幅度 ≥6 .0 ℃;春季日平均气温一次降温过程降温幅度 >10 ℃;冬季干旱 、大风等, 有利于流感的流行。
相信在不远的将来,大数据预测流行病将成为一个大趋势。我们将基于数据构建一个复杂的“病毒云图”,像做天气预报一样科学地预测每一次疾病袭来的时间、规模并做出应对。到那时,流感威胁将不再是令我们忧心的难题。
数据超市多款气象数据
数据超市 BigData711.com
全国空气质量数据2017年城市数据
气象数据---日值数据
数据量:80万
数据简介:提供从1981年到2010年各省市的地面累年值日值数据,包括累年日平均最高、最低气温,平均水汽压、降水量和风速等信息
适用场景:可用于气象的趋势分析和研究
END
科学研究是希望发现这个世界的奥秘
而数据就是这个世界的底牌
-- 数 据 超 市 --
http://BigData711.com/
领取专属 10元无门槛券
私享最新 技术干货