所谓大数据并不仅仅是指海量数据,而更多的是指这些数据都是非结构化的、残缺的、无法用传统的方法进行处理的数据。大特征:海量的数据规模(vast)、快速的数据流转和动态的数据体系(velocity)、多样的数据类型(variety)和巨大的数据价值(value)。仅从海量的数据规模来看,全球IP流量达到1EB所需的时间,在2001年需要1年,在2013年仅需1天,到2016年则仅需半天。全球新产生的数据年增40%,全球信息总量每两年就可翻番。
就像电力技术的应用不仅仅是发电、输电那么简单,而是引发了整个生产模式的变革一样,基于互联网技术而发展起来的“大数据”应用,将会对人们的生产过程和商品交换过程产生颠覆性影响,数据的挖掘和分析只是整个变革过程中的一个技术手段,而远非变革的全部。“大数据”的本质是基于互联网基础上的信息化应用,其真正的“魔力”在于信息化与工业化的融合,使工业制造的生产效率得到大规模提升。
简而言之,“大数据”并不能生产出新的物质产品,也不能创造出新的市场需求,但能够让生产力大幅提升。正如,《大数据时代:生活、工作与思维的大变革》作者肯尼思·库克耶和维克托·迈尔-舍恩伯格指出:数据的方式出现了3个变化:第一,人们处理的数据从样本数据变成全部数据;第二,由于是全样本数据,人们不得不接受数据的混杂性,而放弃对精确性的追求;第三,人类通过对大数据的处理,放弃对因果关系的渴求,转而关注相互联系。这一切代表着人类告别总是试图了解世界运转方式背后深层原因的态度,而走向仅仅需要弄清现象之间的联系以及利用这些信息来解决问题。
领取专属 10元无门槛券
私享最新 技术干货