据估计,每天会创建2.5百万兆字节的数据,我们需要将这些前所未有的大量数据妥善储存以便日后访问以及对其进行分析。这些数据量大到需要使用鲜为人知的单位来衡量,如ZB,PB和EB。随着公司搜集到的数据越来越多,并希望能方便的访问这些数据,这对技术和基础设施的要求更高了。21世纪初,行业分析师Doug Laney提出了一个大数据的构成定义,这个“三V”定义现在已经得到了广泛认可。“三V”定义使用三个标记来描述什么是大数据 – 不仅是对数据量的描述。
大数据的这三大特点向某些公司提出了挑战,它们需要结构化,可访问而且实惠的方式存储数据。这些挑战使得企业难以正确分析和利用大数据。这对企业来说是一个损失,就其性质而言,大数据通常包含与客户行为有关的有用信息。有了这么多的原始信息,有用的模式可以用来预测未来的客户行为。这只是大数据能带给公司潜力的众多方式之一。幸好新技术和处理数据的方式已经出现,可以满足公司不断增长的妥善存储和利用大数据的需求。一些新颖的技术对于大数据存储和利用很有用。
以上大多数这些技术或多或少都利用了云计算。由于难以处理大数据,云计算成为了使各规模的公司能利用传统被浪费的数据潜力的关键。云计算能提高速度并减少开销,使得小公司也能存储、分析并利用这些数据。
由于计算机和互联网的容量不断提高,越来越多的数据需要以易于分析和访问的方式存储,传统的存储方法无法以高效且经济的方式实现。新的思路、方法和技术正在推动商业用户存储和处理大数据的能力。由于分析和利用非结构化数据的困难,许多企业不使用非结构化数据,随着处理大数据技术的不断发展并大到更高的效率,企业便更容易地利用这些数据。