柳林河秋色。摄影地点:柳林河。
大数据的“经验”和“超验”
大数据是经验的。
所谓经验的,指的是所有的数据是“人”的数据,如果数据不是人的数据,对人类是没有意义的。
所谓“人的数据”,一方面是“人”形成的数据,其次,是进入人们视野的数据。
所谓人的数据,指的人的活动形成的数据,人开车形成的数据,人购物形成的数据,人不行在监控系统形成的数据。人形成的数据,肯定是经验的。
其次是“进入人的视野的数据”,数据进入人们的视野,我们才能认识这些数据。所谓进入们的视野,指的是人们能够认识到数据,比如,我们周围环境中日月星辰或者自然万物。这些东西,我们可以看到它,可以说触摸它等等。
这有这样的数据,才对我们有意义。
除此之外的数据,不在人类的认识范围之内,因此,我们无法认识他们,对我们就没有意义。
王阳明说,你看此花时,则此花马上鲜明起来,你不看此花时,则此花沉于寂,可见此花不在你心外。
如果某个事物不在你的人是否范围之内,说它存在或者不存在是没有意义的。
就是因为大数据是经验的,我们才能理解它,否则就无法理解它。
比如,摆在我们面前的数据是,一条交易记录。
因为,它是经验的,因此,根据这条记录,我们能够“重建”或者“刻画”这条数据的形成过程。
大数据是超验的。
所谓超验的,是指大数据来源于经验,但是超越经验。
比如,一条数据不说明问题,两条数据也可能不说明问题,将相互关联的数据放到一块儿,则说明了问题。
相关的数据,表明了他们的相关关系。也就是是什么的问题
但是,将相关的数据放到一起,则揭示了因果关系。也就是为什么的问题。
比如,某地发生一起凶杀案。被害人在家中被杀,在郊外的水库被抛尸。
调取的数据是,某甲进入别害人家中,并且在水库附近出现过。
进入被害人的家中,是偶然的。
在水库附近出现过,也是偶然的。
但是,既进入被害人家中,也在水库附近出现,则不是偶然的。
这两条数据放到一起,给我们的印象是:某甲又重大作案嫌疑。
“某甲有重大作案嫌疑”,则是一个超验的判断。回答了“为什么”的问题。
领取专属 10元无门槛券
私享最新 技术干货