缘起
所有缺失值,是命里该有,现实无。当样本量足够大,缺失值可以忽略不参与分析。现在众多软件还可以进行缺失值的分析。然而今天松哥和大家分享一个后台咨询的灵异现象。
一个SPSS使用者说,他的数据超级规整,一个缺失值都没有,可是软件频频告诉他,数据存在大量的缺失值,这到底是啥个原因呢?
原因探索
其实这个问题以前也有人问过,但不像这个人说的那么离奇。其实原因非常简单,就是你SPSS操作的时候,鼠标操作失误,而让软件产生了一些缺失值。
松哥模拟一下展示给大家看。比如这里录入8条记录。
松哥进行频率分析一下,结果如下,可见表中缺失数据有3个,而我们录入的数据是根本没有缺失值的哦,到底咋了呢!
问题在这里
我们在回到原始数据库,细心的你会发现似乎有一点点异样。虽然是8条记录,可是下面的9-10-11条记录,里面的空格里面有一个黑点,而这个黑点就是SPSS重点缺失值的表达方式。
为什么会出现这样的情况呢,就是大家在录入数据的时候,不小心在后面的单元格录入了数据,然后发现录入错了,把录入的数据删除了,但是忘记删除缺失值。
比如录完上述8条,松哥不小心在12条记录录了个数据,然后SPSS会自动把9-11三行用缺失值填满。然后松哥发现第12条录错,然后删除12条,可是9-11条缺失值依然存在。这就是这种缺失值产生的原因。
SPSS实战系列[2]
【赠人玫瑰,手留余香】
----------------------------------------------
领取专属 10元无门槛券
私享最新 技术干货