许多列名具有非ASCII字符和特殊字符 ()、/、+、。(中间无ascii点)等和非ascii空间。在阅读csv时没有发生这种情况。这个是由于一次热编码而发生的。(当我将分类变量转换为数字列时&类别值具有非ascii值)。Col1/name Col 2() name Col3 + name Col4 ^¨ name etc...预期输出
我只想要数字、下划线和列名中的字符(I 只想更改列名,而不是
一些操作通过强制引入NAs,但即使没有NAs,数据集也包含许多NAs。如何确定哪些行或元素引入了NAs。three", rep(NA, times=10)) [1] 1 2 NA NA NA NA NA NA NA NA NA NA NANAsintroduced by coercion
导致将第三个元素强制转换为一个数字。有没有办法确定是第三个元素导致了这种情况,而不是其他NA (非)值