我正在使用R。我有一个同时包含字符和数字变量的数据集-我正在尝试将此数据中的所有NA和空值替换为"0“。最近,我学会了如何将因子变量中的"NA“值替换为0 (R: replacing within factor variables as 0): # "df" is the dataset, "a" is"a" variable#R
我正在使用apriori函数执行数据挖掘过程。此函数仅适用于分类数据,没有值,但仅适用于文本。我的数据集满足了这些要求,因为我有五个类别变量,没有数值,只有文本(因此变量‘性别’被分类为‘女性’和‘男性’)apriori(data) column(s) 1, 2, 3, 4, 5 not logical or a factor.Use as.<e
我试图编写一个函数,它将查看数据框架中的所有因素变量,并将所有级别组合在一起,但只有当一个级别包含较少的观测值时,才能达到一定的百分比/阈值。到目前为止,我有一个作用于单个变量的函数,但我试图将该函数应用于数据框架中的所有因素。当我尝试将它应用于所有的因素变量时,我会得到一个错误。# Code to create data frame (df)
var <- factor(c(a <- rep("a&q