我在这个网站上读过一些答案,但它们不提供简单的answers.So,我如何用一个值替换因子变量中的NAs?
a<-c(1,2,3,3,3,3,3,3,2,2,2,2,2,2,1,1,1,1,1,NA,NA,NA,NA,NA,NA)
lv<-c(1,3,2)
lb<-c("a","b","c")
f<-factor(a,levels=lv,labels=lb)
#I want to replace NAs with "b"
如果以小时为单位给出,则duration_minutes列为空(NA),反之亦然。
为此,我尝试了以下命令:
df <- df %>% mutate(duration_recoded = replace(duration_minutes, !is.na(duration_minutes), duration_minutes / 60))
但是,该命令会产生不正确的结果,并显示以下警告消息:
Warning message:
In x[list] <- values :
number of items to replace is not a multiple of rep
我想画一个多面的ggplot2点图。X轴是连续的,Y轴是动物的列表。根据饮食行为绘制了两个变量并对其进行了刻面。
Y轴是自由标度的,因为每种动物只出现在一种饮食行为类别中。
library(ggplot2)
# First clean up the data set:
msleep.noNA <- msleep[!is.na(msleep$vore),]
msleep.noNA.red <- msleep.noNA[c(1,3,6,7)]
msleep.noNA.red <- msleep.noNA.red[!is.na(msleep.noNA.red[4]),]
msl
在我的数据集上使用下面的代码时,我收到了一条错误消息。
rpmodel <- train(Class~.,train, method = "rpart", prox = TRUE)
Something is wrong; all the Accuracy metric values are missing:
Accuracy Kappa
Min. : NA Min. : NA
1st Qu.: NA 1st Qu.: NA
Median : NA Median : NA
Mean :NaN M
readr::parse_factor()是创建因子变量的整齐方式。默认情况下,它设置include_na = TRUE:将为传递给parse_factor()的向量中的NA值创建显式NA级别。使用parse_factor()创建因子变量后,如何访问或过滤这些“显式NA”值? 下面的代码说明了这个问题: library(readr)
xFac <- parse_factor(c("a", "b", NA))
levels(xFac) # NA is a level of xFac
is.na(xFac) # FALSE FA
我正在尝试将日期因子转换为可以由for循环引用的字符向量。for循环应该替换数据帧的"Day“列中的NA值(例如。(如下所示),其值对应于日期。
Date Time Axis1 Day Sum.A1.Daily
1 6/12/10 5:00:00 20 NA NA
2 6/12/10 5:01:00 40 NA NA
3 6/13/10 5:02:00 50 NA NA
4 6/13/10 5:03:00 10 NA NA
5 6/14/10 5:04:00
使用R,我最近感到惊讶的是,当使用一个因子时,sapply的输出。请看以下内容:
> F <- as.factor(c("A", "B", "C", "D", "E", "F"))
> sapply(F, function(x) x)
[1] A B C D E F
Levels: A B C D E F
> sapply(F, function(x) (x=="C"))
[1] FALSE FALSE TRUE FALSE FALSE FALSE
我试图将两个因子类向量(b1 & b2)的计数表/映射到一个更大的数据中。矢量摘要如下:
> summary(b1)
(4,6] (6,8] NA's
16 3 1
> summary(b2)
(4,6] (6,8] NA's
9 0 11
我想把上面的数字映射到一个更大的数据中:
Intervals b1 b2
1 (-Inf,0] NA NA
2 (0,2] NA NA
3 (2,4] NA NA
4 (4,6] NA NA
5 (6,8] NA NA
6