,可以使用以下代码:
# 导入必要的库
library(dplyr)
# 创建一个示例数据框
df <- data.frame(ID = c(1, 2, 3, 3, 4, 5))
# 创建虚拟变量is_duplicate,用于指示ID是否重复
df <- df %>%
group_by(ID) %>%
mutate(is_duplicate = ifelse(n() > 1, "重复", "不重复"))
# 查看结果
df
上述代码使用了dplyr
库中的group_by
和mutate
函数。首先,我们将数据框按照ID进行分组,然后使用mutate
函数创建一个新的变量is_duplicate
。ifelse
函数根据每个分组中的观测数量判断ID是否重复,如果数量大于1,则表示重复,否则表示不重复。
这样,我们就成功地创建了一个虚拟变量,用于指示ID随后是否重复。
领取专属 10元无门槛券
手把手带您无忧上云