在R中,可以使用函数duplicated()
来判断数据框中的重复行。为了只保留重复行,可以使用该函数的结果作为索引,将其传递给数据框,从而筛选出重复的行。
以下是一个示例代码:
# 创建一个示例数据框
df <- data.frame(
ID = c(1, 2, 3, 4, 2, 3, 5),
Name = c("John", "Jane", "Tom", "Alice", "Jane", "Tom", "Bob")
)
# 判断重复行
duplicated_rows <- duplicated(df)
# 保留重复的行
duplicate_df <- df[duplicated_rows, ]
这里,duplicated()
函数返回一个逻辑向量,表示数据框中每一行是否是重复行。然后,通过将该逻辑向量传递给数据框df
作为索引,可以筛选出重复的行并存储在duplicate_df
中。
对于该问题,推荐使用腾讯云的云计算服务,腾讯云提供了丰富的云产品和解决方案,可以满足各种云计算需求。您可以访问腾讯云官方网站(https://cloud.tencent.com/)了解更多关于腾讯云的信息。
领取专属 10元无门槛券
手把手带您无忧上云