在R中,可以使用sample()
函数从变量的每个级别中抽取相等数量的单元。sample()
函数可以从给定的向量中随机抽取指定数量的元素。
下面是一个示例代码,演示如何从R中变量的每个级别中抽取相等数量的单元:
# 创建一个示例数据框
data <- data.frame(
var1 = c("A", "A", "B", "B", "C", "C"), # 变量的每个级别
var2 = 1:6 # 其他变量
)
# 计算每个级别的数量
level_counts <- table(data$var1)
# 计算每个级别应该抽取的数量
sample_size <- min(level_counts)
# 从每个级别中抽取相等数量的单元
sampled_data <- data[unlist(lapply(unique(data$var1), function(x) sample(which(data$var1 == x), sample_size))), ]
# 打印抽取的结果
print(sampled_data)
在上面的代码中,首先创建了一个示例数据框data
,其中包含一个变量var1
的不同级别。然后使用table()
函数计算了每个级别的数量,并将其存储在level_counts
中。接下来,计算了每个级别应该抽取的数量,即所有级别中最小的数量,存储在sample_size
中。
最后,使用lapply()
函数和sample()
函数从每个级别中抽取相等数量的单元。lapply()
函数用于遍历每个级别,sample()
函数用于从每个级别中随机抽取指定数量的单元。最后,使用unlist()
函数和which()
函数将抽取的单元的索引转换为逻辑向量,并使用该逻辑向量从原始数据框中选择对应的行。
请注意,上述代码仅适用于每个级别的数量相等的情况。如果每个级别的数量不相等,可以根据具体需求进行调整。
腾讯云相关产品和产品介绍链接地址:
请注意,以上产品仅作为示例,具体选择和推荐的产品应根据实际需求和情况进行评估。
腾讯技术开放日
云+社区技术沙龙第33期
腾讯云GAME-TECH游戏开发者技术沙龙
腾讯技术创作特训营第二季第3期
中小企业数字化升级之 提效篇
云+社区技术沙龙[第16期]
TVP技术闭门会
腾讯技术创作特训营第二季
T-Day
云+社区技术沙龙[第9期]
第四期Techo TVP开发者峰会
云+社区技术沙龙[第21期]
领取专属 10元无门槛券
手把手带您无忧上云