在pandas中,可以使用sample()
方法对数据帧进行采样。要从组1中选择X行,从group2中选择Y行,可以使用concat()
方法将两个组合并,然后再使用sample()
方法进行采样。
以下是一个示例代码:
import pandas as pd
# 创建组1的数据帧
group1 = pd.DataFrame({'A': [1, 2, 3, 4, 5],
'B': ['a', 'b', 'c', 'd', 'e']})
# 创建组2的数据帧
group2 = pd.DataFrame({'A': [6, 7, 8, 9, 10],
'B': ['f', 'g', 'h', 'i', 'j']})
# 将两个组合并
combined = pd.concat([group1, group2])
# 从组1中选择X行,从组2中选择Y行进行采样
sampled_data = combined.sample(n=X, weights=[1 if i < len(group1) else 0 for i in range(len(combined))], replace=False)
# 打印采样结果
print(sampled_data)
在上述代码中,X
和Y
分别表示要选择的行数。concat()
方法将组1和组2按行合并为一个数据帧combined
。sample()
方法根据指定的行数和权重进行采样,其中权重的设置使得只有组1的行被选择。最后,打印出采样结果sampled_data
。
请注意,这只是一个示例代码,你可以根据实际需求进行修改和调整。另外,腾讯云提供了云计算相关的产品和服务,你可以参考腾讯云官方文档来了解更多详情和推荐的产品。
领取专属 10元无门槛券
手把手带您无忧上云