在pandas中,可以使用条件筛选或者使用.loc方法来为多个连续列上的相同值设置子集。
条件筛选方法:
示例代码:
import pandas as pd
# 创建示例DataFrame
data = {'A': [1, 2, 3, 4, 5],
'B': [1, 1, 2, 2, 3],
'C': [1, 1, 1, 2, 2]}
df = pd.DataFrame(data)
# 设置条件筛选
subset = df[(df['A'] == df['B']) & (df['B'] == df['C'])]
print(subset)
.loc方法:
示例代码:
import pandas as pd
# 创建示例DataFrame
data = {'A': [1, 2, 3, 4, 5],
'B': [1, 1, 2, 2, 3],
'C': [1, 1, 1, 2, 2]}
df = pd.DataFrame(data)
# 设置条件筛选
subset = df.loc[(df['A'] == df['B']) & (df['B'] == df['C']), ['A', 'B', 'C']]
print(subset)
以上两种方法都可以根据多个连续列上的相同值设置pandas DataFrame的子集。这些方法可以用于数据筛选、数据分析、数据处理等场景。
腾讯云相关产品推荐:
领取专属 10元无门槛券
手把手带您无忧上云