要保留所选列的唯一值的行,可以使用pandas库中的drop_duplicates()方法。该方法可以根据指定的列名或列索引来删除DataFrame中的重复行。
下面是一个示例代码:
import pandas as pd
# 创建示例DataFrame
data = {'selected': [1, 2, 3, 2, 4, 3],
'col1': ['A', 'B', 'C', 'D', 'E', 'F'],
'col2': ['X', 'Y', 'Z', 'X', 'Y', 'Z']}
df = pd.DataFrame(data)
# 保留所选列的唯一值的行
unique_rows = df.drop_duplicates(subset='selected')
# 打印结果
print(unique_rows)
输出结果为:
selected col1 col2
0 1 A X
1 2 B Y
2 3 C Z
4 4 E Y
在上述示例中,我们使用了drop_duplicates()
方法,并通过subset
参数指定了要保留唯一值的列名为selected
。最后,将结果赋值给unique_rows
变量,并打印出来。
对于这个问题,腾讯云没有特定的产品或链接地址与之相关。
领取专属 10元无门槛券
手把手带您无忧上云