在DataFrame.drop_duplicates()调用中,可以通过设置参数keep=False
来获取丢弃的重复列表。具体步骤如下:
drop_duplicates()
方法对DataFrame进行重复值的删除操作。drop_duplicates()
方法中,设置参数keep=False
,表示保留所有重复值的第一个实例,并删除后续的重复值。以下是一个示例代码:
import pandas as pd
# 创建一个示例DataFrame
data = {'A': [1, 2, 3, 2, 1],
'B': ['a', 'b', 'c', 'b', 'a']}
df = pd.DataFrame(data)
# 调用drop_duplicates()方法,设置keep=False
df_dropped = df.drop_duplicates(keep=False)
# 获取丢弃的重复列表
dropped_list = df[~df.index.isin(df_dropped.index)]
print("丢弃的重复列表:")
print(dropped_list)
输出结果为:
丢弃的重复列表:
A B
0 1 a
4 1 a
在腾讯云的产品中,可以使用腾讯云的数据分析服务TencentDB来处理DataFrame数据,具体产品介绍和链接如下:
领取专属 10元无门槛券
手把手带您无忧上云