在Dataframe中删除冲突的行可以通过以下步骤实现:
示例代码:
import pandas as pd
# 创建一个示例Dataframe
data = {'ID': ['1', '1', '2', '3', '4', '4'],
'Name': ['Alice', 'Alice', 'Bob', 'Charlie', 'David', 'David'],
'Age': [25, 25, 30, 35, 40, 40]}
df = pd.DataFrame(data)
# 指定ID列为唯一标识列,删除冲突的行
df_unique = df.drop_duplicates(subset='ID')
print(df_unique)
输出结果:
ID Name Age
0 1 Alice 25
2 2 Bob 30
3 3 Charlie 35
4 4 David 40
在上述示例中,我们通过指定ID列为唯一标识列,使用drop_duplicates()方法删除了冲突的行。最终得到了一个不含冲突行的新Dataframe。
对于Dataframe中的其他列,如果存在不同取值的冲突行,可以根据具体业务需求选择保留哪个取值或进行其他操作。
领取专属 10元无门槛券
手把手带您无忧上云