在数据分析过程中,经常需要处理包含NaN(Not a Number,非数字)值的数据。如果你想删除包含NaN值的重复行并保留没有NaN值的行,可以使用Python中的pandas库来实现。以下是一个示例代码:
import pandas as pd
import numpy as np
# 创建一个示例DataFrame
data = {
'A': [1, 2, 2, np.nan, 4],
'B': [5, 6, 6, np.nan, 8]
}
df = pd.DataFrame(data)
# 删除包含NaN值的重复行
df_cleaned = df.dropna().drop_duplicates()
print(df_cleaned)
dropna()
方法删除包含NaN值的行。drop_duplicates()
方法删除重复行。 A B
0 1.0 5.0
1 2.0 6.0
4 4.0 8.0
通过这种方式,你可以有效地删除包含NaN值的重复行并保留没有NaN值的行。
领取专属 10元无门槛券
手把手带您无忧上云