对于数据框列,可以使用以下步骤将所有非正规值替换为"NaN":
import pandas as pd
import numpy as np
df = pd.read_csv("data.csv")
df.replace(['', 'NA', 'null', 'N/A', 'NaN', 'None'], np.nan, inplace=True)
df.replace(r'^\s*$', np.nan, regex=True, inplace=True)
print(df.isnull().sum())
这样,所有非正规值都将被替换为"NaN"。这种处理方式适用于数据清洗、数据预处理等场景。
腾讯云相关产品和产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云