在DataFrame中设置K个随机列值为空的方法如下:
import pandas as pd
import numpy as np
data = {'col1': [1, 2, 3, 4, 5],
'col2': [6, 7, 8, 9, 10],
'col3': [11, 12, 13, 14, 15]}
df = pd.DataFrame(data)
K = 2 # 设置K的值为2,表示选择2个随机列
columns = df.columns # 获取所有列名
random_columns = np.random.choice(columns, K, replace=False) # 随机选择K个列名
df[random_columns] = np.nan # 将随机选择的列的值设置为NaN
print(df)
完整代码如下:
import pandas as pd
import numpy as np
data = {'col1': [1, 2, 3, 4, 5],
'col2': [6, 7, 8, 9, 10],
'col3': [11, 12, 13, 14, 15]}
df = pd.DataFrame(data)
K = 2 # 设置K的值为2,表示选择2个随机列
columns = df.columns # 获取所有列名
random_columns = np.random.choice(columns, K, replace=False) # 随机选择K个列名
df[random_columns] = np.nan # 将随机选择的列的值设置为NaN
print(df)
以上代码将在DataFrame中随机选择2个列,并将它们的值设置为空。可以根据实际需求修改K的值和DataFrame的列名和数据。
领取专属 10元无门槛券
手把手带您无忧上云