如何在DataFrame中设置K个随机列值为空？

在DataFrame中设置K个随机列值为空的方法如下：

首先，导入所需的库和模块。在Python中，可以使用pandas库来操作DataFrame，使用numpy库来生成随机数。

import pandas as pd
import numpy as np

创建一个DataFrame对象。可以使用pandas的DataFrame()函数，并指定列名和初始数据。

data = {'col1': [1, 2, 3, 4, 5],
        'col2': [6, 7, 8, 9, 10],
        'col3': [11, 12, 13, 14, 15]}
df = pd.DataFrame(data)

设置随机列为空。使用numpy的random.choice()函数从指定的列中选择K个随机列，并将它们的值设置为NaN（空值）。

K = 2  # 设置K的值为2，表示选择2个随机列
columns = df.columns  # 获取所有列名
random_columns = np.random.choice(columns, K, replace=False)  # 随机选择K个列名
df[random_columns] = np.nan  # 将随机选择的列的值设置为NaN

打印结果。使用print()函数打印结果。

print(df)

完整代码如下：

import pandas as pd
import numpy as np

data = {'col1': [1, 2, 3, 4, 5],
        'col2': [6, 7, 8, 9, 10],
        'col3': [11, 12, 13, 14, 15]}
df = pd.DataFrame(data)

K = 2  # 设置K的值为2，表示选择2个随机列
columns = df.columns  # 获取所有列名
random_columns = np.random.choice(columns, K, replace=False)  # 随机选择K个列名
df[random_columns] = np.nan  # 将随机选择的列的值设置为NaN

print(df)

以上代码将在DataFrame中随机选择2个列，并将它们的值设置为空。可以根据实际需求修改K的值和DataFrame的列名和数据。