我有一个包含15列的df : df.columns:
0 class
1 name
2 location
3 income
4 edu_level
--
14 marital_status
经过一些转换后,我得到了一个形状为(15,3)的numpy.ndarray
,名为loads
0.52 0.33 0.09
0.20 0.53 0.23
0.60 0.28 0.23
0.13 0.45 0.41
0.49 0.9
so on so on so on
因此,3列有15个值。
我需要做的:
我想从loads
的第一列获得比.50更大的值的.50名称。
对于这个示例,与值大于0.5的loads
的第一列相关的df列应该返回:
0 Class
2 Location
对于loads
的第二列,应该返回:
1 name
3 income
4 edu_level
与loads
第三列的逻辑相同。
我设法得到了数字loads
,他们的方式,我需要它,但我有一个不好的时间在这最后一部分。我知道我可以简单地手动选择列,但是当df有超过15个特性时,这将是一项艰巨的任务。
有人能帮我吗?
发布于 2022-03-23 11:35:41
给定阈值,您可以创建一个布尔数组来筛选df.columns:
threshold = .5
for j in range(loads.shape[1]):
print(df.columms[loads[:,j]>threshold])
https://stackoverflow.com/questions/71592709
复制相似问题