我需要分析一个数据集,其中包含80多个行业的各个行业的企业。具体地说,我需要一个for循环或def函数,我可以用它为所有行业总结以下步骤,以获得一个很好的简短代码:
HighTech = data.loc[data['MacrIndustry'] == "High Technology", ['Value']]最好,我希望将关于其行业的企业分离到一个具有其价值的独立DataFrame中。
发布于 2021-11-24 19:29:07
使用DataFrame.groupby。下面将为您提供一个字典,它的键都是MacrIndustry唯一值,值是相应行业组的Value列(作为DataFrame)。
groups = {industry: df[['Value']] for industry, df in data.groupby('MacrIndustry')}
# or just (less readable)
# groups = dict(iter(data.groupby('MacrIndustry')[['Value']]))根据您的示例HighTech = groups['High Technology']。
https://stackoverflow.com/questions/70101697
复制相似问题