我有一个很大的CSV文件,比如INPUT,其中包含大约500+列。我还有一个dataframe DF,它包含INPUT列标题的子集,它在每次迭代时都会更改。
我必须只从dataframe DF中存在的那些输入列中获取数据,并将其写入另一个CSV文件,例如输出。
总之,
INPUT.csv:
ID,Col_A,Col_B,Col_C,Col_D,Col_E,Col_F,,,,,,,,,,,,,Col_S,,,,,,,,,,,,,,,,Col_Z
1,009,abcd,67,xvz,33,50,,,,,,,,,,,,,,,,,,,,,,,,,,,,oup,,,,,,,,,,,,,,,,,,90
2