手上有几十个excel文件,内容都放在Sheet1表单中(幸甚~),它们的表头都是一样的,就是数据不一样,想要将这些excel的内容合并到一起。
觉得原文python代码稍微有点复杂,改写了一下,貌似简洁了一点。代码如下:
最关键的其实就是第12行,采用generator得到了待处理excel文件的文件名List对象。
适用条件:
1)xls和xlsx格式的excel文件均可处理;
2)所有excel文件均放在一个文件夹下;
3)所有excel文件的数据都放在表单Sheet1中;
4)所有表单的第一行均为表头,不是数据。
使用方法:
1)新建一个文件,文件名为:join_excel_sheets.py;
2)输入上图中的代码;
3)将文件join_excel_sheets.py放到所有excel文件所在的文件夹下,解释执行
即可;
4)合并后的数据存放在文件“out.xlsx”中,这也即是要求待合并的excel文件名
不能是out.xlsx。
这里只是数据的合并,如果是融合,则需要采用pandas的merge方法。
如果数据不是放在表单Sheet1中,如果数据格式不统一,如果……。如果一点规律都没有,或者规律太复杂,那就很悲催了,只能手工操作了。所以说话要一贯,做事要一贯,做人要一贯~
注:代码直接粘贴到文本编辑空间,格式上太难看,所以截了图片,无他。
领取专属 10元无门槛券
私享最新 技术干货