我需要合并数据,从1000 s的excel文件,由不同的业务经理提供的生产力和其他报告。excel文件具有数据的相似性,但是由于是不同的管理器和不同的客户端,所以头文件都是自定义的。
例如,管理器A将具有a.xlx,管理器b将具有a.xlx,但是每个管理器的头将不同,尽管内部的数据通常是相同的。每天,所有团队成员都会通过新的文件更新100个不同的excel文件,例如a_todays_date.xlx和使用/a.xlx的管理器b。
这是可以通过python ML库处理的东西吗?
合并所有这些数据并在每天的基础上保存到DB的最佳方法是什么。平均每天的数据将在15 be左右。最终目标是创建仪表板。
发布于 2017-07-12 05:32:05
我建议SSIS ()。它用于处理来自不同来源的数据并导出到数据库。您可以设计一个简单的数据流,并按计划从serevr运行它(在您的情况下每天运行)。
https://datascience.stackexchange.com/questions/20349
复制相似问题