这是在Linux中,Python3.8。我使用ProcessPoolExecutor来加快大型数据文件列表的处理速度,但是由于它们都在每个进程中被复制,所以内存不足。我该如何解决这个问题?我的代码如下所示: # do some work on a single pandas DataFrame
# dfs is a
我正在尝试使用pandas和matplotlib为两种类型的变量绘制比较条图,并从python中的csv文件中对它们进行计数。每种类型的变量数据都存储在不同的目录中。我为不同的数据和concate数据创建了两个循环,并绘制它们,但是在循环和附加数据方面存在一个问题。sorted(glob.glob(os.path.join(path, "*table.csv")))
# loop through the files and re
我在pandas中运行了一个很长的ETL管道。我必须创建不同的pandas数据帧,并且我想为一些数据帧释放内存。我一直在阅读如何释放内存,我发现运行此命令不会释放内存: del dataframe 下面是这个链接:How to delete multiple pandas (python) dataframes,我需要将它放在一个列表中,然后删除一个列表,如下所示: lst = [pd.DataFrame()]
de