我正在用通常的pd.read_csv将csv文件读入pandas。这一切都很好。但是,我的大多数csv文件的末尾都有一行,该行的第一个列值为"#EOD“,表示该表的最后一行。在此之后可能会有更多的行包含所有的"nan“值。2 C3 A 0.3 74 #EOD None nan nan
5 * None nan nan 在csv中</
我有一个相当大的Pandas (3000万行),我需要一遍又一遍地切分,所以性能至关重要。切片需要对一列的值和另一列中的值列表进行。np.random.randint(1,1000,150) # A list of values
idx = pd.IndexSlice
%timeit df.loc[idx[index_a, list(