为此,我使用滚动窗口将最后t点作为时间序列使用。每个功能都是一个频道,所以我有一个多个时间序列集。数据需要在三维n_samples,window_size,特性。我的问题是,我创建3D张量的方式使我的计算机崩溃,因为我有近500 K行。这是我正在使用的代码。features_tensor,(n_samples,window_size,n_features)) ## This break my computer
问题是,当我使用np.concatenate将我创建的所有单
我有一个每日数据索引pd.DataFrame,我想使用一个日历年来计算滚动总和,但这会导致错误ValueError: window must be an integer。import pandas as pd
dfo = dfo.rolling('1Y').sum() 导致错误:ValueError:
我有一个数据帧,我希望在滑动时间窗口内识别(并最终删除)重复的行。False5 apple red 2021-03-01 12:11:00 False 在本例中,我的目标是当'type‘和'attr’等于2分钟内出现的另一行时,将一行标记为重复行。所以我想将索引2标记为is_dup=True,因为它匹配索引0并且在2分钟的时间范围内,但不是第5行