我需要用于我的PandasDataFrame的键行索引,其中key是PandasDataFrame的id列,data是行数据。iterrows这样做:for pair_id, data in df.iterrows():然而,对于非常多的行有没有更快的方法来为Pandas创建稀疏的密钥行索引,这样任意访问任何行的速度就会更快吗?更好的是,如果指数稀少,数据是从</em
到目前为止,我已经做了以下工作,我认为这可能是工作,但我不知道如何将X_res, y_res转换为DataFrame。random_state=seed, sampling_strategy=1.0).fit_resample(X, y)
// Do something with X_res and y_res to get a DataFrame
我有一个作为PandasDataFrame读入的.csv文件。然后,我尝试将其转换为dask dataframe,但这会导致错误'Index' object has no attribute 'is_monotonic_increasing'。import pandas as pddf = pd.read_csv('s3://my-bucket/data.csv