数据格式作为输入,下面是我正在做的工作,以便将Spark数据格式转换为Pandas数据格式。def prediction_func(spark_df):
# Lines of code to convert spark df to pandasdf return pandas_df
predictio
我在pandas数据帧中有一个索引,它重复索引值。我想作为多索引重新索引,其中重复索引被分组。 索引看起来像这样: ? 所以我希望所有的112335586个索引值都归入相同的in索引下。我已经看过这个问题了,Create pandas dataframe by repeating one row with new multiindex,但是这里的值可以是索引,可以是预定义的,但这是不可能的,