我需要重新排序一个csv文件,该文件通过从0
到184000
的id列对数据进行分组。
不幸的是它的0,0,0,0,0,1,1,1,1,1,2,2,2,2,2,3,3,3,3,3
等等..。我需要1, 2, 3, 1, 2, 3, 1, 2, 3
等等。
0, 1, 2, 3
等的第一个实例,制作第一个系列,第二个实例,0, 1, 2, 3
,下一个等等。
有人建议使用Python和Pandas,但我想不出这一点。
我可以读取csv,列出列和行的数据,但是找不到根据我的需求对其进行排序的方法。
我一直在看pandas.Series
,但我觉得我的术语搞错了.
那么两件事,它是什么叫我想做的事情,谁知道我可以使用哪种排序方法?
干杯,
克里斯
发布于 2020-11-15 09:06:16
您可以根据所属的组向每个实例添加秩,然后按秩和组对其进行排序。
df = pd.DataFrame({"group": [0,0,0,0,0,1,1,1,1,1,2,2,2,2,2,3,3,3,3,3]})
df['rank'] = df.groupby('group').apply(lambda x: x.rank(method='first'))
df.sort_values(['rank', 'group'])
**最新情况**
以下是你可以使用的评论-
df['rank'] = df.groupby('group').rank(method='first')
https://stackoverflow.com/questions/64842676
复制相似问题