Harry 1 1Dave Steve 3 1
我正在尝试根据球员的名字在胜利者或失败者列中的出现情况来建立一个运行计数,以统计球员参加了多少场比赛(例如,上面的Dave有一个3的运行计数,因为他参加了每一场比赛)。我刚接触pandas,已经尝试过cumcount和groupby的一些组合,但我不确定是否只需要手动
我的目标是接受一个DataFrame对象并将多个列附加到其中,其中这些列是由组计算的,但是这些计算不能直观地向量化(它们涉及到if语句的累积和)。data.table(按组拆分)并返回两个长度与组的数组相等的列表。在本例中,赋值:=的副作用将两个新列newcol1和newcol2附加到原始的data.table DT中。下面是我的初始df:
im
我在pandas中有一个表,每个datetime都有重复的I。我有一行Cumulative Sum items,我想创建一个新列,用于标识每个ID何时满足某个阈值。在这里,我有ID,并且我正在查找Cumulative Sum列何时达到6。有时,ID的Cumulative Sum是8,但这是达到最小计数6的行。一旦达到6,我希望每个ID的下一个累积和,如果有,是假的。例如,一旦达到6,如果ID有另一行的</em