在pandas中,可以使用groupby
函数进行聚合操作,并通过agg
函数指定聚合函数。当创建set时,可以通过set
函数来忽略NaT
值。
具体步骤如下:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3, 4, pd.NaT], 'B': [5, 6, pd.NaT, 8, 9]})
groupby
函数按照某一列进行分组:grouped = df.groupby('A')
agg
函数指定聚合函数,并在其中使用set
函数来创建set并忽略NaT
值:result = grouped.agg({'B': lambda x: set(x.dropna())})
这样,result
中的每个分组的B
列将被聚合为一个set,并且忽略了NaT
值。
关于pandas的更多信息和使用方法,可以参考腾讯云的产品介绍链接地址:腾讯云-数据分析与AI-数据处理与分析-Pandas
领取专属 10元无门槛券
手把手带您无忧上云